]> git.lizzy.rs Git - rust.git/blob - src/librustdoc/doctest.rs
cleanup librustdoc by making parent stack store items
[rust.git] / src / librustdoc / doctest.rs
1 use rustc_ast as ast;
2 use rustc_data_structures::fx::{FxHashMap, FxHashSet};
3 use rustc_data_structures::sync::Lrc;
4 use rustc_errors::{ColorConfig, ErrorGuaranteed, FatalError};
5 use rustc_hir as hir;
6 use rustc_hir::def_id::LOCAL_CRATE;
7 use rustc_hir::intravisit;
8 use rustc_hir::{HirId, CRATE_HIR_ID};
9 use rustc_interface::interface;
10 use rustc_middle::hir::map::Map;
11 use rustc_middle::hir::nested_filter;
12 use rustc_middle::ty::TyCtxt;
13 use rustc_parse::maybe_new_parser_from_source_str;
14 use rustc_parse::parser::attr::InnerAttrPolicy;
15 use rustc_session::config::{self, CrateType, ErrorOutputType};
16 use rustc_session::parse::ParseSess;
17 use rustc_session::{lint, DiagnosticOutput, Session};
18 use rustc_span::edition::Edition;
19 use rustc_span::source_map::SourceMap;
20 use rustc_span::symbol::sym;
21 use rustc_span::Symbol;
22 use rustc_span::{BytePos, FileName, Pos, Span, DUMMY_SP};
23 use rustc_target::spec::TargetTriple;
24 use tempfile::Builder as TempFileBuilder;
25
26 use std::env;
27 use std::io::{self, Write};
28 use std::panic;
29 use std::path::PathBuf;
30 use std::process::{self, Command, Stdio};
31 use std::str;
32 use std::sync::atomic::{AtomicUsize, Ordering};
33 use std::sync::{Arc, Mutex};
34
35 use crate::clean::{types::AttributesExt, Attributes};
36 use crate::config::Options as RustdocOptions;
37 use crate::html::markdown::{self, ErrorCodes, Ignore, LangString};
38 use crate::lint::init_lints;
39 use crate::passes::span_of_attrs;
40
41 /// Options that apply to all doctests in a crate or Markdown file (for `rustdoc foo.md`).
42 #[derive(Clone, Default)]
43 pub(crate) struct GlobalTestOptions {
44     /// Whether to disable the default `extern crate my_crate;` when creating doctests.
45     pub(crate) no_crate_inject: bool,
46     /// Additional crate-level attributes to add to doctests.
47     pub(crate) attrs: Vec<String>,
48 }
49
50 pub(crate) fn run(options: RustdocOptions) -> Result<(), ErrorGuaranteed> {
51     let input = config::Input::File(options.input.clone());
52
53     let invalid_codeblock_attributes_name = crate::lint::INVALID_CODEBLOCK_ATTRIBUTES.name;
54
55     // See core::create_config for what's going on here.
56     let allowed_lints = vec![
57         invalid_codeblock_attributes_name.to_owned(),
58         lint::builtin::UNKNOWN_LINTS.name.to_owned(),
59         lint::builtin::RENAMED_AND_REMOVED_LINTS.name.to_owned(),
60     ];
61
62     let (lint_opts, lint_caps) = init_lints(allowed_lints, options.lint_opts.clone(), |lint| {
63         if lint.name == invalid_codeblock_attributes_name {
64             None
65         } else {
66             Some((lint.name_lower(), lint::Allow))
67         }
68     });
69
70     debug!(?lint_opts);
71
72     let crate_types =
73         if options.proc_macro_crate { vec![CrateType::ProcMacro] } else { vec![CrateType::Rlib] };
74
75     let sessopts = config::Options {
76         maybe_sysroot: options.maybe_sysroot.clone(),
77         search_paths: options.libs.clone(),
78         crate_types,
79         lint_opts,
80         lint_cap: Some(options.lint_cap.unwrap_or(lint::Forbid)),
81         cg: options.codegen_options.clone(),
82         externs: options.externs.clone(),
83         unstable_features: options.render_options.unstable_features,
84         actually_rustdoc: true,
85         edition: options.edition,
86         target_triple: options.target.clone(),
87         crate_name: options.crate_name.clone(),
88         ..config::Options::default()
89     };
90
91     let mut cfgs = options.cfgs.clone();
92     cfgs.push("doc".to_owned());
93     cfgs.push("doctest".to_owned());
94     let config = interface::Config {
95         opts: sessopts,
96         crate_cfg: interface::parse_cfgspecs(cfgs),
97         crate_check_cfg: interface::parse_check_cfg(options.check_cfgs.clone()),
98         input,
99         input_path: None,
100         output_file: None,
101         output_dir: None,
102         file_loader: None,
103         diagnostic_output: DiagnosticOutput::Default,
104         lint_caps,
105         parse_sess_created: None,
106         register_lints: Some(box crate::lint::register_lints),
107         override_queries: None,
108         make_codegen_backend: None,
109         registry: rustc_driver::diagnostics_registry(),
110     };
111
112     let test_args = options.test_args.clone();
113     let nocapture = options.nocapture;
114     let externs = options.externs.clone();
115     let json_unused_externs = options.json_unused_externs;
116
117     let (tests, unused_extern_reports, compiling_test_count) =
118         interface::run_compiler(config, |compiler| {
119             compiler.enter(|queries| {
120                 let mut global_ctxt = queries.global_ctxt()?.take();
121
122                 let collector = global_ctxt.enter(|tcx| {
123                     let crate_attrs = tcx.hir().attrs(CRATE_HIR_ID);
124
125                     let opts = scrape_test_config(crate_attrs);
126                     let enable_per_target_ignores = options.enable_per_target_ignores;
127                     let mut collector = Collector::new(
128                         tcx.crate_name(LOCAL_CRATE),
129                         options,
130                         false,
131                         opts,
132                         Some(compiler.session().parse_sess.clone_source_map()),
133                         None,
134                         enable_per_target_ignores,
135                     );
136
137                     let mut hir_collector = HirCollector {
138                         sess: compiler.session(),
139                         collector: &mut collector,
140                         map: tcx.hir(),
141                         codes: ErrorCodes::from(
142                             compiler.session().opts.unstable_features.is_nightly_build(),
143                         ),
144                         tcx,
145                     };
146                     hir_collector.visit_testable(
147                         "".to_string(),
148                         CRATE_HIR_ID,
149                         tcx.hir().span(CRATE_HIR_ID),
150                         |this| tcx.hir().walk_toplevel_module(this),
151                     );
152
153                     collector
154                 });
155                 if compiler.session().diagnostic().has_errors_or_lint_errors().is_some() {
156                     FatalError.raise();
157                 }
158
159                 let unused_extern_reports = collector.unused_extern_reports.clone();
160                 let compiling_test_count = collector.compiling_test_count.load(Ordering::SeqCst);
161                 let ret: Result<_, ErrorGuaranteed> =
162                     Ok((collector.tests, unused_extern_reports, compiling_test_count));
163                 ret
164             })
165         })?;
166
167     run_tests(test_args, nocapture, tests);
168
169     // Collect and warn about unused externs, but only if we've gotten
170     // reports for each doctest
171     if json_unused_externs.is_enabled() {
172         let unused_extern_reports: Vec<_> =
173             std::mem::take(&mut unused_extern_reports.lock().unwrap());
174         if unused_extern_reports.len() == compiling_test_count {
175             let extern_names = externs.iter().map(|(name, _)| name).collect::<FxHashSet<&String>>();
176             let mut unused_extern_names = unused_extern_reports
177                 .iter()
178                 .map(|uexts| uexts.unused_extern_names.iter().collect::<FxHashSet<&String>>())
179                 .fold(extern_names, |uextsa, uextsb| {
180                     uextsa.intersection(&uextsb).copied().collect::<FxHashSet<&String>>()
181                 })
182                 .iter()
183                 .map(|v| (*v).clone())
184                 .collect::<Vec<String>>();
185             unused_extern_names.sort();
186             // Take the most severe lint level
187             let lint_level = unused_extern_reports
188                 .iter()
189                 .map(|uexts| uexts.lint_level.as_str())
190                 .max_by_key(|v| match *v {
191                     "warn" => 1,
192                     "deny" => 2,
193                     "forbid" => 3,
194                     // The allow lint level is not expected,
195                     // as if allow is specified, no message
196                     // is to be emitted.
197                     v => unreachable!("Invalid lint level '{}'", v),
198                 })
199                 .unwrap_or("warn")
200                 .to_string();
201             let uext = UnusedExterns { lint_level, unused_extern_names };
202             let unused_extern_json = serde_json::to_string(&uext).unwrap();
203             eprintln!("{unused_extern_json}");
204         }
205     }
206
207     Ok(())
208 }
209
210 pub(crate) fn run_tests(
211     mut test_args: Vec<String>,
212     nocapture: bool,
213     tests: Vec<test::TestDescAndFn>,
214 ) {
215     test_args.insert(0, "rustdoctest".to_string());
216     if nocapture {
217         test_args.push("--nocapture".to_string());
218     }
219     test::test_main(&test_args, tests, None);
220 }
221
222 // Look for `#![doc(test(no_crate_inject))]`, used by crates in the std facade.
223 fn scrape_test_config(attrs: &[ast::Attribute]) -> GlobalTestOptions {
224     use rustc_ast_pretty::pprust;
225
226     let mut opts = GlobalTestOptions { no_crate_inject: false, attrs: Vec::new() };
227
228     let test_attrs: Vec<_> = attrs
229         .iter()
230         .filter(|a| a.has_name(sym::doc))
231         .flat_map(|a| a.meta_item_list().unwrap_or_default())
232         .filter(|a| a.has_name(sym::test))
233         .collect();
234     let attrs = test_attrs.iter().flat_map(|a| a.meta_item_list().unwrap_or(&[]));
235
236     for attr in attrs {
237         if attr.has_name(sym::no_crate_inject) {
238             opts.no_crate_inject = true;
239         }
240         if attr.has_name(sym::attr) {
241             if let Some(l) = attr.meta_item_list() {
242                 for item in l {
243                     opts.attrs.push(pprust::meta_list_item_to_string(item));
244                 }
245             }
246         }
247     }
248
249     opts
250 }
251
252 /// Documentation test failure modes.
253 enum TestFailure {
254     /// The test failed to compile.
255     CompileError,
256     /// The test is marked `compile_fail` but compiled successfully.
257     UnexpectedCompilePass,
258     /// The test failed to compile (as expected) but the compiler output did not contain all
259     /// expected error codes.
260     MissingErrorCodes(Vec<String>),
261     /// The test binary was unable to be executed.
262     ExecutionError(io::Error),
263     /// The test binary exited with a non-zero exit code.
264     ///
265     /// This typically means an assertion in the test failed or another form of panic occurred.
266     ExecutionFailure(process::Output),
267     /// The test is marked `should_panic` but the test binary executed successfully.
268     UnexpectedRunPass,
269 }
270
271 enum DirState {
272     Temp(tempfile::TempDir),
273     Perm(PathBuf),
274 }
275
276 impl DirState {
277     fn path(&self) -> &std::path::Path {
278         match self {
279             DirState::Temp(t) => t.path(),
280             DirState::Perm(p) => p.as_path(),
281         }
282     }
283 }
284
285 // NOTE: Keep this in sync with the equivalent structs in rustc
286 // and cargo.
287 // We could unify this struct the one in rustc but they have different
288 // ownership semantics, so doing so would create wasteful allocations.
289 #[derive(serde::Serialize, serde::Deserialize)]
290 struct UnusedExterns {
291     /// Lint level of the unused_crate_dependencies lint
292     lint_level: String,
293     /// List of unused externs by their names.
294     unused_extern_names: Vec<String>,
295 }
296
297 fn run_test(
298     test: &str,
299     crate_name: &str,
300     line: usize,
301     rustdoc_options: RustdocOptions,
302     mut lang_string: LangString,
303     no_run: bool,
304     runtool: Option<String>,
305     runtool_args: Vec<String>,
306     target: TargetTriple,
307     opts: &GlobalTestOptions,
308     edition: Edition,
309     outdir: DirState,
310     path: PathBuf,
311     test_id: &str,
312     report_unused_externs: impl Fn(UnusedExterns),
313 ) -> Result<(), TestFailure> {
314     let (test, line_offset, supports_color) =
315         make_test(test, Some(crate_name), lang_string.test_harness, opts, edition, Some(test_id));
316
317     let output_file = outdir.path().join("rust_out");
318
319     let rustc_binary = rustdoc_options
320         .test_builder
321         .as_deref()
322         .unwrap_or_else(|| rustc_interface::util::rustc_path().expect("found rustc"));
323     let mut compiler = Command::new(&rustc_binary);
324     compiler.arg("--crate-type").arg("bin");
325     for cfg in &rustdoc_options.cfgs {
326         compiler.arg("--cfg").arg(&cfg);
327     }
328     if !rustdoc_options.check_cfgs.is_empty() {
329         compiler.arg("-Z").arg("unstable-options");
330         for check_cfg in &rustdoc_options.check_cfgs {
331             compiler.arg("--check-cfg").arg(&check_cfg);
332         }
333     }
334     if let Some(sysroot) = rustdoc_options.maybe_sysroot {
335         compiler.arg("--sysroot").arg(sysroot);
336     }
337     compiler.arg("--edition").arg(&edition.to_string());
338     compiler.env("UNSTABLE_RUSTDOC_TEST_PATH", path);
339     compiler.env("UNSTABLE_RUSTDOC_TEST_LINE", format!("{}", line as isize - line_offset as isize));
340     compiler.arg("-o").arg(&output_file);
341     if lang_string.test_harness {
342         compiler.arg("--test");
343     }
344     if rustdoc_options.json_unused_externs.is_enabled() && !lang_string.compile_fail {
345         compiler.arg("--error-format=json");
346         compiler.arg("--json").arg("unused-externs");
347         compiler.arg("-Z").arg("unstable-options");
348         compiler.arg("-W").arg("unused_crate_dependencies");
349     }
350     for lib_str in &rustdoc_options.lib_strs {
351         compiler.arg("-L").arg(&lib_str);
352     }
353     for extern_str in &rustdoc_options.extern_strs {
354         compiler.arg("--extern").arg(&extern_str);
355     }
356     compiler.arg("-Ccodegen-units=1");
357     for codegen_options_str in &rustdoc_options.codegen_options_strs {
358         compiler.arg("-C").arg(&codegen_options_str);
359     }
360     for debugging_option_str in &rustdoc_options.debugging_opts_strs {
361         compiler.arg("-Z").arg(&debugging_option_str);
362     }
363     if no_run && !lang_string.compile_fail && rustdoc_options.persist_doctests.is_none() {
364         compiler.arg("--emit=metadata");
365     }
366     compiler.arg("--target").arg(match target {
367         TargetTriple::TargetTriple(s) => s,
368         TargetTriple::TargetPath(path) => {
369             path.to_str().expect("target path must be valid unicode").to_string()
370         }
371     });
372     if let ErrorOutputType::HumanReadable(kind) = rustdoc_options.error_format {
373         let (short, color_config) = kind.unzip();
374
375         if short {
376             compiler.arg("--error-format").arg("short");
377         }
378
379         match color_config {
380             ColorConfig::Never => {
381                 compiler.arg("--color").arg("never");
382             }
383             ColorConfig::Always => {
384                 compiler.arg("--color").arg("always");
385             }
386             ColorConfig::Auto => {
387                 compiler.arg("--color").arg(if supports_color { "always" } else { "never" });
388             }
389         }
390     }
391
392     compiler.arg("-");
393     compiler.stdin(Stdio::piped());
394     compiler.stderr(Stdio::piped());
395
396     let mut child = compiler.spawn().expect("Failed to spawn rustc process");
397     {
398         let stdin = child.stdin.as_mut().expect("Failed to open stdin");
399         stdin.write_all(test.as_bytes()).expect("could write out test sources");
400     }
401     let output = child.wait_with_output().expect("Failed to read stdout");
402
403     struct Bomb<'a>(&'a str);
404     impl Drop for Bomb<'_> {
405         fn drop(&mut self) {
406             eprint!("{}", self.0);
407         }
408     }
409     let mut out = str::from_utf8(&output.stderr)
410         .unwrap()
411         .lines()
412         .filter(|l| {
413             if let Ok(uext) = serde_json::from_str::<UnusedExterns>(l) {
414                 report_unused_externs(uext);
415                 false
416             } else {
417                 true
418             }
419         })
420         .intersperse_with(|| "\n")
421         .collect::<String>();
422
423     // Add a \n to the end to properly terminate the last line,
424     // but only if there was output to be printed
425     if !out.is_empty() {
426         out.push('\n');
427     }
428
429     let _bomb = Bomb(&out);
430     match (output.status.success(), lang_string.compile_fail) {
431         (true, true) => {
432             return Err(TestFailure::UnexpectedCompilePass);
433         }
434         (true, false) => {}
435         (false, true) => {
436             if !lang_string.error_codes.is_empty() {
437                 // We used to check if the output contained "error[{}]: " but since we added the
438                 // colored output, we can't anymore because of the color escape characters before
439                 // the ":".
440                 lang_string.error_codes.retain(|err| !out.contains(&format!("error[{err}]")));
441
442                 if !lang_string.error_codes.is_empty() {
443                     return Err(TestFailure::MissingErrorCodes(lang_string.error_codes));
444                 }
445             }
446         }
447         (false, false) => {
448             return Err(TestFailure::CompileError);
449         }
450     }
451
452     if no_run {
453         return Ok(());
454     }
455
456     // Run the code!
457     let mut cmd;
458
459     if let Some(tool) = runtool {
460         cmd = Command::new(tool);
461         cmd.args(runtool_args);
462         cmd.arg(output_file);
463     } else {
464         cmd = Command::new(output_file);
465     }
466     if let Some(run_directory) = rustdoc_options.test_run_directory {
467         cmd.current_dir(run_directory);
468     }
469
470     let result = if rustdoc_options.nocapture {
471         cmd.status().map(|status| process::Output {
472             status,
473             stdout: Vec::new(),
474             stderr: Vec::new(),
475         })
476     } else {
477         cmd.output()
478     };
479     match result {
480         Err(e) => return Err(TestFailure::ExecutionError(e)),
481         Ok(out) => {
482             if lang_string.should_panic && out.status.success() {
483                 return Err(TestFailure::UnexpectedRunPass);
484             } else if !lang_string.should_panic && !out.status.success() {
485                 return Err(TestFailure::ExecutionFailure(out));
486             }
487         }
488     }
489
490     Ok(())
491 }
492
493 /// Transforms a test into code that can be compiled into a Rust binary, and returns the number of
494 /// lines before the test code begins as well as if the output stream supports colors or not.
495 pub(crate) fn make_test(
496     s: &str,
497     crate_name: Option<&str>,
498     dont_insert_main: bool,
499     opts: &GlobalTestOptions,
500     edition: Edition,
501     test_id: Option<&str>,
502 ) -> (String, usize, bool) {
503     let (crate_attrs, everything_else, crates) = partition_source(s, edition);
504     let everything_else = everything_else.trim();
505     let mut line_offset = 0;
506     let mut prog = String::new();
507     let mut supports_color = false;
508
509     if opts.attrs.is_empty() {
510         // If there aren't any attributes supplied by #![doc(test(attr(...)))], then allow some
511         // lints that are commonly triggered in doctests. The crate-level test attributes are
512         // commonly used to make tests fail in case they trigger warnings, so having this there in
513         // that case may cause some tests to pass when they shouldn't have.
514         prog.push_str("#![allow(unused)]\n");
515         line_offset += 1;
516     }
517
518     // Next, any attributes that came from the crate root via #![doc(test(attr(...)))].
519     for attr in &opts.attrs {
520         prog.push_str(&format!("#![{attr}]\n"));
521         line_offset += 1;
522     }
523
524     // Now push any outer attributes from the example, assuming they
525     // are intended to be crate attributes.
526     prog.push_str(&crate_attrs);
527     prog.push_str(&crates);
528
529     // Uses librustc_ast to parse the doctest and find if there's a main fn and the extern
530     // crate already is included.
531     let result = rustc_driver::catch_fatal_errors(|| {
532         rustc_span::create_session_if_not_set_then(edition, |_| {
533             use rustc_errors::emitter::{Emitter, EmitterWriter};
534             use rustc_errors::Handler;
535             use rustc_parse::parser::ForceCollect;
536             use rustc_span::source_map::FilePathMapping;
537
538             let filename = FileName::anon_source_code(s);
539             let source = crates + everything_else;
540
541             // Any errors in parsing should also appear when the doctest is compiled for real, so just
542             // send all the errors that librustc_ast emits directly into a `Sink` instead of stderr.
543             let sm = Lrc::new(SourceMap::new(FilePathMapping::empty()));
544             let fallback_bundle =
545                 rustc_errors::fallback_fluent_bundle(rustc_errors::DEFAULT_LOCALE_RESOURCES, false);
546             supports_color = EmitterWriter::stderr(
547                 ColorConfig::Auto,
548                 None,
549                 None,
550                 fallback_bundle.clone(),
551                 false,
552                 false,
553                 Some(80),
554                 false,
555             )
556             .supports_color();
557
558             let emitter = EmitterWriter::new(
559                 box io::sink(),
560                 None,
561                 None,
562                 fallback_bundle,
563                 false,
564                 false,
565                 false,
566                 None,
567                 false,
568             );
569
570             // FIXME(misdreavus): pass `-Z treat-err-as-bug` to the doctest parser
571             let handler = Handler::with_emitter(false, None, box emitter);
572             let sess = ParseSess::with_span_handler(handler, sm);
573
574             let mut found_main = false;
575             let mut found_extern_crate = crate_name.is_none();
576             let mut found_macro = false;
577
578             let mut parser = match maybe_new_parser_from_source_str(&sess, filename, source) {
579                 Ok(p) => p,
580                 Err(errs) => {
581                     drop(errs);
582                     return (found_main, found_extern_crate, found_macro);
583                 }
584             };
585
586             loop {
587                 match parser.parse_item(ForceCollect::No) {
588                     Ok(Some(item)) => {
589                         if !found_main {
590                             if let ast::ItemKind::Fn(..) = item.kind {
591                                 if item.ident.name == sym::main {
592                                     found_main = true;
593                                 }
594                             }
595                         }
596
597                         if !found_extern_crate {
598                             if let ast::ItemKind::ExternCrate(original) = item.kind {
599                                 // This code will never be reached if `crate_name` is none because
600                                 // `found_extern_crate` is initialized to `true` if it is none.
601                                 let crate_name = crate_name.unwrap();
602
603                                 match original {
604                                     Some(name) => found_extern_crate = name.as_str() == crate_name,
605                                     None => found_extern_crate = item.ident.as_str() == crate_name,
606                                 }
607                             }
608                         }
609
610                         if !found_macro {
611                             if let ast::ItemKind::MacCall(..) = item.kind {
612                                 found_macro = true;
613                             }
614                         }
615
616                         if found_main && found_extern_crate {
617                             break;
618                         }
619                     }
620                     Ok(None) => break,
621                     Err(e) => {
622                         e.cancel();
623                         break;
624                     }
625                 }
626
627                 // The supplied slice is only used for diagnostics,
628                 // which are swallowed here anyway.
629                 parser.maybe_consume_incorrect_semicolon(&[]);
630             }
631
632             // Reset errors so that they won't be reported as compiler bugs when dropping the
633             // handler. Any errors in the tests will be reported when the test file is compiled,
634             // Note that we still need to cancel the errors above otherwise `DiagnosticBuilder`
635             // will panic on drop.
636             sess.span_diagnostic.reset_err_count();
637
638             (found_main, found_extern_crate, found_macro)
639         })
640     });
641     let Ok((already_has_main, already_has_extern_crate, found_macro)) = result
642     else {
643         // If the parser panicked due to a fatal error, pass the test code through unchanged.
644         // The error will be reported during compilation.
645         return (s.to_owned(), 0, false);
646     };
647
648     // If a doctest's `fn main` is being masked by a wrapper macro, the parsing loop above won't
649     // see it. In that case, run the old text-based scan to see if they at least have a main
650     // function written inside a macro invocation. See
651     // https://github.com/rust-lang/rust/issues/56898
652     let already_has_main = if found_macro && !already_has_main {
653         s.lines()
654             .map(|line| {
655                 let comment = line.find("//");
656                 if let Some(comment_begins) = comment { &line[0..comment_begins] } else { line }
657             })
658             .any(|code| code.contains("fn main"))
659     } else {
660         already_has_main
661     };
662
663     // Don't inject `extern crate std` because it's already injected by the
664     // compiler.
665     if !already_has_extern_crate && !opts.no_crate_inject && crate_name != Some("std") {
666         if let Some(crate_name) = crate_name {
667             // Don't inject `extern crate` if the crate is never used.
668             // NOTE: this is terribly inaccurate because it doesn't actually
669             // parse the source, but only has false positives, not false
670             // negatives.
671             if s.contains(crate_name) {
672                 prog.push_str(&format!("extern crate r#{crate_name};\n"));
673                 line_offset += 1;
674             }
675         }
676     }
677
678     // FIXME: This code cannot yet handle no_std test cases yet
679     if dont_insert_main || already_has_main || prog.contains("![no_std]") {
680         prog.push_str(everything_else);
681     } else {
682         let returns_result = everything_else.trim_end().ends_with("(())");
683         // Give each doctest main function a unique name.
684         // This is for example needed for the tooling around `-C instrument-coverage`.
685         let inner_fn_name = if let Some(test_id) = test_id {
686             format!("_doctest_main_{test_id}")
687         } else {
688             "_inner".into()
689         };
690         let inner_attr = if test_id.is_some() { "#[allow(non_snake_case)] " } else { "" };
691         let (main_pre, main_post) = if returns_result {
692             (
693                 format!(
694                     "fn main() {{ {inner_attr}fn {inner_fn_name}() -> Result<(), impl core::fmt::Debug> {{\n",
695                 ),
696                 format!("\n}} {inner_fn_name}().unwrap() }}"),
697             )
698         } else if test_id.is_some() {
699             (
700                 format!("fn main() {{ {inner_attr}fn {inner_fn_name}() {{\n",),
701                 format!("\n}} {inner_fn_name}() }}"),
702             )
703         } else {
704             ("fn main() {\n".into(), "\n}".into())
705         };
706         // Note on newlines: We insert a line/newline *before*, and *after*
707         // the doctest and adjust the `line_offset` accordingly.
708         // In the case of `-C instrument-coverage`, this means that the generated
709         // inner `main` function spans from the doctest opening codeblock to the
710         // closing one. For example
711         // /// ``` <- start of the inner main
712         // /// <- code under doctest
713         // /// ``` <- end of the inner main
714         line_offset += 1;
715
716         prog.extend([&main_pre, everything_else, &main_post].iter().cloned());
717     }
718
719     debug!("final doctest:\n{prog}");
720
721     (prog, line_offset, supports_color)
722 }
723
724 fn check_if_attr_is_complete(source: &str, edition: Edition) -> bool {
725     if source.is_empty() {
726         // Empty content so nothing to check in here...
727         return true;
728     }
729     rustc_span::create_session_if_not_set_then(edition, |_| {
730         let filename = FileName::anon_source_code(source);
731         let sess = ParseSess::with_silent_emitter(None);
732         let mut parser = match maybe_new_parser_from_source_str(&sess, filename, source.to_owned())
733         {
734             Ok(p) => p,
735             Err(_) => {
736                 debug!("Cannot build a parser to check mod attr so skipping...");
737                 return true;
738             }
739         };
740         // If a parsing error happened, it's very likely that the attribute is incomplete.
741         if parser.parse_attribute(InnerAttrPolicy::Permitted).is_err() {
742             return false;
743         }
744         // We now check if there is an unclosed delimiter for the attribute. To do so, we look at
745         // the `unclosed_delims` and see if the opening square bracket was closed.
746         parser
747             .unclosed_delims()
748             .get(0)
749             .map(|unclosed| {
750                 unclosed.unclosed_span.map(|s| s.lo()).unwrap_or(BytePos(0)) != BytePos(2)
751             })
752             .unwrap_or(true)
753     })
754 }
755
756 fn partition_source(s: &str, edition: Edition) -> (String, String, String) {
757     #[derive(Copy, Clone, PartialEq)]
758     enum PartitionState {
759         Attrs,
760         Crates,
761         Other,
762     }
763     let mut state = PartitionState::Attrs;
764     let mut before = String::new();
765     let mut crates = String::new();
766     let mut after = String::new();
767
768     let mut mod_attr_pending = String::new();
769
770     for line in s.lines() {
771         let trimline = line.trim();
772
773         // FIXME(misdreavus): if a doc comment is placed on an extern crate statement, it will be
774         // shunted into "everything else"
775         match state {
776             PartitionState::Attrs => {
777                 state = if trimline.starts_with("#![") {
778                     if !check_if_attr_is_complete(line, edition) {
779                         mod_attr_pending = line.to_owned();
780                     } else {
781                         mod_attr_pending.clear();
782                     }
783                     PartitionState::Attrs
784                 } else if trimline.chars().all(|c| c.is_whitespace())
785                     || (trimline.starts_with("//") && !trimline.starts_with("///"))
786                 {
787                     PartitionState::Attrs
788                 } else if trimline.starts_with("extern crate")
789                     || trimline.starts_with("#[macro_use] extern crate")
790                 {
791                     PartitionState::Crates
792                 } else {
793                     // First we check if the previous attribute was "complete"...
794                     if !mod_attr_pending.is_empty() {
795                         // If not, then we append the new line into the pending attribute to check
796                         // if this time it's complete...
797                         mod_attr_pending.push_str(line);
798                         if !trimline.is_empty() && check_if_attr_is_complete(line, edition) {
799                             // If it's complete, then we can clear the pending content.
800                             mod_attr_pending.clear();
801                         }
802                         // In any case, this is considered as `PartitionState::Attrs` so it's
803                         // prepended before rustdoc's inserts.
804                         PartitionState::Attrs
805                     } else {
806                         PartitionState::Other
807                     }
808                 };
809             }
810             PartitionState::Crates => {
811                 state = if trimline.starts_with("extern crate")
812                     || trimline.starts_with("#[macro_use] extern crate")
813                     || trimline.chars().all(|c| c.is_whitespace())
814                     || (trimline.starts_with("//") && !trimline.starts_with("///"))
815                 {
816                     PartitionState::Crates
817                 } else {
818                     PartitionState::Other
819                 };
820             }
821             PartitionState::Other => {}
822         }
823
824         match state {
825             PartitionState::Attrs => {
826                 before.push_str(line);
827                 before.push('\n');
828             }
829             PartitionState::Crates => {
830                 crates.push_str(line);
831                 crates.push('\n');
832             }
833             PartitionState::Other => {
834                 after.push_str(line);
835                 after.push('\n');
836             }
837         }
838     }
839
840     debug!("before:\n{before}");
841     debug!("crates:\n{crates}");
842     debug!("after:\n{after}");
843
844     (before, after, crates)
845 }
846
847 pub(crate) trait Tester {
848     fn add_test(&mut self, test: String, config: LangString, line: usize);
849     fn get_line(&self) -> usize {
850         0
851     }
852     fn register_header(&mut self, _name: &str, _level: u32) {}
853 }
854
855 pub(crate) struct Collector {
856     pub(crate) tests: Vec<test::TestDescAndFn>,
857
858     // The name of the test displayed to the user, separated by `::`.
859     //
860     // In tests from Rust source, this is the path to the item
861     // e.g., `["std", "vec", "Vec", "push"]`.
862     //
863     // In tests from a markdown file, this is the titles of all headers (h1~h6)
864     // of the sections that contain the code block, e.g., if the markdown file is
865     // written as:
866     //
867     // ``````markdown
868     // # Title
869     //
870     // ## Subtitle
871     //
872     // ```rust
873     // assert!(true);
874     // ```
875     // ``````
876     //
877     // the `names` vector of that test will be `["Title", "Subtitle"]`.
878     names: Vec<String>,
879
880     rustdoc_options: RustdocOptions,
881     use_headers: bool,
882     enable_per_target_ignores: bool,
883     crate_name: Symbol,
884     opts: GlobalTestOptions,
885     position: Span,
886     source_map: Option<Lrc<SourceMap>>,
887     filename: Option<PathBuf>,
888     visited_tests: FxHashMap<(String, usize), usize>,
889     unused_extern_reports: Arc<Mutex<Vec<UnusedExterns>>>,
890     compiling_test_count: AtomicUsize,
891 }
892
893 impl Collector {
894     pub(crate) fn new(
895         crate_name: Symbol,
896         rustdoc_options: RustdocOptions,
897         use_headers: bool,
898         opts: GlobalTestOptions,
899         source_map: Option<Lrc<SourceMap>>,
900         filename: Option<PathBuf>,
901         enable_per_target_ignores: bool,
902     ) -> Collector {
903         Collector {
904             tests: Vec::new(),
905             names: Vec::new(),
906             rustdoc_options,
907             use_headers,
908             enable_per_target_ignores,
909             crate_name,
910             opts,
911             position: DUMMY_SP,
912             source_map,
913             filename,
914             visited_tests: FxHashMap::default(),
915             unused_extern_reports: Default::default(),
916             compiling_test_count: AtomicUsize::new(0),
917         }
918     }
919
920     fn generate_name(&self, line: usize, filename: &FileName) -> String {
921         let mut item_path = self.names.join("::");
922         item_path.retain(|c| c != ' ');
923         if !item_path.is_empty() {
924             item_path.push(' ');
925         }
926         format!("{} - {}(line {})", filename.prefer_local(), item_path, line)
927     }
928
929     pub(crate) fn set_position(&mut self, position: Span) {
930         self.position = position;
931     }
932
933     fn get_filename(&self) -> FileName {
934         if let Some(ref source_map) = self.source_map {
935             let filename = source_map.span_to_filename(self.position);
936             if let FileName::Real(ref filename) = filename {
937                 if let Ok(cur_dir) = env::current_dir() {
938                     if let Some(local_path) = filename.local_path() {
939                         if let Ok(path) = local_path.strip_prefix(&cur_dir) {
940                             return path.to_owned().into();
941                         }
942                     }
943                 }
944             }
945             filename
946         } else if let Some(ref filename) = self.filename {
947             filename.clone().into()
948         } else {
949             FileName::Custom("input".to_owned())
950         }
951     }
952 }
953
954 impl Tester for Collector {
955     fn add_test(&mut self, test: String, config: LangString, line: usize) {
956         let filename = self.get_filename();
957         let name = self.generate_name(line, &filename);
958         let crate_name = self.crate_name.to_string();
959         let opts = self.opts.clone();
960         let edition = config.edition.unwrap_or(self.rustdoc_options.edition);
961         let rustdoc_options = self.rustdoc_options.clone();
962         let runtool = self.rustdoc_options.runtool.clone();
963         let runtool_args = self.rustdoc_options.runtool_args.clone();
964         let target = self.rustdoc_options.target.clone();
965         let target_str = target.to_string();
966         let unused_externs = self.unused_extern_reports.clone();
967         let no_run = config.no_run || rustdoc_options.no_run;
968         if !config.compile_fail {
969             self.compiling_test_count.fetch_add(1, Ordering::SeqCst);
970         }
971
972         let path = match &filename {
973             FileName::Real(path) => {
974                 if let Some(local_path) = path.local_path() {
975                     local_path.to_path_buf()
976                 } else {
977                     // Somehow we got the filename from the metadata of another crate, should never happen
978                     unreachable!("doctest from a different crate");
979                 }
980             }
981             _ => PathBuf::from(r"doctest.rs"),
982         };
983
984         // For example `module/file.rs` would become `module_file_rs`
985         let file = filename
986             .prefer_local()
987             .to_string_lossy()
988             .chars()
989             .map(|c| if c.is_ascii_alphanumeric() { c } else { '_' })
990             .collect::<String>();
991         let test_id = format!(
992             "{file}_{line}_{number}",
993             file = file,
994             line = line,
995             number = {
996                 // Increases the current test number, if this file already
997                 // exists or it creates a new entry with a test number of 0.
998                 self.visited_tests.entry((file.clone(), line)).and_modify(|v| *v += 1).or_insert(0)
999             },
1000         );
1001         let outdir = if let Some(mut path) = rustdoc_options.persist_doctests.clone() {
1002             path.push(&test_id);
1003
1004             std::fs::create_dir_all(&path)
1005                 .expect("Couldn't create directory for doctest executables");
1006
1007             DirState::Perm(path)
1008         } else {
1009             DirState::Temp(
1010                 TempFileBuilder::new()
1011                     .prefix("rustdoctest")
1012                     .tempdir()
1013                     .expect("rustdoc needs a tempdir"),
1014             )
1015         };
1016
1017         debug!("creating test {name}: {test}");
1018         self.tests.push(test::TestDescAndFn {
1019             desc: test::TestDesc {
1020                 name: test::DynTestName(name),
1021                 ignore: match config.ignore {
1022                     Ignore::All => true,
1023                     Ignore::None => false,
1024                     Ignore::Some(ref ignores) => ignores.iter().any(|s| target_str.contains(s)),
1025                 },
1026                 ignore_message: None,
1027                 // compiler failures are test failures
1028                 should_panic: test::ShouldPanic::No,
1029                 compile_fail: config.compile_fail,
1030                 no_run,
1031                 test_type: test::TestType::DocTest,
1032             },
1033             testfn: test::DynTestFn(box move || {
1034                 let report_unused_externs = |uext| {
1035                     unused_externs.lock().unwrap().push(uext);
1036                 };
1037                 let res = run_test(
1038                     &test,
1039                     &crate_name,
1040                     line,
1041                     rustdoc_options,
1042                     config,
1043                     no_run,
1044                     runtool,
1045                     runtool_args,
1046                     target,
1047                     &opts,
1048                     edition,
1049                     outdir,
1050                     path,
1051                     &test_id,
1052                     report_unused_externs,
1053                 );
1054
1055                 if let Err(err) = res {
1056                     match err {
1057                         TestFailure::CompileError => {
1058                             eprint!("Couldn't compile the test.");
1059                         }
1060                         TestFailure::UnexpectedCompilePass => {
1061                             eprint!("Test compiled successfully, but it's marked `compile_fail`.");
1062                         }
1063                         TestFailure::UnexpectedRunPass => {
1064                             eprint!("Test executable succeeded, but it's marked `should_panic`.");
1065                         }
1066                         TestFailure::MissingErrorCodes(codes) => {
1067                             eprint!("Some expected error codes were not found: {:?}", codes);
1068                         }
1069                         TestFailure::ExecutionError(err) => {
1070                             eprint!("Couldn't run the test: {err}");
1071                             if err.kind() == io::ErrorKind::PermissionDenied {
1072                                 eprint!(" - maybe your tempdir is mounted with noexec?");
1073                             }
1074                         }
1075                         TestFailure::ExecutionFailure(out) => {
1076                             eprintln!("Test executable failed ({reason}).", reason = out.status);
1077
1078                             // FIXME(#12309): An unfortunate side-effect of capturing the test
1079                             // executable's output is that the relative ordering between the test's
1080                             // stdout and stderr is lost. However, this is better than the
1081                             // alternative: if the test executable inherited the parent's I/O
1082                             // handles the output wouldn't be captured at all, even on success.
1083                             //
1084                             // The ordering could be preserved if the test process' stderr was
1085                             // redirected to stdout, but that functionality does not exist in the
1086                             // standard library, so it may not be portable enough.
1087                             let stdout = str::from_utf8(&out.stdout).unwrap_or_default();
1088                             let stderr = str::from_utf8(&out.stderr).unwrap_or_default();
1089
1090                             if !stdout.is_empty() || !stderr.is_empty() {
1091                                 eprintln!();
1092
1093                                 if !stdout.is_empty() {
1094                                     eprintln!("stdout:\n{stdout}");
1095                                 }
1096
1097                                 if !stderr.is_empty() {
1098                                     eprintln!("stderr:\n{stderr}");
1099                                 }
1100                             }
1101                         }
1102                     }
1103
1104                     panic::resume_unwind(box ());
1105                 }
1106             }),
1107         });
1108     }
1109
1110     fn get_line(&self) -> usize {
1111         if let Some(ref source_map) = self.source_map {
1112             let line = self.position.lo().to_usize();
1113             let line = source_map.lookup_char_pos(BytePos(line as u32)).line;
1114             if line > 0 { line - 1 } else { line }
1115         } else {
1116             0
1117         }
1118     }
1119
1120     fn register_header(&mut self, name: &str, level: u32) {
1121         if self.use_headers {
1122             // We use these headings as test names, so it's good if
1123             // they're valid identifiers.
1124             let name = name
1125                 .chars()
1126                 .enumerate()
1127                 .map(|(i, c)| {
1128                     if (i == 0 && rustc_lexer::is_id_start(c))
1129                         || (i != 0 && rustc_lexer::is_id_continue(c))
1130                     {
1131                         c
1132                     } else {
1133                         '_'
1134                     }
1135                 })
1136                 .collect::<String>();
1137
1138             // Here we try to efficiently assemble the header titles into the
1139             // test name in the form of `h1::h2::h3::h4::h5::h6`.
1140             //
1141             // Suppose that originally `self.names` contains `[h1, h2, h3]`...
1142             let level = level as usize;
1143             if level <= self.names.len() {
1144                 // ... Consider `level == 2`. All headers in the lower levels
1145                 // are irrelevant in this new level. So we should reset
1146                 // `self.names` to contain headers until <h2>, and replace that
1147                 // slot with the new name: `[h1, name]`.
1148                 self.names.truncate(level);
1149                 self.names[level - 1] = name;
1150             } else {
1151                 // ... On the other hand, consider `level == 5`. This means we
1152                 // need to extend `self.names` to contain five headers. We fill
1153                 // in the missing level (<h4>) with `_`. Thus `self.names` will
1154                 // become `[h1, h2, h3, "_", name]`.
1155                 if level - 1 > self.names.len() {
1156                     self.names.resize(level - 1, "_".to_owned());
1157                 }
1158                 self.names.push(name);
1159             }
1160         }
1161     }
1162 }
1163
1164 struct HirCollector<'a, 'hir, 'tcx> {
1165     sess: &'a Session,
1166     collector: &'a mut Collector,
1167     map: Map<'hir>,
1168     codes: ErrorCodes,
1169     tcx: TyCtxt<'tcx>,
1170 }
1171
1172 impl<'a, 'hir, 'tcx> HirCollector<'a, 'hir, 'tcx> {
1173     fn visit_testable<F: FnOnce(&mut Self)>(
1174         &mut self,
1175         name: String,
1176         hir_id: HirId,
1177         sp: Span,
1178         nested: F,
1179     ) {
1180         let ast_attrs = self.tcx.hir().attrs(hir_id);
1181         if let Some(ref cfg) = ast_attrs.cfg(self.tcx, &FxHashSet::default()) {
1182             if !cfg.matches(&self.sess.parse_sess, Some(self.sess.features_untracked())) {
1183                 return;
1184             }
1185         }
1186
1187         let has_name = !name.is_empty();
1188         if has_name {
1189             self.collector.names.push(name);
1190         }
1191
1192         // The collapse-docs pass won't combine sugared/raw doc attributes, or included files with
1193         // anything else, this will combine them for us.
1194         let attrs = Attributes::from_ast(ast_attrs, None);
1195         if let Some(doc) = attrs.collapsed_doc_value() {
1196             // Use the outermost invocation, so that doctest names come from where the docs were written.
1197             let span = ast_attrs
1198                 .span()
1199                 .map(|span| span.ctxt().outer_expn().expansion_cause().unwrap_or(span))
1200                 .unwrap_or(DUMMY_SP);
1201             self.collector.set_position(span);
1202             markdown::find_testable_code(
1203                 &doc,
1204                 self.collector,
1205                 self.codes,
1206                 self.collector.enable_per_target_ignores,
1207                 Some(&crate::html::markdown::ExtraInfo::new(
1208                     self.tcx,
1209                     hir_id,
1210                     span_of_attrs(&attrs).unwrap_or(sp),
1211                 )),
1212             );
1213         }
1214
1215         nested(self);
1216
1217         if has_name {
1218             self.collector.names.pop();
1219         }
1220     }
1221 }
1222
1223 impl<'a, 'hir, 'tcx> intravisit::Visitor<'hir> for HirCollector<'a, 'hir, 'tcx> {
1224     type NestedFilter = nested_filter::All;
1225
1226     fn nested_visit_map(&mut self) -> Self::Map {
1227         self.map
1228     }
1229
1230     fn visit_item(&mut self, item: &'hir hir::Item<'_>) {
1231         let name = match &item.kind {
1232             hir::ItemKind::Impl(impl_) => {
1233                 rustc_hir_pretty::id_to_string(&self.map, impl_.self_ty.hir_id)
1234             }
1235             _ => item.ident.to_string(),
1236         };
1237
1238         self.visit_testable(name, item.hir_id(), item.span, |this| {
1239             intravisit::walk_item(this, item);
1240         });
1241     }
1242
1243     fn visit_trait_item(&mut self, item: &'hir hir::TraitItem<'_>) {
1244         self.visit_testable(item.ident.to_string(), item.hir_id(), item.span, |this| {
1245             intravisit::walk_trait_item(this, item);
1246         });
1247     }
1248
1249     fn visit_impl_item(&mut self, item: &'hir hir::ImplItem<'_>) {
1250         self.visit_testable(item.ident.to_string(), item.hir_id(), item.span, |this| {
1251             intravisit::walk_impl_item(this, item);
1252         });
1253     }
1254
1255     fn visit_foreign_item(&mut self, item: &'hir hir::ForeignItem<'_>) {
1256         self.visit_testable(item.ident.to_string(), item.hir_id(), item.span, |this| {
1257             intravisit::walk_foreign_item(this, item);
1258         });
1259     }
1260
1261     fn visit_variant(
1262         &mut self,
1263         v: &'hir hir::Variant<'_>,
1264         g: &'hir hir::Generics<'_>,
1265         item_id: hir::HirId,
1266     ) {
1267         self.visit_testable(v.ident.to_string(), v.id, v.span, |this| {
1268             intravisit::walk_variant(this, v, g, item_id);
1269         });
1270     }
1271
1272     fn visit_field_def(&mut self, f: &'hir hir::FieldDef<'_>) {
1273         self.visit_testable(f.ident.to_string(), f.hir_id, f.span, |this| {
1274             intravisit::walk_field_def(this, f);
1275         });
1276     }
1277 }
1278
1279 #[cfg(test)]
1280 mod tests;