]> git.lizzy.rs Git - rust.git/blob - src/librustdoc/doctest.rs
Rollup merge of #94867 - notriddle:notriddle/i32-count-regression-test, r=Dylan-DPC
[rust.git] / src / librustdoc / doctest.rs
1 use rustc_ast as ast;
2 use rustc_data_structures::fx::{FxHashMap, FxHashSet};
3 use rustc_data_structures::sync::Lrc;
4 use rustc_errors::{ColorConfig, ErrorGuaranteed, FatalError};
5 use rustc_hir as hir;
6 use rustc_hir::def_id::LOCAL_CRATE;
7 use rustc_hir::intravisit;
8 use rustc_hir::{HirId, CRATE_HIR_ID};
9 use rustc_interface::interface;
10 use rustc_middle::hir::map::Map;
11 use rustc_middle::hir::nested_filter;
12 use rustc_middle::ty::TyCtxt;
13 use rustc_session::config::{self, CrateType, ErrorOutputType};
14 use rustc_session::{lint, DiagnosticOutput, Session};
15 use rustc_span::edition::Edition;
16 use rustc_span::source_map::SourceMap;
17 use rustc_span::symbol::sym;
18 use rustc_span::Symbol;
19 use rustc_span::{BytePos, FileName, Pos, Span, DUMMY_SP};
20 use rustc_target::spec::TargetTriple;
21 use tempfile::Builder as TempFileBuilder;
22
23 use std::env;
24 use std::io::{self, Write};
25 use std::panic;
26 use std::path::PathBuf;
27 use std::process::{self, Command, Stdio};
28 use std::str;
29 use std::sync::atomic::{AtomicUsize, Ordering};
30 use std::sync::{Arc, Mutex};
31
32 use crate::clean::{types::AttributesExt, Attributes};
33 use crate::config::Options as RustdocOptions;
34 use crate::html::markdown::{self, ErrorCodes, Ignore, LangString};
35 use crate::lint::init_lints;
36 use crate::passes::span_of_attrs;
37
38 /// Options that apply to all doctests in a crate or Markdown file (for `rustdoc foo.md`).
39 #[derive(Clone, Default)]
40 crate struct GlobalTestOptions {
41     /// Whether to disable the default `extern crate my_crate;` when creating doctests.
42     crate no_crate_inject: bool,
43     /// Additional crate-level attributes to add to doctests.
44     crate attrs: Vec<String>,
45 }
46
47 crate fn run(options: RustdocOptions) -> Result<(), ErrorGuaranteed> {
48     let input = config::Input::File(options.input.clone());
49
50     let invalid_codeblock_attributes_name = crate::lint::INVALID_CODEBLOCK_ATTRIBUTES.name;
51
52     // See core::create_config for what's going on here.
53     let allowed_lints = vec![
54         invalid_codeblock_attributes_name.to_owned(),
55         lint::builtin::UNKNOWN_LINTS.name.to_owned(),
56         lint::builtin::RENAMED_AND_REMOVED_LINTS.name.to_owned(),
57     ];
58
59     let (lint_opts, lint_caps) = init_lints(allowed_lints, options.lint_opts.clone(), |lint| {
60         if lint.name == invalid_codeblock_attributes_name {
61             None
62         } else {
63             Some((lint.name_lower(), lint::Allow))
64         }
65     });
66
67     debug!(?lint_opts);
68
69     let crate_types =
70         if options.proc_macro_crate { vec![CrateType::ProcMacro] } else { vec![CrateType::Rlib] };
71
72     let sessopts = config::Options {
73         maybe_sysroot: options.maybe_sysroot.clone(),
74         search_paths: options.libs.clone(),
75         crate_types,
76         lint_opts,
77         lint_cap: Some(options.lint_cap.unwrap_or(lint::Forbid)),
78         cg: options.codegen_options.clone(),
79         externs: options.externs.clone(),
80         unstable_features: options.render_options.unstable_features,
81         actually_rustdoc: true,
82         edition: options.edition,
83         target_triple: options.target.clone(),
84         crate_name: options.crate_name.clone(),
85         ..config::Options::default()
86     };
87
88     let mut cfgs = options.cfgs.clone();
89     cfgs.push("doc".to_owned());
90     cfgs.push("doctest".to_owned());
91     let config = interface::Config {
92         opts: sessopts,
93         crate_cfg: interface::parse_cfgspecs(cfgs),
94         crate_check_cfg: interface::parse_check_cfg(options.check_cfgs.clone()),
95         input,
96         input_path: None,
97         output_file: None,
98         output_dir: None,
99         file_loader: None,
100         diagnostic_output: DiagnosticOutput::Default,
101         lint_caps,
102         parse_sess_created: None,
103         register_lints: Some(box crate::lint::register_lints),
104         override_queries: None,
105         make_codegen_backend: None,
106         registry: rustc_driver::diagnostics_registry(),
107     };
108
109     let test_args = options.test_args.clone();
110     let nocapture = options.nocapture;
111     let externs = options.externs.clone();
112     let json_unused_externs = options.json_unused_externs;
113
114     let (tests, unused_extern_reports, compiling_test_count) =
115         interface::run_compiler(config, |compiler| {
116             compiler.enter(|queries| {
117                 let mut global_ctxt = queries.global_ctxt()?.take();
118
119                 let collector = global_ctxt.enter(|tcx| {
120                     let crate_attrs = tcx.hir().attrs(CRATE_HIR_ID);
121
122                     let opts = scrape_test_config(crate_attrs);
123                     let enable_per_target_ignores = options.enable_per_target_ignores;
124                     let mut collector = Collector::new(
125                         tcx.crate_name(LOCAL_CRATE),
126                         options,
127                         false,
128                         opts,
129                         Some(compiler.session().parse_sess.clone_source_map()),
130                         None,
131                         enable_per_target_ignores,
132                     );
133
134                     let mut hir_collector = HirCollector {
135                         sess: compiler.session(),
136                         collector: &mut collector,
137                         map: tcx.hir(),
138                         codes: ErrorCodes::from(
139                             compiler.session().opts.unstable_features.is_nightly_build(),
140                         ),
141                         tcx,
142                     };
143                     hir_collector.visit_testable(
144                         "".to_string(),
145                         CRATE_HIR_ID,
146                         tcx.hir().span(CRATE_HIR_ID),
147                         |this| tcx.hir().walk_toplevel_module(this),
148                     );
149
150                     collector
151                 });
152                 if compiler.session().diagnostic().has_errors_or_lint_errors() {
153                     FatalError.raise();
154                 }
155
156                 let unused_extern_reports = collector.unused_extern_reports.clone();
157                 let compiling_test_count = collector.compiling_test_count.load(Ordering::SeqCst);
158                 let ret: Result<_, ErrorGuaranteed> =
159                     Ok((collector.tests, unused_extern_reports, compiling_test_count));
160                 ret
161             })
162         })?;
163
164     run_tests(test_args, nocapture, tests);
165
166     // Collect and warn about unused externs, but only if we've gotten
167     // reports for each doctest
168     if json_unused_externs {
169         let unused_extern_reports: Vec<_> =
170             std::mem::take(&mut unused_extern_reports.lock().unwrap());
171         if unused_extern_reports.len() == compiling_test_count {
172             let extern_names = externs.iter().map(|(name, _)| name).collect::<FxHashSet<&String>>();
173             let mut unused_extern_names = unused_extern_reports
174                 .iter()
175                 .map(|uexts| uexts.unused_extern_names.iter().collect::<FxHashSet<&String>>())
176                 .fold(extern_names, |uextsa, uextsb| {
177                     uextsa.intersection(&uextsb).copied().collect::<FxHashSet<&String>>()
178                 })
179                 .iter()
180                 .map(|v| (*v).clone())
181                 .collect::<Vec<String>>();
182             unused_extern_names.sort();
183             // Take the most severe lint level
184             let lint_level = unused_extern_reports
185                 .iter()
186                 .map(|uexts| uexts.lint_level.as_str())
187                 .max_by_key(|v| match *v {
188                     "warn" => 1,
189                     "deny" => 2,
190                     "forbid" => 3,
191                     // The allow lint level is not expected,
192                     // as if allow is specified, no message
193                     // is to be emitted.
194                     v => unreachable!("Invalid lint level '{}'", v),
195                 })
196                 .unwrap_or("warn")
197                 .to_string();
198             let uext = UnusedExterns { lint_level, unused_extern_names };
199             let unused_extern_json = serde_json::to_string(&uext).unwrap();
200             eprintln!("{unused_extern_json}");
201         }
202     }
203
204     Ok(())
205 }
206
207 crate fn run_tests(mut test_args: Vec<String>, nocapture: bool, tests: Vec<test::TestDescAndFn>) {
208     test_args.insert(0, "rustdoctest".to_string());
209     if nocapture {
210         test_args.push("--nocapture".to_string());
211     }
212     test::test_main(&test_args, tests, None);
213 }
214
215 // Look for `#![doc(test(no_crate_inject))]`, used by crates in the std facade.
216 fn scrape_test_config(attrs: &[ast::Attribute]) -> GlobalTestOptions {
217     use rustc_ast_pretty::pprust;
218
219     let mut opts = GlobalTestOptions { no_crate_inject: false, attrs: Vec::new() };
220
221     let test_attrs: Vec<_> = attrs
222         .iter()
223         .filter(|a| a.has_name(sym::doc))
224         .flat_map(|a| a.meta_item_list().unwrap_or_else(Vec::new))
225         .filter(|a| a.has_name(sym::test))
226         .collect();
227     let attrs = test_attrs.iter().flat_map(|a| a.meta_item_list().unwrap_or(&[]));
228
229     for attr in attrs {
230         if attr.has_name(sym::no_crate_inject) {
231             opts.no_crate_inject = true;
232         }
233         if attr.has_name(sym::attr) {
234             if let Some(l) = attr.meta_item_list() {
235                 for item in l {
236                     opts.attrs.push(pprust::meta_list_item_to_string(item));
237                 }
238             }
239         }
240     }
241
242     opts
243 }
244
245 /// Documentation test failure modes.
246 enum TestFailure {
247     /// The test failed to compile.
248     CompileError,
249     /// The test is marked `compile_fail` but compiled successfully.
250     UnexpectedCompilePass,
251     /// The test failed to compile (as expected) but the compiler output did not contain all
252     /// expected error codes.
253     MissingErrorCodes(Vec<String>),
254     /// The test binary was unable to be executed.
255     ExecutionError(io::Error),
256     /// The test binary exited with a non-zero exit code.
257     ///
258     /// This typically means an assertion in the test failed or another form of panic occurred.
259     ExecutionFailure(process::Output),
260     /// The test is marked `should_panic` but the test binary executed successfully.
261     UnexpectedRunPass,
262 }
263
264 enum DirState {
265     Temp(tempfile::TempDir),
266     Perm(PathBuf),
267 }
268
269 impl DirState {
270     fn path(&self) -> &std::path::Path {
271         match self {
272             DirState::Temp(t) => t.path(),
273             DirState::Perm(p) => p.as_path(),
274         }
275     }
276 }
277
278 // NOTE: Keep this in sync with the equivalent structs in rustc
279 // and cargo.
280 // We could unify this struct the one in rustc but they have different
281 // ownership semantics, so doing so would create wasteful allocations.
282 #[derive(serde::Serialize, serde::Deserialize)]
283 struct UnusedExterns {
284     /// Lint level of the unused_crate_dependencies lint
285     lint_level: String,
286     /// List of unused externs by their names.
287     unused_extern_names: Vec<String>,
288 }
289
290 fn run_test(
291     test: &str,
292     crate_name: &str,
293     line: usize,
294     rustdoc_options: RustdocOptions,
295     mut lang_string: LangString,
296     no_run: bool,
297     runtool: Option<String>,
298     runtool_args: Vec<String>,
299     target: TargetTriple,
300     opts: &GlobalTestOptions,
301     edition: Edition,
302     outdir: DirState,
303     path: PathBuf,
304     test_id: &str,
305     report_unused_externs: impl Fn(UnusedExterns),
306 ) -> Result<(), TestFailure> {
307     let (test, line_offset, supports_color) =
308         make_test(test, Some(crate_name), lang_string.test_harness, opts, edition, Some(test_id));
309
310     let output_file = outdir.path().join("rust_out");
311
312     let rustc_binary = rustdoc_options
313         .test_builder
314         .as_deref()
315         .unwrap_or_else(|| rustc_interface::util::rustc_path().expect("found rustc"));
316     let mut compiler = Command::new(&rustc_binary);
317     compiler.arg("--crate-type").arg("bin");
318     for cfg in &rustdoc_options.cfgs {
319         compiler.arg("--cfg").arg(&cfg);
320     }
321     if !rustdoc_options.check_cfgs.is_empty() {
322         compiler.arg("-Z").arg("unstable-options");
323         for check_cfg in &rustdoc_options.check_cfgs {
324             compiler.arg("--check-cfg").arg(&check_cfg);
325         }
326     }
327     if let Some(sysroot) = rustdoc_options.maybe_sysroot {
328         compiler.arg("--sysroot").arg(sysroot);
329     }
330     compiler.arg("--edition").arg(&edition.to_string());
331     compiler.env("UNSTABLE_RUSTDOC_TEST_PATH", path);
332     compiler.env("UNSTABLE_RUSTDOC_TEST_LINE", format!("{}", line as isize - line_offset as isize));
333     compiler.arg("-o").arg(&output_file);
334     if lang_string.test_harness {
335         compiler.arg("--test");
336     }
337     if rustdoc_options.json_unused_externs && !lang_string.compile_fail {
338         compiler.arg("--error-format=json");
339         compiler.arg("--json").arg("unused-externs");
340         compiler.arg("-Z").arg("unstable-options");
341         compiler.arg("-W").arg("unused_crate_dependencies");
342     }
343     for lib_str in &rustdoc_options.lib_strs {
344         compiler.arg("-L").arg(&lib_str);
345     }
346     for extern_str in &rustdoc_options.extern_strs {
347         compiler.arg("--extern").arg(&extern_str);
348     }
349     compiler.arg("-Ccodegen-units=1");
350     for codegen_options_str in &rustdoc_options.codegen_options_strs {
351         compiler.arg("-C").arg(&codegen_options_str);
352     }
353     for debugging_option_str in &rustdoc_options.debugging_opts_strs {
354         compiler.arg("-Z").arg(&debugging_option_str);
355     }
356     if no_run && !lang_string.compile_fail && rustdoc_options.persist_doctests.is_none() {
357         compiler.arg("--emit=metadata");
358     }
359     compiler.arg("--target").arg(match target {
360         TargetTriple::TargetTriple(s) => s,
361         TargetTriple::TargetPath(path) => {
362             path.to_str().expect("target path must be valid unicode").to_string()
363         }
364     });
365     if let ErrorOutputType::HumanReadable(kind) = rustdoc_options.error_format {
366         let (short, color_config) = kind.unzip();
367
368         if short {
369             compiler.arg("--error-format").arg("short");
370         }
371
372         match color_config {
373             ColorConfig::Never => {
374                 compiler.arg("--color").arg("never");
375             }
376             ColorConfig::Always => {
377                 compiler.arg("--color").arg("always");
378             }
379             ColorConfig::Auto => {
380                 compiler.arg("--color").arg(if supports_color { "always" } else { "never" });
381             }
382         }
383     }
384
385     compiler.arg("-");
386     compiler.stdin(Stdio::piped());
387     compiler.stderr(Stdio::piped());
388
389     let mut child = compiler.spawn().expect("Failed to spawn rustc process");
390     {
391         let stdin = child.stdin.as_mut().expect("Failed to open stdin");
392         stdin.write_all(test.as_bytes()).expect("could write out test sources");
393     }
394     let output = child.wait_with_output().expect("Failed to read stdout");
395
396     struct Bomb<'a>(&'a str);
397     impl Drop for Bomb<'_> {
398         fn drop(&mut self) {
399             eprint!("{}", self.0);
400         }
401     }
402     let mut out_lines = str::from_utf8(&output.stderr)
403         .unwrap()
404         .lines()
405         .filter(|l| {
406             if let Ok(uext) = serde_json::from_str::<UnusedExterns>(l) {
407                 report_unused_externs(uext);
408                 false
409             } else {
410                 true
411             }
412         })
413         .collect::<Vec<_>>();
414
415     // Add a \n to the end to properly terminate the last line,
416     // but only if there was output to be printed
417     if !out_lines.is_empty() {
418         out_lines.push("");
419     }
420
421     let out = out_lines.join("\n");
422     let _bomb = Bomb(&out);
423     match (output.status.success(), lang_string.compile_fail) {
424         (true, true) => {
425             return Err(TestFailure::UnexpectedCompilePass);
426         }
427         (true, false) => {}
428         (false, true) => {
429             if !lang_string.error_codes.is_empty() {
430                 // We used to check if the output contained "error[{}]: " but since we added the
431                 // colored output, we can't anymore because of the color escape characters before
432                 // the ":".
433                 lang_string.error_codes.retain(|err| !out.contains(&format!("error[{err}]")));
434
435                 if !lang_string.error_codes.is_empty() {
436                     return Err(TestFailure::MissingErrorCodes(lang_string.error_codes));
437                 }
438             }
439         }
440         (false, false) => {
441             return Err(TestFailure::CompileError);
442         }
443     }
444
445     if no_run {
446         return Ok(());
447     }
448
449     // Run the code!
450     let mut cmd;
451
452     if let Some(tool) = runtool {
453         cmd = Command::new(tool);
454         cmd.args(runtool_args);
455         cmd.arg(output_file);
456     } else {
457         cmd = Command::new(output_file);
458     }
459     if let Some(run_directory) = rustdoc_options.test_run_directory {
460         cmd.current_dir(run_directory);
461     }
462
463     let result = if rustdoc_options.nocapture {
464         cmd.status().map(|status| process::Output {
465             status,
466             stdout: Vec::new(),
467             stderr: Vec::new(),
468         })
469     } else {
470         cmd.output()
471     };
472     match result {
473         Err(e) => return Err(TestFailure::ExecutionError(e)),
474         Ok(out) => {
475             if lang_string.should_panic && out.status.success() {
476                 return Err(TestFailure::UnexpectedRunPass);
477             } else if !lang_string.should_panic && !out.status.success() {
478                 return Err(TestFailure::ExecutionFailure(out));
479             }
480         }
481     }
482
483     Ok(())
484 }
485
486 /// Transforms a test into code that can be compiled into a Rust binary, and returns the number of
487 /// lines before the test code begins as well as if the output stream supports colors or not.
488 crate fn make_test(
489     s: &str,
490     crate_name: Option<&str>,
491     dont_insert_main: bool,
492     opts: &GlobalTestOptions,
493     edition: Edition,
494     test_id: Option<&str>,
495 ) -> (String, usize, bool) {
496     let (crate_attrs, everything_else, crates) = partition_source(s);
497     let everything_else = everything_else.trim();
498     let mut line_offset = 0;
499     let mut prog = String::new();
500     let mut supports_color = false;
501
502     if opts.attrs.is_empty() {
503         // If there aren't any attributes supplied by #![doc(test(attr(...)))], then allow some
504         // lints that are commonly triggered in doctests. The crate-level test attributes are
505         // commonly used to make tests fail in case they trigger warnings, so having this there in
506         // that case may cause some tests to pass when they shouldn't have.
507         prog.push_str("#![allow(unused)]\n");
508         line_offset += 1;
509     }
510
511     // Next, any attributes that came from the crate root via #![doc(test(attr(...)))].
512     for attr in &opts.attrs {
513         prog.push_str(&format!("#![{attr}]\n"));
514         line_offset += 1;
515     }
516
517     // Now push any outer attributes from the example, assuming they
518     // are intended to be crate attributes.
519     prog.push_str(&crate_attrs);
520     prog.push_str(&crates);
521
522     // Uses librustc_ast to parse the doctest and find if there's a main fn and the extern
523     // crate already is included.
524     let result = rustc_driver::catch_fatal_errors(|| {
525         rustc_span::create_session_if_not_set_then(edition, |_| {
526             use rustc_errors::emitter::{Emitter, EmitterWriter};
527             use rustc_errors::Handler;
528             use rustc_parse::maybe_new_parser_from_source_str;
529             use rustc_parse::parser::ForceCollect;
530             use rustc_session::parse::ParseSess;
531             use rustc_span::source_map::FilePathMapping;
532
533             let filename = FileName::anon_source_code(s);
534             let source = crates + everything_else;
535
536             // Any errors in parsing should also appear when the doctest is compiled for real, so just
537             // send all the errors that librustc_ast emits directly into a `Sink` instead of stderr.
538             let sm = Lrc::new(SourceMap::new(FilePathMapping::empty()));
539             supports_color =
540                 EmitterWriter::stderr(ColorConfig::Auto, None, false, false, Some(80), false)
541                     .supports_color();
542
543             let emitter =
544                 EmitterWriter::new(box io::sink(), None, false, false, false, None, false);
545
546             // FIXME(misdreavus): pass `-Z treat-err-as-bug` to the doctest parser
547             let handler = Handler::with_emitter(false, None, box emitter);
548             let sess = ParseSess::with_span_handler(handler, sm);
549
550             let mut found_main = false;
551             let mut found_extern_crate = crate_name.is_none();
552             let mut found_macro = false;
553
554             let mut parser = match maybe_new_parser_from_source_str(&sess, filename, source) {
555                 Ok(p) => p,
556                 Err(errs) => {
557                     drop(errs);
558                     return (found_main, found_extern_crate, found_macro);
559                 }
560             };
561
562             loop {
563                 match parser.parse_item(ForceCollect::No) {
564                     Ok(Some(item)) => {
565                         if !found_main {
566                             if let ast::ItemKind::Fn(..) = item.kind {
567                                 if item.ident.name == sym::main {
568                                     found_main = true;
569                                 }
570                             }
571                         }
572
573                         if !found_extern_crate {
574                             if let ast::ItemKind::ExternCrate(original) = item.kind {
575                                 // This code will never be reached if `crate_name` is none because
576                                 // `found_extern_crate` is initialized to `true` if it is none.
577                                 let crate_name = crate_name.unwrap();
578
579                                 match original {
580                                     Some(name) => found_extern_crate = name.as_str() == crate_name,
581                                     None => found_extern_crate = item.ident.as_str() == crate_name,
582                                 }
583                             }
584                         }
585
586                         if !found_macro {
587                             if let ast::ItemKind::MacCall(..) = item.kind {
588                                 found_macro = true;
589                             }
590                         }
591
592                         if found_main && found_extern_crate {
593                             break;
594                         }
595                     }
596                     Ok(None) => break,
597                     Err(e) => {
598                         e.cancel();
599                         break;
600                     }
601                 }
602
603                 // The supplied slice is only used for diagnostics,
604                 // which are swallowed here anyway.
605                 parser.maybe_consume_incorrect_semicolon(&[]);
606             }
607
608             // Reset errors so that they won't be reported as compiler bugs when dropping the
609             // handler. Any errors in the tests will be reported when the test file is compiled,
610             // Note that we still need to cancel the errors above otherwise `DiagnosticBuilder`
611             // will panic on drop.
612             sess.span_diagnostic.reset_err_count();
613
614             (found_main, found_extern_crate, found_macro)
615         })
616     });
617     let (already_has_main, already_has_extern_crate, found_macro) = match result {
618         Ok(result) => result,
619         Err(ErrorGuaranteed) => {
620             // If the parser panicked due to a fatal error, pass the test code through unchanged.
621             // The error will be reported during compilation.
622             return (s.to_owned(), 0, false);
623         }
624     };
625
626     // If a doctest's `fn main` is being masked by a wrapper macro, the parsing loop above won't
627     // see it. In that case, run the old text-based scan to see if they at least have a main
628     // function written inside a macro invocation. See
629     // https://github.com/rust-lang/rust/issues/56898
630     let already_has_main = if found_macro && !already_has_main {
631         s.lines()
632             .map(|line| {
633                 let comment = line.find("//");
634                 if let Some(comment_begins) = comment { &line[0..comment_begins] } else { line }
635             })
636             .any(|code| code.contains("fn main"))
637     } else {
638         already_has_main
639     };
640
641     // Don't inject `extern crate std` because it's already injected by the
642     // compiler.
643     if !already_has_extern_crate && !opts.no_crate_inject && crate_name != Some("std") {
644         if let Some(crate_name) = crate_name {
645             // Don't inject `extern crate` if the crate is never used.
646             // NOTE: this is terribly inaccurate because it doesn't actually
647             // parse the source, but only has false positives, not false
648             // negatives.
649             if s.contains(crate_name) {
650                 prog.push_str(&format!("extern crate r#{crate_name};\n"));
651                 line_offset += 1;
652             }
653         }
654     }
655
656     // FIXME: This code cannot yet handle no_std test cases yet
657     if dont_insert_main || already_has_main || prog.contains("![no_std]") {
658         prog.push_str(everything_else);
659     } else {
660         let returns_result = everything_else.trim_end().ends_with("(())");
661         // Give each doctest main function a unique name.
662         // This is for example needed for the tooling around `-C instrument-coverage`.
663         let inner_fn_name = if let Some(test_id) = test_id {
664             format!("_doctest_main_{test_id}")
665         } else {
666             "_inner".into()
667         };
668         let inner_attr = if test_id.is_some() { "#[allow(non_snake_case)] " } else { "" };
669         let (main_pre, main_post) = if returns_result {
670             (
671                 format!(
672                     "fn main() {{ {inner_attr}fn {inner_fn_name}() -> Result<(), impl core::fmt::Debug> {{\n",
673                 ),
674                 format!("\n}} {inner_fn_name}().unwrap() }}"),
675             )
676         } else if test_id.is_some() {
677             (
678                 format!("fn main() {{ {inner_attr}fn {inner_fn_name}() {{\n",),
679                 format!("\n}} {inner_fn_name}() }}"),
680             )
681         } else {
682             ("fn main() {\n".into(), "\n}".into())
683         };
684         // Note on newlines: We insert a line/newline *before*, and *after*
685         // the doctest and adjust the `line_offset` accordingly.
686         // In the case of `-C instrument-coverage`, this means that the generated
687         // inner `main` function spans from the doctest opening codeblock to the
688         // closing one. For example
689         // /// ``` <- start of the inner main
690         // /// <- code under doctest
691         // /// ``` <- end of the inner main
692         line_offset += 1;
693
694         prog.extend([&main_pre, everything_else, &main_post].iter().cloned());
695     }
696
697     debug!("final doctest:\n{prog}");
698
699     (prog, line_offset, supports_color)
700 }
701
702 // FIXME(aburka): use a real parser to deal with multiline attributes
703 fn partition_source(s: &str) -> (String, String, String) {
704     #[derive(Copy, Clone, PartialEq)]
705     enum PartitionState {
706         Attrs,
707         Crates,
708         Other,
709     }
710     let mut state = PartitionState::Attrs;
711     let mut before = String::new();
712     let mut crates = String::new();
713     let mut after = String::new();
714
715     for line in s.lines() {
716         let trimline = line.trim();
717
718         // FIXME(misdreavus): if a doc comment is placed on an extern crate statement, it will be
719         // shunted into "everything else"
720         match state {
721             PartitionState::Attrs => {
722                 state = if trimline.starts_with("#![")
723                     || trimline.chars().all(|c| c.is_whitespace())
724                     || (trimline.starts_with("//") && !trimline.starts_with("///"))
725                 {
726                     PartitionState::Attrs
727                 } else if trimline.starts_with("extern crate")
728                     || trimline.starts_with("#[macro_use] extern crate")
729                 {
730                     PartitionState::Crates
731                 } else {
732                     PartitionState::Other
733                 };
734             }
735             PartitionState::Crates => {
736                 state = if trimline.starts_with("extern crate")
737                     || trimline.starts_with("#[macro_use] extern crate")
738                     || trimline.chars().all(|c| c.is_whitespace())
739                     || (trimline.starts_with("//") && !trimline.starts_with("///"))
740                 {
741                     PartitionState::Crates
742                 } else {
743                     PartitionState::Other
744                 };
745             }
746             PartitionState::Other => {}
747         }
748
749         match state {
750             PartitionState::Attrs => {
751                 before.push_str(line);
752                 before.push('\n');
753             }
754             PartitionState::Crates => {
755                 crates.push_str(line);
756                 crates.push('\n');
757             }
758             PartitionState::Other => {
759                 after.push_str(line);
760                 after.push('\n');
761             }
762         }
763     }
764
765     debug!("before:\n{before}");
766     debug!("crates:\n{crates}");
767     debug!("after:\n{after}");
768
769     (before, after, crates)
770 }
771
772 crate trait Tester {
773     fn add_test(&mut self, test: String, config: LangString, line: usize);
774     fn get_line(&self) -> usize {
775         0
776     }
777     fn register_header(&mut self, _name: &str, _level: u32) {}
778 }
779
780 crate struct Collector {
781     crate tests: Vec<test::TestDescAndFn>,
782
783     // The name of the test displayed to the user, separated by `::`.
784     //
785     // In tests from Rust source, this is the path to the item
786     // e.g., `["std", "vec", "Vec", "push"]`.
787     //
788     // In tests from a markdown file, this is the titles of all headers (h1~h6)
789     // of the sections that contain the code block, e.g., if the markdown file is
790     // written as:
791     //
792     // ``````markdown
793     // # Title
794     //
795     // ## Subtitle
796     //
797     // ```rust
798     // assert!(true);
799     // ```
800     // ``````
801     //
802     // the `names` vector of that test will be `["Title", "Subtitle"]`.
803     names: Vec<String>,
804
805     rustdoc_options: RustdocOptions,
806     use_headers: bool,
807     enable_per_target_ignores: bool,
808     crate_name: Symbol,
809     opts: GlobalTestOptions,
810     position: Span,
811     source_map: Option<Lrc<SourceMap>>,
812     filename: Option<PathBuf>,
813     visited_tests: FxHashMap<(String, usize), usize>,
814     unused_extern_reports: Arc<Mutex<Vec<UnusedExterns>>>,
815     compiling_test_count: AtomicUsize,
816 }
817
818 impl Collector {
819     crate fn new(
820         crate_name: Symbol,
821         rustdoc_options: RustdocOptions,
822         use_headers: bool,
823         opts: GlobalTestOptions,
824         source_map: Option<Lrc<SourceMap>>,
825         filename: Option<PathBuf>,
826         enable_per_target_ignores: bool,
827     ) -> Collector {
828         Collector {
829             tests: Vec::new(),
830             names: Vec::new(),
831             rustdoc_options,
832             use_headers,
833             enable_per_target_ignores,
834             crate_name,
835             opts,
836             position: DUMMY_SP,
837             source_map,
838             filename,
839             visited_tests: FxHashMap::default(),
840             unused_extern_reports: Default::default(),
841             compiling_test_count: AtomicUsize::new(0),
842         }
843     }
844
845     fn generate_name(&self, line: usize, filename: &FileName) -> String {
846         let mut item_path = self.names.join("::");
847         item_path.retain(|c| c != ' ');
848         if !item_path.is_empty() {
849             item_path.push(' ');
850         }
851         format!("{} - {}(line {})", filename.prefer_local(), item_path, line)
852     }
853
854     crate fn set_position(&mut self, position: Span) {
855         self.position = position;
856     }
857
858     fn get_filename(&self) -> FileName {
859         if let Some(ref source_map) = self.source_map {
860             let filename = source_map.span_to_filename(self.position);
861             if let FileName::Real(ref filename) = filename {
862                 if let Ok(cur_dir) = env::current_dir() {
863                     if let Some(local_path) = filename.local_path() {
864                         if let Ok(path) = local_path.strip_prefix(&cur_dir) {
865                             return path.to_owned().into();
866                         }
867                     }
868                 }
869             }
870             filename
871         } else if let Some(ref filename) = self.filename {
872             filename.clone().into()
873         } else {
874             FileName::Custom("input".to_owned())
875         }
876     }
877 }
878
879 impl Tester for Collector {
880     fn add_test(&mut self, test: String, config: LangString, line: usize) {
881         let filename = self.get_filename();
882         let name = self.generate_name(line, &filename);
883         let crate_name = self.crate_name.to_string();
884         let opts = self.opts.clone();
885         let edition = config.edition.unwrap_or(self.rustdoc_options.edition);
886         let rustdoc_options = self.rustdoc_options.clone();
887         let runtool = self.rustdoc_options.runtool.clone();
888         let runtool_args = self.rustdoc_options.runtool_args.clone();
889         let target = self.rustdoc_options.target.clone();
890         let target_str = target.to_string();
891         let unused_externs = self.unused_extern_reports.clone();
892         let no_run = config.no_run || rustdoc_options.no_run;
893         if !config.compile_fail {
894             self.compiling_test_count.fetch_add(1, Ordering::SeqCst);
895         }
896
897         let path = match &filename {
898             FileName::Real(path) => {
899                 if let Some(local_path) = path.local_path() {
900                     local_path.to_path_buf()
901                 } else {
902                     // Somehow we got the filename from the metadata of another crate, should never happen
903                     unreachable!("doctest from a different crate");
904                 }
905             }
906             _ => PathBuf::from(r"doctest.rs"),
907         };
908
909         // For example `module/file.rs` would become `module_file_rs`
910         let file = filename
911             .prefer_local()
912             .to_string_lossy()
913             .chars()
914             .map(|c| if c.is_ascii_alphanumeric() { c } else { '_' })
915             .collect::<String>();
916         let test_id = format!(
917             "{file}_{line}_{number}",
918             file = file,
919             line = line,
920             number = {
921                 // Increases the current test number, if this file already
922                 // exists or it creates a new entry with a test number of 0.
923                 self.visited_tests.entry((file.clone(), line)).and_modify(|v| *v += 1).or_insert(0)
924             },
925         );
926         let outdir = if let Some(mut path) = rustdoc_options.persist_doctests.clone() {
927             path.push(&test_id);
928
929             std::fs::create_dir_all(&path)
930                 .expect("Couldn't create directory for doctest executables");
931
932             DirState::Perm(path)
933         } else {
934             DirState::Temp(
935                 TempFileBuilder::new()
936                     .prefix("rustdoctest")
937                     .tempdir()
938                     .expect("rustdoc needs a tempdir"),
939             )
940         };
941
942         debug!("creating test {name}: {test}");
943         self.tests.push(test::TestDescAndFn {
944             desc: test::TestDesc {
945                 name: test::DynTestName(name),
946                 ignore: match config.ignore {
947                     Ignore::All => true,
948                     Ignore::None => false,
949                     Ignore::Some(ref ignores) => ignores.iter().any(|s| target_str.contains(s)),
950                 },
951                 #[cfg(not(bootstrap))]
952                 ignore_message: None,
953                 // compiler failures are test failures
954                 should_panic: test::ShouldPanic::No,
955                 compile_fail: config.compile_fail,
956                 no_run,
957                 test_type: test::TestType::DocTest,
958             },
959             testfn: test::DynTestFn(box move || {
960                 let report_unused_externs = |uext| {
961                     unused_externs.lock().unwrap().push(uext);
962                 };
963                 let res = run_test(
964                     &test,
965                     &crate_name,
966                     line,
967                     rustdoc_options,
968                     config,
969                     no_run,
970                     runtool,
971                     runtool_args,
972                     target,
973                     &opts,
974                     edition,
975                     outdir,
976                     path,
977                     &test_id,
978                     report_unused_externs,
979                 );
980
981                 if let Err(err) = res {
982                     match err {
983                         TestFailure::CompileError => {
984                             eprint!("Couldn't compile the test.");
985                         }
986                         TestFailure::UnexpectedCompilePass => {
987                             eprint!("Test compiled successfully, but it's marked `compile_fail`.");
988                         }
989                         TestFailure::UnexpectedRunPass => {
990                             eprint!("Test executable succeeded, but it's marked `should_panic`.");
991                         }
992                         TestFailure::MissingErrorCodes(codes) => {
993                             eprint!("Some expected error codes were not found: {:?}", codes);
994                         }
995                         TestFailure::ExecutionError(err) => {
996                             eprint!("Couldn't run the test: {err}");
997                             if err.kind() == io::ErrorKind::PermissionDenied {
998                                 eprint!(" - maybe your tempdir is mounted with noexec?");
999                             }
1000                         }
1001                         TestFailure::ExecutionFailure(out) => {
1002                             let reason = if let Some(code) = out.status.code() {
1003                                 format!("exit code {code}")
1004                             } else {
1005                                 String::from("terminated by signal")
1006                             };
1007
1008                             eprintln!("Test executable failed ({reason}).");
1009
1010                             // FIXME(#12309): An unfortunate side-effect of capturing the test
1011                             // executable's output is that the relative ordering between the test's
1012                             // stdout and stderr is lost. However, this is better than the
1013                             // alternative: if the test executable inherited the parent's I/O
1014                             // handles the output wouldn't be captured at all, even on success.
1015                             //
1016                             // The ordering could be preserved if the test process' stderr was
1017                             // redirected to stdout, but that functionality does not exist in the
1018                             // standard library, so it may not be portable enough.
1019                             let stdout = str::from_utf8(&out.stdout).unwrap_or_default();
1020                             let stderr = str::from_utf8(&out.stderr).unwrap_or_default();
1021
1022                             if !stdout.is_empty() || !stderr.is_empty() {
1023                                 eprintln!();
1024
1025                                 if !stdout.is_empty() {
1026                                     eprintln!("stdout:\n{stdout}");
1027                                 }
1028
1029                                 if !stderr.is_empty() {
1030                                     eprintln!("stderr:\n{stderr}");
1031                                 }
1032                             }
1033                         }
1034                     }
1035
1036                     panic::resume_unwind(box ());
1037                 }
1038             }),
1039         });
1040     }
1041
1042     fn get_line(&self) -> usize {
1043         if let Some(ref source_map) = self.source_map {
1044             let line = self.position.lo().to_usize();
1045             let line = source_map.lookup_char_pos(BytePos(line as u32)).line;
1046             if line > 0 { line - 1 } else { line }
1047         } else {
1048             0
1049         }
1050     }
1051
1052     fn register_header(&mut self, name: &str, level: u32) {
1053         if self.use_headers {
1054             // We use these headings as test names, so it's good if
1055             // they're valid identifiers.
1056             let name = name
1057                 .chars()
1058                 .enumerate()
1059                 .map(|(i, c)| {
1060                     if (i == 0 && rustc_lexer::is_id_start(c))
1061                         || (i != 0 && rustc_lexer::is_id_continue(c))
1062                     {
1063                         c
1064                     } else {
1065                         '_'
1066                     }
1067                 })
1068                 .collect::<String>();
1069
1070             // Here we try to efficiently assemble the header titles into the
1071             // test name in the form of `h1::h2::h3::h4::h5::h6`.
1072             //
1073             // Suppose that originally `self.names` contains `[h1, h2, h3]`...
1074             let level = level as usize;
1075             if level <= self.names.len() {
1076                 // ... Consider `level == 2`. All headers in the lower levels
1077                 // are irrelevant in this new level. So we should reset
1078                 // `self.names` to contain headers until <h2>, and replace that
1079                 // slot with the new name: `[h1, name]`.
1080                 self.names.truncate(level);
1081                 self.names[level - 1] = name;
1082             } else {
1083                 // ... On the other hand, consider `level == 5`. This means we
1084                 // need to extend `self.names` to contain five headers. We fill
1085                 // in the missing level (<h4>) with `_`. Thus `self.names` will
1086                 // become `[h1, h2, h3, "_", name]`.
1087                 if level - 1 > self.names.len() {
1088                     self.names.resize(level - 1, "_".to_owned());
1089                 }
1090                 self.names.push(name);
1091             }
1092         }
1093     }
1094 }
1095
1096 struct HirCollector<'a, 'hir, 'tcx> {
1097     sess: &'a Session,
1098     collector: &'a mut Collector,
1099     map: Map<'hir>,
1100     codes: ErrorCodes,
1101     tcx: TyCtxt<'tcx>,
1102 }
1103
1104 impl<'a, 'hir, 'tcx> HirCollector<'a, 'hir, 'tcx> {
1105     fn visit_testable<F: FnOnce(&mut Self)>(
1106         &mut self,
1107         name: String,
1108         hir_id: HirId,
1109         sp: Span,
1110         nested: F,
1111     ) {
1112         let ast_attrs = self.tcx.hir().attrs(hir_id);
1113         let mut attrs = Attributes::from_ast(ast_attrs, None);
1114
1115         if let Some(ref cfg) = ast_attrs.cfg(self.tcx, &FxHashSet::default()) {
1116             if !cfg.matches(&self.sess.parse_sess, Some(self.sess.features_untracked())) {
1117                 return;
1118             }
1119         }
1120
1121         let has_name = !name.is_empty();
1122         if has_name {
1123             self.collector.names.push(name);
1124         }
1125
1126         attrs.unindent_doc_comments();
1127         // The collapse-docs pass won't combine sugared/raw doc attributes, or included files with
1128         // anything else, this will combine them for us.
1129         if let Some(doc) = attrs.collapsed_doc_value() {
1130             // Use the outermost invocation, so that doctest names come from where the docs were written.
1131             let span = ast_attrs
1132                 .span()
1133                 .map(|span| span.ctxt().outer_expn().expansion_cause().unwrap_or(span))
1134                 .unwrap_or(DUMMY_SP);
1135             self.collector.set_position(span);
1136             markdown::find_testable_code(
1137                 &doc,
1138                 self.collector,
1139                 self.codes,
1140                 self.collector.enable_per_target_ignores,
1141                 Some(&crate::html::markdown::ExtraInfo::new(
1142                     self.tcx,
1143                     hir_id,
1144                     span_of_attrs(&attrs).unwrap_or(sp),
1145                 )),
1146             );
1147         }
1148
1149         nested(self);
1150
1151         if has_name {
1152             self.collector.names.pop();
1153         }
1154     }
1155 }
1156
1157 impl<'a, 'hir, 'tcx> intravisit::Visitor<'hir> for HirCollector<'a, 'hir, 'tcx> {
1158     type NestedFilter = nested_filter::All;
1159
1160     fn nested_visit_map(&mut self) -> Self::Map {
1161         self.map
1162     }
1163
1164     fn visit_item(&mut self, item: &'hir hir::Item<'_>) {
1165         let name = match &item.kind {
1166             hir::ItemKind::Macro(ref macro_def, _) => {
1167                 // FIXME(#88038): Non exported macros have historically not been tested,
1168                 // but we really ought to start testing them.
1169                 let def_id = item.def_id.to_def_id();
1170                 if macro_def.macro_rules && !self.tcx.has_attr(def_id, sym::macro_export) {
1171                     intravisit::walk_item(self, item);
1172                     return;
1173                 }
1174                 item.ident.to_string()
1175             }
1176             hir::ItemKind::Impl(impl_) => {
1177                 rustc_hir_pretty::id_to_string(&self.map, impl_.self_ty.hir_id)
1178             }
1179             _ => item.ident.to_string(),
1180         };
1181
1182         self.visit_testable(name, item.hir_id(), item.span, |this| {
1183             intravisit::walk_item(this, item);
1184         });
1185     }
1186
1187     fn visit_trait_item(&mut self, item: &'hir hir::TraitItem<'_>) {
1188         self.visit_testable(item.ident.to_string(), item.hir_id(), item.span, |this| {
1189             intravisit::walk_trait_item(this, item);
1190         });
1191     }
1192
1193     fn visit_impl_item(&mut self, item: &'hir hir::ImplItem<'_>) {
1194         self.visit_testable(item.ident.to_string(), item.hir_id(), item.span, |this| {
1195             intravisit::walk_impl_item(this, item);
1196         });
1197     }
1198
1199     fn visit_foreign_item(&mut self, item: &'hir hir::ForeignItem<'_>) {
1200         self.visit_testable(item.ident.to_string(), item.hir_id(), item.span, |this| {
1201             intravisit::walk_foreign_item(this, item);
1202         });
1203     }
1204
1205     fn visit_variant(
1206         &mut self,
1207         v: &'hir hir::Variant<'_>,
1208         g: &'hir hir::Generics<'_>,
1209         item_id: hir::HirId,
1210     ) {
1211         self.visit_testable(v.ident.to_string(), v.id, v.span, |this| {
1212             intravisit::walk_variant(this, v, g, item_id);
1213         });
1214     }
1215
1216     fn visit_field_def(&mut self, f: &'hir hir::FieldDef<'_>) {
1217         self.visit_testable(f.ident.to_string(), f.hir_id, f.span, |this| {
1218             intravisit::walk_field_def(this, f);
1219         });
1220     }
1221 }
1222
1223 #[cfg(test)]
1224 mod tests;