]> git.lizzy.rs Git - rust.git/blob - compiler/rustc_middle/src/mir/pretty.rs
Auto merge of #96002 - nnethercote:speed-up-Vec-clear-2, r=m-ou-se
[rust.git] / compiler / rustc_middle / src / mir / pretty.rs
1 use std::collections::BTreeSet;
2 use std::fmt::Display;
3 use std::fmt::Write as _;
4 use std::fs;
5 use std::io::{self, Write};
6 use std::path::{Path, PathBuf};
7
8 use super::graphviz::write_mir_fn_graphviz;
9 use super::spanview::write_mir_fn_spanview;
10 use either::Either;
11 use rustc_data_structures::fx::FxHashMap;
12 use rustc_hir::def_id::DefId;
13 use rustc_index::vec::Idx;
14 use rustc_middle::mir::interpret::{
15     read_target_uint, AllocId, Allocation, ConstAllocation, ConstValue, GlobalAlloc, Pointer,
16     Provenance,
17 };
18 use rustc_middle::mir::visit::Visitor;
19 use rustc_middle::mir::MirSource;
20 use rustc_middle::mir::*;
21 use rustc_middle::ty::{self, TyCtxt};
22 use rustc_target::abi::Size;
23
24 const INDENT: &str = "    ";
25 /// Alignment for lining up comments following MIR statements
26 pub(crate) const ALIGN: usize = 40;
27
28 /// An indication of where we are in the control flow graph. Used for printing
29 /// extra information in `dump_mir`
30 pub enum PassWhere {
31     /// We have not started dumping the control flow graph, but we are about to.
32     BeforeCFG,
33
34     /// We just finished dumping the control flow graph. This is right before EOF
35     AfterCFG,
36
37     /// We are about to start dumping the given basic block.
38     BeforeBlock(BasicBlock),
39
40     /// We are just about to dump the given statement or terminator.
41     BeforeLocation(Location),
42
43     /// We just dumped the given statement or terminator.
44     AfterLocation(Location),
45
46     /// We just dumped the terminator for a block but not the closing `}`.
47     AfterTerminator(BasicBlock),
48 }
49
50 /// If the session is properly configured, dumps a human-readable
51 /// representation of the mir into:
52 ///
53 /// ```text
54 /// rustc.node<node_id>.<pass_num>.<pass_name>.<disambiguator>
55 /// ```
56 ///
57 /// Output from this function is controlled by passing `-Z dump-mir=<filter>`,
58 /// where `<filter>` takes the following forms:
59 ///
60 /// - `all` -- dump MIR for all fns, all passes, all everything
61 /// - a filter defined by a set of substrings combined with `&` and `|`
62 ///   (`&` has higher precedence). At least one of the `|`-separated groups
63 ///   must match; an `|`-separated group matches if all of its `&`-separated
64 ///   substrings are matched.
65 ///
66 /// Example:
67 ///
68 /// - `nll` == match if `nll` appears in the name
69 /// - `foo & nll` == match if `foo` and `nll` both appear in the name
70 /// - `foo & nll | typeck` == match if `foo` and `nll` both appear in the name
71 ///   or `typeck` appears in the name.
72 /// - `foo & nll | bar & typeck` == match if `foo` and `nll` both appear in the name
73 ///   or `typeck` and `bar` both appear in the name.
74 #[inline]
75 pub fn dump_mir<'tcx, F>(
76     tcx: TyCtxt<'tcx>,
77     pass_num: Option<&dyn Display>,
78     pass_name: &str,
79     disambiguator: &dyn Display,
80     body: &Body<'tcx>,
81     extra_data: F,
82 ) where
83     F: FnMut(PassWhere, &mut dyn Write) -> io::Result<()>,
84 {
85     if !dump_enabled(tcx, pass_name, body.source.def_id()) {
86         return;
87     }
88
89     dump_matched_mir_node(tcx, pass_num, pass_name, disambiguator, body, extra_data);
90 }
91
92 pub fn dump_enabled<'tcx>(tcx: TyCtxt<'tcx>, pass_name: &str, def_id: DefId) -> bool {
93     let Some(ref filters) = tcx.sess.opts.debugging_opts.dump_mir else {
94         return false;
95     };
96     // see notes on #41697 below
97     let node_path = ty::print::with_forced_impl_filename_line!(tcx.def_path_str(def_id));
98     filters.split('|').any(|or_filter| {
99         or_filter.split('&').all(|and_filter| {
100             let and_filter_trimmed = and_filter.trim();
101             and_filter_trimmed == "all"
102                 || pass_name.contains(and_filter_trimmed)
103                 || node_path.contains(and_filter_trimmed)
104         })
105     })
106 }
107
108 // #41697 -- we use `with_forced_impl_filename_line()` because
109 // `def_path_str()` would otherwise trigger `type_of`, and this can
110 // run while we are already attempting to evaluate `type_of`.
111
112 fn dump_matched_mir_node<'tcx, F>(
113     tcx: TyCtxt<'tcx>,
114     pass_num: Option<&dyn Display>,
115     pass_name: &str,
116     disambiguator: &dyn Display,
117     body: &Body<'tcx>,
118     mut extra_data: F,
119 ) where
120     F: FnMut(PassWhere, &mut dyn Write) -> io::Result<()>,
121 {
122     let _: io::Result<()> = try {
123         let mut file =
124             create_dump_file(tcx, "mir", pass_num, pass_name, disambiguator, body.source)?;
125         // see notes on #41697 above
126         let def_path =
127             ty::print::with_forced_impl_filename_line!(tcx.def_path_str(body.source.def_id()));
128         write!(file, "// MIR for `{}", def_path)?;
129         match body.source.promoted {
130             None => write!(file, "`")?,
131             Some(promoted) => write!(file, "::{:?}`", promoted)?,
132         }
133         writeln!(file, " {} {}", disambiguator, pass_name)?;
134         if let Some(ref layout) = body.generator_layout() {
135             writeln!(file, "/* generator_layout = {:#?} */", layout)?;
136         }
137         writeln!(file)?;
138         extra_data(PassWhere::BeforeCFG, &mut file)?;
139         write_user_type_annotations(tcx, body, &mut file)?;
140         write_mir_fn(tcx, body, &mut extra_data, &mut file)?;
141         extra_data(PassWhere::AfterCFG, &mut file)?;
142     };
143
144     if tcx.sess.opts.debugging_opts.dump_mir_graphviz {
145         let _: io::Result<()> = try {
146             let mut file =
147                 create_dump_file(tcx, "dot", pass_num, pass_name, disambiguator, body.source)?;
148             write_mir_fn_graphviz(tcx, body, false, &mut file)?;
149         };
150     }
151
152     if let Some(spanview) = tcx.sess.opts.debugging_opts.dump_mir_spanview {
153         let _: io::Result<()> = try {
154             let file_basename =
155                 dump_file_basename(tcx, pass_num, pass_name, disambiguator, body.source);
156             let mut file = create_dump_file_with_basename(tcx, &file_basename, "html")?;
157             if body.source.def_id().is_local() {
158                 write_mir_fn_spanview(tcx, body, spanview, &file_basename, &mut file)?;
159             }
160         };
161     }
162 }
163
164 /// Returns the file basename portion (without extension) of a filename path
165 /// where we should dump a MIR representation output files.
166 fn dump_file_basename<'tcx>(
167     tcx: TyCtxt<'tcx>,
168     pass_num: Option<&dyn Display>,
169     pass_name: &str,
170     disambiguator: &dyn Display,
171     source: MirSource<'tcx>,
172 ) -> String {
173     let promotion_id = match source.promoted {
174         Some(id) => format!("-{:?}", id),
175         None => String::new(),
176     };
177
178     let pass_num = if tcx.sess.opts.debugging_opts.dump_mir_exclude_pass_number {
179         String::new()
180     } else {
181         match pass_num {
182             None => ".-------".to_string(),
183             Some(pass_num) => format!(".{}", pass_num),
184         }
185     };
186
187     let crate_name = tcx.crate_name(source.def_id().krate);
188     let item_name = tcx.def_path(source.def_id()).to_filename_friendly_no_crate();
189     // All drop shims have the same DefId, so we have to add the type
190     // to get unique file names.
191     let shim_disambiguator = match source.instance {
192         ty::InstanceDef::DropGlue(_, Some(ty)) => {
193             // Unfortunately, pretty-printed typed are not very filename-friendly.
194             // We dome some filtering.
195             let mut s = ".".to_owned();
196             s.extend(ty.to_string().chars().filter_map(|c| match c {
197                 ' ' => None,
198                 ':' | '<' | '>' => Some('_'),
199                 c => Some(c),
200             }));
201             s
202         }
203         _ => String::new(),
204     };
205
206     format!(
207         "{}.{}{}{}{}.{}.{}",
208         crate_name, item_name, shim_disambiguator, promotion_id, pass_num, pass_name, disambiguator,
209     )
210 }
211
212 /// Returns the path to the filename where we should dump a given MIR.
213 /// Also used by other bits of code (e.g., NLL inference) that dump
214 /// graphviz data or other things.
215 fn dump_path(tcx: TyCtxt<'_>, basename: &str, extension: &str) -> PathBuf {
216     let mut file_path = PathBuf::new();
217     file_path.push(Path::new(&tcx.sess.opts.debugging_opts.dump_mir_dir));
218
219     let file_name = format!("{}.{}", basename, extension,);
220
221     file_path.push(&file_name);
222
223     file_path
224 }
225
226 /// Attempts to open the MIR dump file with the given name and extension.
227 fn create_dump_file_with_basename(
228     tcx: TyCtxt<'_>,
229     file_basename: &str,
230     extension: &str,
231 ) -> io::Result<io::BufWriter<fs::File>> {
232     let file_path = dump_path(tcx, file_basename, extension);
233     if let Some(parent) = file_path.parent() {
234         fs::create_dir_all(parent).map_err(|e| {
235             io::Error::new(
236                 e.kind(),
237                 format!("IO error creating MIR dump directory: {:?}; {}", parent, e),
238             )
239         })?;
240     }
241     Ok(io::BufWriter::new(fs::File::create(&file_path).map_err(|e| {
242         io::Error::new(e.kind(), format!("IO error creating MIR dump file: {:?}; {}", file_path, e))
243     })?))
244 }
245
246 /// Attempts to open a file where we should dump a given MIR or other
247 /// bit of MIR-related data. Used by `mir-dump`, but also by other
248 /// bits of code (e.g., NLL inference) that dump graphviz data or
249 /// other things, and hence takes the extension as an argument.
250 pub fn create_dump_file<'tcx>(
251     tcx: TyCtxt<'tcx>,
252     extension: &str,
253     pass_num: Option<&dyn Display>,
254     pass_name: &str,
255     disambiguator: &dyn Display,
256     source: MirSource<'tcx>,
257 ) -> io::Result<io::BufWriter<fs::File>> {
258     create_dump_file_with_basename(
259         tcx,
260         &dump_file_basename(tcx, pass_num, pass_name, disambiguator, source),
261         extension,
262     )
263 }
264
265 /// Write out a human-readable textual representation for the given MIR.
266 pub fn write_mir_pretty<'tcx>(
267     tcx: TyCtxt<'tcx>,
268     single: Option<DefId>,
269     w: &mut dyn Write,
270 ) -> io::Result<()> {
271     writeln!(w, "// WARNING: This output format is intended for human consumers only")?;
272     writeln!(w, "// and is subject to change without notice. Knock yourself out.")?;
273
274     let mut first = true;
275     for def_id in dump_mir_def_ids(tcx, single) {
276         if first {
277             first = false;
278         } else {
279             // Put empty lines between all items
280             writeln!(w)?;
281         }
282
283         let render_body = |w: &mut dyn Write, body| -> io::Result<()> {
284             write_mir_fn(tcx, body, &mut |_, _| Ok(()), w)?;
285
286             for body in tcx.promoted_mir(def_id) {
287                 writeln!(w)?;
288                 write_mir_fn(tcx, body, &mut |_, _| Ok(()), w)?;
289             }
290             Ok(())
291         };
292
293         // For `const fn` we want to render both the optimized MIR and the MIR for ctfe.
294         if tcx.is_const_fn_raw(def_id) {
295             render_body(w, tcx.optimized_mir(def_id))?;
296             writeln!(w)?;
297             writeln!(w, "// MIR FOR CTFE")?;
298             // Do not use `render_body`, as that would render the promoteds again, but these
299             // are shared between mir_for_ctfe and optimized_mir
300             write_mir_fn(tcx, tcx.mir_for_ctfe(def_id), &mut |_, _| Ok(()), w)?;
301         } else {
302             let instance_mir =
303                 tcx.instance_mir(ty::InstanceDef::Item(ty::WithOptConstParam::unknown(def_id)));
304             render_body(w, instance_mir)?;
305         }
306     }
307     Ok(())
308 }
309
310 /// Write out a human-readable textual representation for the given function.
311 pub fn write_mir_fn<'tcx, F>(
312     tcx: TyCtxt<'tcx>,
313     body: &Body<'tcx>,
314     extra_data: &mut F,
315     w: &mut dyn Write,
316 ) -> io::Result<()>
317 where
318     F: FnMut(PassWhere, &mut dyn Write) -> io::Result<()>,
319 {
320     write_mir_intro(tcx, body, w)?;
321     for block in body.basic_blocks().indices() {
322         extra_data(PassWhere::BeforeBlock(block), w)?;
323         write_basic_block(tcx, block, body, extra_data, w)?;
324         if block.index() + 1 != body.basic_blocks().len() {
325             writeln!(w)?;
326         }
327     }
328
329     writeln!(w, "}}")?;
330
331     write_allocations(tcx, body, w)?;
332
333     Ok(())
334 }
335
336 /// Write out a human-readable textual representation for the given basic block.
337 pub fn write_basic_block<'tcx, F>(
338     tcx: TyCtxt<'tcx>,
339     block: BasicBlock,
340     body: &Body<'tcx>,
341     extra_data: &mut F,
342     w: &mut dyn Write,
343 ) -> io::Result<()>
344 where
345     F: FnMut(PassWhere, &mut dyn Write) -> io::Result<()>,
346 {
347     let data = &body[block];
348
349     // Basic block label at the top.
350     let cleanup_text = if data.is_cleanup { " (cleanup)" } else { "" };
351     writeln!(w, "{}{:?}{}: {{", INDENT, block, cleanup_text)?;
352
353     // List of statements in the middle.
354     let mut current_location = Location { block, statement_index: 0 };
355     for statement in &data.statements {
356         extra_data(PassWhere::BeforeLocation(current_location), w)?;
357         let indented_body = format!("{0}{0}{1:?};", INDENT, statement);
358         writeln!(
359             w,
360             "{:A$} // {}{}",
361             indented_body,
362             if tcx.sess.verbose() { format!("{:?}: ", current_location) } else { String::new() },
363             comment(tcx, statement.source_info),
364             A = ALIGN,
365         )?;
366
367         write_extra(tcx, w, |visitor| {
368             visitor.visit_statement(statement, current_location);
369         })?;
370
371         extra_data(PassWhere::AfterLocation(current_location), w)?;
372
373         current_location.statement_index += 1;
374     }
375
376     // Terminator at the bottom.
377     extra_data(PassWhere::BeforeLocation(current_location), w)?;
378     let indented_terminator = format!("{0}{0}{1:?};", INDENT, data.terminator().kind);
379     writeln!(
380         w,
381         "{:A$} // {}{}",
382         indented_terminator,
383         if tcx.sess.verbose() { format!("{:?}: ", current_location) } else { String::new() },
384         comment(tcx, data.terminator().source_info),
385         A = ALIGN,
386     )?;
387
388     write_extra(tcx, w, |visitor| {
389         visitor.visit_terminator(data.terminator(), current_location);
390     })?;
391
392     extra_data(PassWhere::AfterLocation(current_location), w)?;
393     extra_data(PassWhere::AfterTerminator(block), w)?;
394
395     writeln!(w, "{}}}", INDENT)
396 }
397
398 /// After we print the main statement, we sometimes dump extra
399 /// information. There's often a lot of little things "nuzzled up" in
400 /// a statement.
401 fn write_extra<'tcx, F>(tcx: TyCtxt<'tcx>, write: &mut dyn Write, mut visit_op: F) -> io::Result<()>
402 where
403     F: FnMut(&mut ExtraComments<'tcx>),
404 {
405     let mut extra_comments = ExtraComments { tcx, comments: vec![] };
406     visit_op(&mut extra_comments);
407     for comment in extra_comments.comments {
408         writeln!(write, "{:A$} // {}", "", comment, A = ALIGN)?;
409     }
410     Ok(())
411 }
412
413 struct ExtraComments<'tcx> {
414     tcx: TyCtxt<'tcx>,
415     comments: Vec<String>,
416 }
417
418 impl<'tcx> ExtraComments<'tcx> {
419     fn push(&mut self, lines: &str) {
420         for line in lines.split('\n') {
421             self.comments.push(line.to_string());
422         }
423     }
424 }
425
426 fn use_verbose<'tcx>(ty: Ty<'tcx>, fn_def: bool) -> bool {
427     match *ty.kind() {
428         ty::Int(_) | ty::Uint(_) | ty::Bool | ty::Char | ty::Float(_) => false,
429         // Unit type
430         ty::Tuple(g_args) if g_args.is_empty() => false,
431         ty::Tuple(g_args) => g_args.iter().any(|g_arg| use_verbose(g_arg, fn_def)),
432         ty::Array(ty, _) => use_verbose(ty, fn_def),
433         ty::FnDef(..) => fn_def,
434         _ => true,
435     }
436 }
437
438 impl<'tcx> Visitor<'tcx> for ExtraComments<'tcx> {
439     fn visit_constant(&mut self, constant: &Constant<'tcx>, _location: Location) {
440         let Constant { span, user_ty, literal } = constant;
441         if use_verbose(literal.ty(), true) {
442             self.push("mir::Constant");
443             self.push(&format!(
444                 "+ span: {}",
445                 self.tcx.sess.source_map().span_to_embeddable_string(*span)
446             ));
447             if let Some(user_ty) = user_ty {
448                 self.push(&format!("+ user_ty: {:?}", user_ty));
449             }
450
451             let val = match literal {
452                 ConstantKind::Ty(ct) => match ct.val() {
453                     ty::ConstKind::Param(p) => format!("Param({})", p),
454                     ty::ConstKind::Unevaluated(uv) => format!(
455                         "Unevaluated({}, {:?}, {:?})",
456                         self.tcx.def_path_str(uv.def.did),
457                         uv.substs,
458                         uv.promoted,
459                     ),
460                     ty::ConstKind::Value(val) => format!("Value({:?})", val),
461                     ty::ConstKind::Error(_) => "Error".to_string(),
462                     // These variants shouldn't exist in the MIR.
463                     ty::ConstKind::Placeholder(_)
464                     | ty::ConstKind::Infer(_)
465                     | ty::ConstKind::Bound(..) => bug!("unexpected MIR constant: {:?}", literal),
466                 },
467                 // To keep the diffs small, we render this like we render `ty::Const::Value`.
468                 //
469                 // This changes once `ty::Const::Value` is represented using valtrees.
470                 ConstantKind::Val(val, _) => format!("Value({:?})", val),
471             };
472
473             self.push(&format!("+ literal: Const {{ ty: {}, val: {} }}", literal.ty(), val));
474         }
475     }
476
477     fn visit_rvalue(&mut self, rvalue: &Rvalue<'tcx>, location: Location) {
478         self.super_rvalue(rvalue, location);
479         if let Rvalue::Aggregate(kind, _) = rvalue {
480             match **kind {
481                 AggregateKind::Closure(def_id, substs) => {
482                     self.push("closure");
483                     self.push(&format!("+ def_id: {:?}", def_id));
484                     self.push(&format!("+ substs: {:#?}", substs));
485                 }
486
487                 AggregateKind::Generator(def_id, substs, movability) => {
488                     self.push("generator");
489                     self.push(&format!("+ def_id: {:?}", def_id));
490                     self.push(&format!("+ substs: {:#?}", substs));
491                     self.push(&format!("+ movability: {:?}", movability));
492                 }
493
494                 AggregateKind::Adt(_, _, _, Some(user_ty), _) => {
495                     self.push("adt");
496                     self.push(&format!("+ user_ty: {:?}", user_ty));
497                 }
498
499                 _ => {}
500             }
501         }
502     }
503 }
504
505 fn comment(tcx: TyCtxt<'_>, SourceInfo { span, scope }: SourceInfo) -> String {
506     format!("scope {} at {}", scope.index(), tcx.sess.source_map().span_to_embeddable_string(span))
507 }
508
509 /// Prints local variables in a scope tree.
510 fn write_scope_tree(
511     tcx: TyCtxt<'_>,
512     body: &Body<'_>,
513     scope_tree: &FxHashMap<SourceScope, Vec<SourceScope>>,
514     w: &mut dyn Write,
515     parent: SourceScope,
516     depth: usize,
517 ) -> io::Result<()> {
518     let indent = depth * INDENT.len();
519
520     // Local variable debuginfo.
521     for var_debug_info in &body.var_debug_info {
522         if var_debug_info.source_info.scope != parent {
523             // Not declared in this scope.
524             continue;
525         }
526
527         let indented_debug_info = format!(
528             "{0:1$}debug {2} => {3:?};",
529             INDENT, indent, var_debug_info.name, var_debug_info.value,
530         );
531
532         writeln!(
533             w,
534             "{0:1$} // in {2}",
535             indented_debug_info,
536             ALIGN,
537             comment(tcx, var_debug_info.source_info),
538         )?;
539     }
540
541     // Local variable types.
542     for (local, local_decl) in body.local_decls.iter_enumerated() {
543         if (1..body.arg_count + 1).contains(&local.index()) {
544             // Skip over argument locals, they're printed in the signature.
545             continue;
546         }
547
548         if local_decl.source_info.scope != parent {
549             // Not declared in this scope.
550             continue;
551         }
552
553         let mut_str = if local_decl.mutability == Mutability::Mut { "mut " } else { "" };
554
555         let mut indented_decl =
556             format!("{0:1$}let {2}{3:?}: {4:?}", INDENT, indent, mut_str, local, local_decl.ty);
557         if let Some(user_ty) = &local_decl.user_ty {
558             for user_ty in user_ty.projections() {
559                 write!(indented_decl, " as {:?}", user_ty).unwrap();
560             }
561         }
562         indented_decl.push(';');
563
564         let local_name = if local == RETURN_PLACE { " return place" } else { "" };
565
566         writeln!(
567             w,
568             "{0:1$} //{2} in {3}",
569             indented_decl,
570             ALIGN,
571             local_name,
572             comment(tcx, local_decl.source_info),
573         )?;
574     }
575
576     let Some(children) = scope_tree.get(&parent) else {
577         return Ok(());
578     };
579
580     for &child in children {
581         let child_data = &body.source_scopes[child];
582         assert_eq!(child_data.parent_scope, Some(parent));
583
584         let (special, span) = if let Some((callee, callsite_span)) = child_data.inlined {
585             (
586                 format!(
587                     " (inlined {}{})",
588                     if callee.def.requires_caller_location(tcx) { "#[track_caller] " } else { "" },
589                     callee
590                 ),
591                 Some(callsite_span),
592             )
593         } else {
594             (String::new(), None)
595         };
596
597         let indented_header = format!("{0:1$}scope {2}{3} {{", "", indent, child.index(), special);
598
599         if let Some(span) = span {
600             writeln!(
601                 w,
602                 "{0:1$} // at {2}",
603                 indented_header,
604                 ALIGN,
605                 tcx.sess.source_map().span_to_embeddable_string(span),
606             )?;
607         } else {
608             writeln!(w, "{}", indented_header)?;
609         }
610
611         write_scope_tree(tcx, body, scope_tree, w, child, depth + 1)?;
612         writeln!(w, "{0:1$}}}", "", depth * INDENT.len())?;
613     }
614
615     Ok(())
616 }
617
618 /// Write out a human-readable textual representation of the MIR's `fn` type and the types of its
619 /// local variables (both user-defined bindings and compiler temporaries).
620 pub fn write_mir_intro<'tcx>(
621     tcx: TyCtxt<'tcx>,
622     body: &Body<'_>,
623     w: &mut dyn Write,
624 ) -> io::Result<()> {
625     write_mir_sig(tcx, body, w)?;
626     writeln!(w, "{{")?;
627
628     // construct a scope tree and write it out
629     let mut scope_tree: FxHashMap<SourceScope, Vec<SourceScope>> = Default::default();
630     for (index, scope_data) in body.source_scopes.iter().enumerate() {
631         if let Some(parent) = scope_data.parent_scope {
632             scope_tree.entry(parent).or_default().push(SourceScope::new(index));
633         } else {
634             // Only the argument scope has no parent, because it's the root.
635             assert_eq!(index, OUTERMOST_SOURCE_SCOPE.index());
636         }
637     }
638
639     write_scope_tree(tcx, body, &scope_tree, w, OUTERMOST_SOURCE_SCOPE, 1)?;
640
641     // Add an empty line before the first block is printed.
642     writeln!(w)?;
643
644     Ok(())
645 }
646
647 /// Find all `AllocId`s mentioned (recursively) in the MIR body and print their corresponding
648 /// allocations.
649 pub fn write_allocations<'tcx>(
650     tcx: TyCtxt<'tcx>,
651     body: &Body<'_>,
652     w: &mut dyn Write,
653 ) -> io::Result<()> {
654     fn alloc_ids_from_alloc(
655         alloc: ConstAllocation<'_>,
656     ) -> impl DoubleEndedIterator<Item = AllocId> + '_ {
657         alloc.inner().relocations().values().map(|id| *id)
658     }
659     fn alloc_ids_from_const(val: ConstValue<'_>) -> impl Iterator<Item = AllocId> + '_ {
660         match val {
661             ConstValue::Scalar(interpret::Scalar::Ptr(ptr, _)) => {
662                 Either::Left(Either::Left(std::iter::once(ptr.provenance)))
663             }
664             ConstValue::Scalar(interpret::Scalar::Int { .. }) => {
665                 Either::Left(Either::Right(std::iter::empty()))
666             }
667             ConstValue::ByRef { alloc, .. } | ConstValue::Slice { data: alloc, .. } => {
668                 Either::Right(alloc_ids_from_alloc(alloc))
669             }
670         }
671     }
672     struct CollectAllocIds(BTreeSet<AllocId>);
673
674     impl<'tcx> Visitor<'tcx> for CollectAllocIds {
675         fn visit_const(&mut self, c: ty::Const<'tcx>, _loc: Location) {
676             if let ty::ConstKind::Value(val) = c.val() {
677                 self.0.extend(alloc_ids_from_const(val));
678             }
679         }
680
681         fn visit_constant(&mut self, c: &Constant<'tcx>, loc: Location) {
682             match c.literal {
683                 ConstantKind::Ty(c) => self.visit_const(c, loc),
684                 ConstantKind::Val(val, _) => {
685                     self.0.extend(alloc_ids_from_const(val));
686                 }
687             }
688         }
689     }
690
691     let mut visitor = CollectAllocIds(Default::default());
692     visitor.visit_body(body);
693
694     // `seen` contains all seen allocations, including the ones we have *not* printed yet.
695     // The protocol is to first `insert` into `seen`, and only if that returns `true`
696     // then push to `todo`.
697     let mut seen = visitor.0;
698     let mut todo: Vec<_> = seen.iter().copied().collect();
699     while let Some(id) = todo.pop() {
700         let mut write_allocation_track_relocs =
701             |w: &mut dyn Write, alloc: ConstAllocation<'tcx>| -> io::Result<()> {
702                 // `.rev()` because we are popping them from the back of the `todo` vector.
703                 for id in alloc_ids_from_alloc(alloc).rev() {
704                     if seen.insert(id) {
705                         todo.push(id);
706                     }
707                 }
708                 write!(w, "{}", display_allocation(tcx, alloc.inner()))
709             };
710         write!(w, "\n{}", id)?;
711         match tcx.get_global_alloc(id) {
712             // This can't really happen unless there are bugs, but it doesn't cost us anything to
713             // gracefully handle it and allow buggy rustc to be debugged via allocation printing.
714             None => write!(w, " (deallocated)")?,
715             Some(GlobalAlloc::Function(inst)) => write!(w, " (fn: {})", inst)?,
716             Some(GlobalAlloc::Static(did)) if !tcx.is_foreign_item(did) => {
717                 match tcx.eval_static_initializer(did) {
718                     Ok(alloc) => {
719                         write!(w, " (static: {}, ", tcx.def_path_str(did))?;
720                         write_allocation_track_relocs(w, alloc)?;
721                     }
722                     Err(_) => write!(
723                         w,
724                         " (static: {}, error during initializer evaluation)",
725                         tcx.def_path_str(did)
726                     )?,
727                 }
728             }
729             Some(GlobalAlloc::Static(did)) => {
730                 write!(w, " (extern static: {})", tcx.def_path_str(did))?
731             }
732             Some(GlobalAlloc::Memory(alloc)) => {
733                 write!(w, " (")?;
734                 write_allocation_track_relocs(w, alloc)?
735             }
736         }
737         writeln!(w)?;
738     }
739     Ok(())
740 }
741
742 /// Dumps the size and metadata and content of an allocation to the given writer.
743 /// The expectation is that the caller first prints other relevant metadata, so the exact
744 /// format of this function is (*without* leading or trailing newline):
745 ///
746 /// ```text
747 /// size: {}, align: {}) {
748 ///     <bytes>
749 /// }
750 /// ```
751 ///
752 /// The byte format is similar to how hex editors print bytes. Each line starts with the address of
753 /// the start of the line, followed by all bytes in hex format (space separated).
754 /// If the allocation is small enough to fit into a single line, no start address is given.
755 /// After the hex dump, an ascii dump follows, replacing all unprintable characters (control
756 /// characters or characters whose value is larger than 127) with a `.`
757 /// This also prints relocations adequately.
758 pub fn display_allocation<'a, 'tcx, Tag, Extra>(
759     tcx: TyCtxt<'tcx>,
760     alloc: &'a Allocation<Tag, Extra>,
761 ) -> RenderAllocation<'a, 'tcx, Tag, Extra> {
762     RenderAllocation { tcx, alloc }
763 }
764
765 #[doc(hidden)]
766 pub struct RenderAllocation<'a, 'tcx, Tag, Extra> {
767     tcx: TyCtxt<'tcx>,
768     alloc: &'a Allocation<Tag, Extra>,
769 }
770
771 impl<'a, 'tcx, Tag: Provenance, Extra> std::fmt::Display
772     for RenderAllocation<'a, 'tcx, Tag, Extra>
773 {
774     fn fmt(&self, w: &mut std::fmt::Formatter<'_>) -> std::fmt::Result {
775         let RenderAllocation { tcx, alloc } = *self;
776         write!(w, "size: {}, align: {})", alloc.size().bytes(), alloc.align.bytes())?;
777         if alloc.size() == Size::ZERO {
778             // We are done.
779             return write!(w, " {{}}");
780         }
781         // Write allocation bytes.
782         writeln!(w, " {{")?;
783         write_allocation_bytes(tcx, alloc, w, "    ")?;
784         write!(w, "}}")?;
785         Ok(())
786     }
787 }
788
789 fn write_allocation_endline(w: &mut dyn std::fmt::Write, ascii: &str) -> std::fmt::Result {
790     for _ in 0..(BYTES_PER_LINE - ascii.chars().count()) {
791         write!(w, "   ")?;
792     }
793     writeln!(w, " │ {}", ascii)
794 }
795
796 /// Number of bytes to print per allocation hex dump line.
797 const BYTES_PER_LINE: usize = 16;
798
799 /// Prints the line start address and returns the new line start address.
800 fn write_allocation_newline(
801     w: &mut dyn std::fmt::Write,
802     mut line_start: Size,
803     ascii: &str,
804     pos_width: usize,
805     prefix: &str,
806 ) -> Result<Size, std::fmt::Error> {
807     write_allocation_endline(w, ascii)?;
808     line_start += Size::from_bytes(BYTES_PER_LINE);
809     write!(w, "{}0x{:02$x} │ ", prefix, line_start.bytes(), pos_width)?;
810     Ok(line_start)
811 }
812
813 /// The `prefix` argument allows callers to add an arbitrary prefix before each line (even if there
814 /// is only one line). Note that your prefix should contain a trailing space as the lines are
815 /// printed directly after it.
816 fn write_allocation_bytes<'tcx, Tag: Provenance, Extra>(
817     tcx: TyCtxt<'tcx>,
818     alloc: &Allocation<Tag, Extra>,
819     w: &mut dyn std::fmt::Write,
820     prefix: &str,
821 ) -> std::fmt::Result {
822     let num_lines = alloc.size().bytes_usize().saturating_sub(BYTES_PER_LINE);
823     // Number of chars needed to represent all line numbers.
824     let pos_width = hex_number_length(alloc.size().bytes());
825
826     if num_lines > 0 {
827         write!(w, "{}0x{:02$x} │ ", prefix, 0, pos_width)?;
828     } else {
829         write!(w, "{}", prefix)?;
830     }
831
832     let mut i = Size::ZERO;
833     let mut line_start = Size::ZERO;
834
835     let ptr_size = tcx.data_layout.pointer_size;
836
837     let mut ascii = String::new();
838
839     let oversized_ptr = |target: &mut String, width| {
840         if target.len() > width {
841             write!(target, " ({} ptr bytes)", ptr_size.bytes()).unwrap();
842         }
843     };
844
845     while i < alloc.size() {
846         // The line start already has a space. While we could remove that space from the line start
847         // printing and unconditionally print a space here, that would cause the single-line case
848         // to have a single space before it, which looks weird.
849         if i != line_start {
850             write!(w, " ")?;
851         }
852         if let Some(&tag) = alloc.relocations().get(&i) {
853             // Memory with a relocation must be defined
854             let j = i.bytes_usize();
855             let offset = alloc
856                 .inspect_with_uninit_and_ptr_outside_interpreter(j..j + ptr_size.bytes_usize());
857             let offset = read_target_uint(tcx.data_layout.endian, offset).unwrap();
858             let offset = Size::from_bytes(offset);
859             let relocation_width = |bytes| bytes * 3;
860             let ptr = Pointer::new(tag, offset);
861             let mut target = format!("{:?}", ptr);
862             if target.len() > relocation_width(ptr_size.bytes_usize() - 1) {
863                 // This is too long, try to save some space.
864                 target = format!("{:#?}", ptr);
865             }
866             if ((i - line_start) + ptr_size).bytes_usize() > BYTES_PER_LINE {
867                 // This branch handles the situation where a relocation starts in the current line
868                 // but ends in the next one.
869                 let remainder = Size::from_bytes(BYTES_PER_LINE) - (i - line_start);
870                 let overflow = ptr_size - remainder;
871                 let remainder_width = relocation_width(remainder.bytes_usize()) - 2;
872                 let overflow_width = relocation_width(overflow.bytes_usize() - 1) + 1;
873                 ascii.push('╾');
874                 for _ in 0..remainder.bytes() - 1 {
875                     ascii.push('─');
876                 }
877                 if overflow_width > remainder_width && overflow_width >= target.len() {
878                     // The case where the relocation fits into the part in the next line
879                     write!(w, "╾{0:─^1$}", "", remainder_width)?;
880                     line_start =
881                         write_allocation_newline(w, line_start, &ascii, pos_width, prefix)?;
882                     ascii.clear();
883                     write!(w, "{0:─^1$}╼", target, overflow_width)?;
884                 } else {
885                     oversized_ptr(&mut target, remainder_width);
886                     write!(w, "╾{0:─^1$}", target, remainder_width)?;
887                     line_start =
888                         write_allocation_newline(w, line_start, &ascii, pos_width, prefix)?;
889                     write!(w, "{0:─^1$}╼", "", overflow_width)?;
890                     ascii.clear();
891                 }
892                 for _ in 0..overflow.bytes() - 1 {
893                     ascii.push('─');
894                 }
895                 ascii.push('╼');
896                 i += ptr_size;
897                 continue;
898             } else {
899                 // This branch handles a relocation that starts and ends in the current line.
900                 let relocation_width = relocation_width(ptr_size.bytes_usize() - 1);
901                 oversized_ptr(&mut target, relocation_width);
902                 ascii.push('╾');
903                 write!(w, "╾{0:─^1$}╼", target, relocation_width)?;
904                 for _ in 0..ptr_size.bytes() - 2 {
905                     ascii.push('─');
906                 }
907                 ascii.push('╼');
908                 i += ptr_size;
909             }
910         } else if alloc.init_mask().is_range_initialized(i, i + Size::from_bytes(1)).is_ok() {
911             let j = i.bytes_usize();
912
913             // Checked definedness (and thus range) and relocations. This access also doesn't
914             // influence interpreter execution but is only for debugging.
915             let c = alloc.inspect_with_uninit_and_ptr_outside_interpreter(j..j + 1)[0];
916             write!(w, "{:02x}", c)?;
917             if c.is_ascii_control() || c >= 0x80 {
918                 ascii.push('.');
919             } else {
920                 ascii.push(char::from(c));
921             }
922             i += Size::from_bytes(1);
923         } else {
924             write!(w, "__")?;
925             ascii.push('░');
926             i += Size::from_bytes(1);
927         }
928         // Print a new line header if the next line still has some bytes to print.
929         if i == line_start + Size::from_bytes(BYTES_PER_LINE) && i != alloc.size() {
930             line_start = write_allocation_newline(w, line_start, &ascii, pos_width, prefix)?;
931             ascii.clear();
932         }
933     }
934     write_allocation_endline(w, &ascii)?;
935
936     Ok(())
937 }
938
939 fn write_mir_sig(tcx: TyCtxt<'_>, body: &Body<'_>, w: &mut dyn Write) -> io::Result<()> {
940     use rustc_hir::def::DefKind;
941
942     trace!("write_mir_sig: {:?}", body.source.instance);
943     let def_id = body.source.def_id();
944     let kind = tcx.def_kind(def_id);
945     let is_function = match kind {
946         DefKind::Fn | DefKind::AssocFn | DefKind::Ctor(..) => true,
947         _ => tcx.is_closure(def_id),
948     };
949     match (kind, body.source.promoted) {
950         (_, Some(i)) => write!(w, "{:?} in ", i)?,
951         (DefKind::Const | DefKind::AssocConst, _) => write!(w, "const ")?,
952         (DefKind::Static(hir::Mutability::Not), _) => write!(w, "static ")?,
953         (DefKind::Static(hir::Mutability::Mut), _) => write!(w, "static mut ")?,
954         (_, _) if is_function => write!(w, "fn ")?,
955         (DefKind::AnonConst | DefKind::InlineConst, _) => {} // things like anon const, not an item
956         _ => bug!("Unexpected def kind {:?}", kind),
957     }
958
959     ty::print::with_forced_impl_filename_line! {
960         // see notes on #41697 elsewhere
961         write!(w, "{}", tcx.def_path_str(def_id))?
962     }
963
964     if body.source.promoted.is_none() && is_function {
965         write!(w, "(")?;
966
967         // fn argument types.
968         for (i, arg) in body.args_iter().enumerate() {
969             if i != 0 {
970                 write!(w, ", ")?;
971             }
972             write!(w, "{:?}: {}", Place::from(arg), body.local_decls[arg].ty)?;
973         }
974
975         write!(w, ") -> {}", body.return_ty())?;
976     } else {
977         assert_eq!(body.arg_count, 0);
978         write!(w, ": {} =", body.return_ty())?;
979     }
980
981     if let Some(yield_ty) = body.yield_ty() {
982         writeln!(w)?;
983         writeln!(w, "yields {}", yield_ty)?;
984     }
985
986     write!(w, " ")?;
987     // Next thing that gets printed is the opening {
988
989     Ok(())
990 }
991
992 fn write_user_type_annotations(
993     tcx: TyCtxt<'_>,
994     body: &Body<'_>,
995     w: &mut dyn Write,
996 ) -> io::Result<()> {
997     if !body.user_type_annotations.is_empty() {
998         writeln!(w, "| User Type Annotations")?;
999     }
1000     for (index, annotation) in body.user_type_annotations.iter_enumerated() {
1001         writeln!(
1002             w,
1003             "| {:?}: {:?} at {}",
1004             index.index(),
1005             annotation.user_ty,
1006             tcx.sess.source_map().span_to_embeddable_string(annotation.span)
1007         )?;
1008     }
1009     if !body.user_type_annotations.is_empty() {
1010         writeln!(w, "|")?;
1011     }
1012     Ok(())
1013 }
1014
1015 pub fn dump_mir_def_ids(tcx: TyCtxt<'_>, single: Option<DefId>) -> Vec<DefId> {
1016     if let Some(i) = single {
1017         vec![i]
1018     } else {
1019         tcx.mir_keys(()).iter().map(|def_id| def_id.to_def_id()).collect()
1020     }
1021 }
1022
1023 /// Calc converted u64 decimal into hex and return it's length in chars
1024 ///
1025 /// ```ignore (cannot-test-private-function)
1026 /// assert_eq!(1, hex_number_length(0));
1027 /// assert_eq!(1, hex_number_length(1));
1028 /// assert_eq!(2, hex_number_length(16));
1029 /// ```
1030 fn hex_number_length(x: u64) -> usize {
1031     if x == 0 {
1032         return 1;
1033     }
1034     let mut length = 0;
1035     let mut x_left = x;
1036     while x_left > 0 {
1037         x_left /= 16;
1038         length += 1;
1039     }
1040     length
1041 }