]> git.lizzy.rs Git - rust.git/blob - compiler/rustc_monomorphize/src/collector.rs
Rollup merge of #101864 - notriddle:notriddle/h1-h2-h3-h4, r=GuillaumeGomez
[rust.git] / compiler / rustc_monomorphize / src / collector.rs
1 //! Mono Item Collection
2 //! ====================
3 //!
4 //! This module is responsible for discovering all items that will contribute
5 //! to code generation of the crate. The important part here is that it not only
6 //! needs to find syntax-level items (functions, structs, etc) but also all
7 //! their monomorphized instantiations. Every non-generic, non-const function
8 //! maps to one LLVM artifact. Every generic function can produce
9 //! from zero to N artifacts, depending on the sets of type arguments it
10 //! is instantiated with.
11 //! This also applies to generic items from other crates: A generic definition
12 //! in crate X might produce monomorphizations that are compiled into crate Y.
13 //! We also have to collect these here.
14 //!
15 //! The following kinds of "mono items" are handled here:
16 //!
17 //! - Functions
18 //! - Methods
19 //! - Closures
20 //! - Statics
21 //! - Drop glue
22 //!
23 //! The following things also result in LLVM artifacts, but are not collected
24 //! here, since we instantiate them locally on demand when needed in a given
25 //! codegen unit:
26 //!
27 //! - Constants
28 //! - VTables
29 //! - Object Shims
30 //!
31 //!
32 //! General Algorithm
33 //! -----------------
34 //! Let's define some terms first:
35 //!
36 //! - A "mono item" is something that results in a function or global in
37 //!   the LLVM IR of a codegen unit. Mono items do not stand on their
38 //!   own, they can reference other mono items. For example, if function
39 //!   `foo()` calls function `bar()` then the mono item for `foo()`
40 //!   references the mono item for function `bar()`. In general, the
41 //!   definition for mono item A referencing a mono item B is that
42 //!   the LLVM artifact produced for A references the LLVM artifact produced
43 //!   for B.
44 //!
45 //! - Mono items and the references between them form a directed graph,
46 //!   where the mono items are the nodes and references form the edges.
47 //!   Let's call this graph the "mono item graph".
48 //!
49 //! - The mono item graph for a program contains all mono items
50 //!   that are needed in order to produce the complete LLVM IR of the program.
51 //!
52 //! The purpose of the algorithm implemented in this module is to build the
53 //! mono item graph for the current crate. It runs in two phases:
54 //!
55 //! 1. Discover the roots of the graph by traversing the HIR of the crate.
56 //! 2. Starting from the roots, find neighboring nodes by inspecting the MIR
57 //!    representation of the item corresponding to a given node, until no more
58 //!    new nodes are found.
59 //!
60 //! ### Discovering roots
61 //!
62 //! The roots of the mono item graph correspond to the public non-generic
63 //! syntactic items in the source code. We find them by walking the HIR of the
64 //! crate, and whenever we hit upon a public function, method, or static item,
65 //! we create a mono item consisting of the items DefId and, since we only
66 //! consider non-generic items, an empty type-substitution set. (In eager
67 //! collection mode, during incremental compilation, all non-generic functions
68 //! are considered as roots, as well as when the `-Clink-dead-code` option is
69 //! specified. Functions marked `#[no_mangle]` and functions called by inlinable
70 //! functions also always act as roots.)
71 //!
72 //! ### Finding neighbor nodes
73 //! Given a mono item node, we can discover neighbors by inspecting its
74 //! MIR. We walk the MIR and any time we hit upon something that signifies a
75 //! reference to another mono item, we have found a neighbor. Since the
76 //! mono item we are currently at is always monomorphic, we also know the
77 //! concrete type arguments of its neighbors, and so all neighbors again will be
78 //! monomorphic. The specific forms a reference to a neighboring node can take
79 //! in MIR are quite diverse. Here is an overview:
80 //!
81 //! #### Calling Functions/Methods
82 //! The most obvious form of one mono item referencing another is a
83 //! function or method call (represented by a CALL terminator in MIR). But
84 //! calls are not the only thing that might introduce a reference between two
85 //! function mono items, and as we will see below, they are just a
86 //! specialization of the form described next, and consequently will not get any
87 //! special treatment in the algorithm.
88 //!
89 //! #### Taking a reference to a function or method
90 //! A function does not need to actually be called in order to be a neighbor of
91 //! another function. It suffices to just take a reference in order to introduce
92 //! an edge. Consider the following example:
93 //!
94 //! ```
95 //! # use core::fmt::Display;
96 //! fn print_val<T: Display>(x: T) {
97 //!     println!("{}", x);
98 //! }
99 //!
100 //! fn call_fn(f: &dyn Fn(i32), x: i32) {
101 //!     f(x);
102 //! }
103 //!
104 //! fn main() {
105 //!     let print_i32 = print_val::<i32>;
106 //!     call_fn(&print_i32, 0);
107 //! }
108 //! ```
109 //! The MIR of none of these functions will contain an explicit call to
110 //! `print_val::<i32>`. Nonetheless, in order to mono this program, we need
111 //! an instance of this function. Thus, whenever we encounter a function or
112 //! method in operand position, we treat it as a neighbor of the current
113 //! mono item. Calls are just a special case of that.
114 //!
115 //! #### Drop glue
116 //! Drop glue mono items are introduced by MIR drop-statements. The
117 //! generated mono item will again have drop-glue item neighbors if the
118 //! type to be dropped contains nested values that also need to be dropped. It
119 //! might also have a function item neighbor for the explicit `Drop::drop`
120 //! implementation of its type.
121 //!
122 //! #### Unsizing Casts
123 //! A subtle way of introducing neighbor edges is by casting to a trait object.
124 //! Since the resulting fat-pointer contains a reference to a vtable, we need to
125 //! instantiate all object-safe methods of the trait, as we need to store
126 //! pointers to these functions even if they never get called anywhere. This can
127 //! be seen as a special case of taking a function reference.
128 //!
129 //! #### Boxes
130 //! Since `Box` expression have special compiler support, no explicit calls to
131 //! `exchange_malloc()` and `box_free()` may show up in MIR, even if the
132 //! compiler will generate them. We have to observe `Rvalue::Box` expressions
133 //! and Box-typed drop-statements for that purpose.
134 //!
135 //!
136 //! Interaction with Cross-Crate Inlining
137 //! -------------------------------------
138 //! The binary of a crate will not only contain machine code for the items
139 //! defined in the source code of that crate. It will also contain monomorphic
140 //! instantiations of any extern generic functions and of functions marked with
141 //! `#[inline]`.
142 //! The collection algorithm handles this more or less mono. If it is
143 //! about to create a mono item for something with an external `DefId`,
144 //! it will take a look if the MIR for that item is available, and if so just
145 //! proceed normally. If the MIR is not available, it assumes that the item is
146 //! just linked to and no node is created; which is exactly what we want, since
147 //! no machine code should be generated in the current crate for such an item.
148 //!
149 //! Eager and Lazy Collection Mode
150 //! ------------------------------
151 //! Mono item collection can be performed in one of two modes:
152 //!
153 //! - Lazy mode means that items will only be instantiated when actually
154 //!   referenced. The goal is to produce the least amount of machine code
155 //!   possible.
156 //!
157 //! - Eager mode is meant to be used in conjunction with incremental compilation
158 //!   where a stable set of mono items is more important than a minimal
159 //!   one. Thus, eager mode will instantiate drop-glue for every drop-able type
160 //!   in the crate, even if no drop call for that type exists (yet). It will
161 //!   also instantiate default implementations of trait methods, something that
162 //!   otherwise is only done on demand.
163 //!
164 //!
165 //! Open Issues
166 //! -----------
167 //! Some things are not yet fully implemented in the current version of this
168 //! module.
169 //!
170 //! ### Const Fns
171 //! Ideally, no mono item should be generated for const fns unless there
172 //! is a call to them that cannot be evaluated at compile time. At the moment
173 //! this is not implemented however: a mono item will be produced
174 //! regardless of whether it is actually needed or not.
175
176 use rustc_data_structures::fx::{FxHashMap, FxHashSet};
177 use rustc_data_structures::sync::{par_for_each_in, MTLock, MTRef};
178 use rustc_hir as hir;
179 use rustc_hir::def::DefKind;
180 use rustc_hir::def_id::{DefId, DefIdMap, LocalDefId};
181 use rustc_hir::lang_items::LangItem;
182 use rustc_index::bit_set::GrowableBitSet;
183 use rustc_middle::mir::interpret::{AllocId, ConstValue};
184 use rustc_middle::mir::interpret::{ErrorHandled, GlobalAlloc, Scalar};
185 use rustc_middle::mir::mono::{InstantiationMode, MonoItem};
186 use rustc_middle::mir::visit::Visitor as MirVisitor;
187 use rustc_middle::mir::{self, Local, Location};
188 use rustc_middle::ty::adjustment::{CustomCoerceUnsized, PointerCast};
189 use rustc_middle::ty::print::with_no_trimmed_paths;
190 use rustc_middle::ty::subst::{GenericArgKind, InternalSubsts};
191 use rustc_middle::ty::{
192     self, GenericParamDefKind, Instance, Ty, TyCtxt, TypeFoldable, TypeVisitable, VtblEntry,
193 };
194 use rustc_middle::{middle::codegen_fn_attrs::CodegenFnAttrFlags, mir::visit::TyContext};
195 use rustc_session::config::EntryFnType;
196 use rustc_session::lint::builtin::LARGE_ASSIGNMENTS;
197 use rustc_session::Limit;
198 use rustc_span::source_map::{dummy_spanned, respan, Span, Spanned, DUMMY_SP};
199 use rustc_target::abi::Size;
200 use std::iter;
201 use std::ops::Range;
202 use std::path::PathBuf;
203
204 use crate::errors::{LargeAssignmentsLint, RecursionLimit, RequiresLangItem, TypeLengthLimit};
205
206 #[derive(PartialEq)]
207 pub enum MonoItemCollectionMode {
208     Eager,
209     Lazy,
210 }
211
212 /// Maps every mono item to all mono items it references in its
213 /// body.
214 pub struct InliningMap<'tcx> {
215     // Maps a source mono item to the range of mono items
216     // accessed by it.
217     // The range selects elements within the `targets` vecs.
218     index: FxHashMap<MonoItem<'tcx>, Range<usize>>,
219     targets: Vec<MonoItem<'tcx>>,
220
221     // Contains one bit per mono item in the `targets` field. That bit
222     // is true if that mono item needs to be inlined into every CGU.
223     inlines: GrowableBitSet<usize>,
224 }
225
226 /// Struct to store mono items in each collecting and if they should
227 /// be inlined. We call `instantiation_mode` to get their inlining
228 /// status when inserting new elements, which avoids calling it in
229 /// `inlining_map.lock_mut()`. See the `collect_items_rec` implementation
230 /// below.
231 struct MonoItems<'tcx> {
232     // If this is false, we do not need to compute whether items
233     // will need to be inlined.
234     compute_inlining: bool,
235
236     // The TyCtxt used to determine whether the a item should
237     // be inlined.
238     tcx: TyCtxt<'tcx>,
239
240     // The collected mono items. The bool field in each element
241     // indicates whether this element should be inlined.
242     items: Vec<(Spanned<MonoItem<'tcx>>, bool /*inlined*/)>,
243 }
244
245 impl<'tcx> MonoItems<'tcx> {
246     #[inline]
247     fn push(&mut self, item: Spanned<MonoItem<'tcx>>) {
248         self.extend([item]);
249     }
250
251     #[inline]
252     fn extend<T: IntoIterator<Item = Spanned<MonoItem<'tcx>>>>(&mut self, iter: T) {
253         self.items.extend(iter.into_iter().map(|mono_item| {
254             let inlined = if !self.compute_inlining {
255                 false
256             } else {
257                 mono_item.node.instantiation_mode(self.tcx) == InstantiationMode::LocalCopy
258             };
259             (mono_item, inlined)
260         }))
261     }
262 }
263
264 impl<'tcx> InliningMap<'tcx> {
265     fn new() -> InliningMap<'tcx> {
266         InliningMap {
267             index: FxHashMap::default(),
268             targets: Vec::new(),
269             inlines: GrowableBitSet::with_capacity(1024),
270         }
271     }
272
273     fn record_accesses<'a>(
274         &mut self,
275         source: MonoItem<'tcx>,
276         new_targets: &'a [(Spanned<MonoItem<'tcx>>, bool)],
277     ) where
278         'tcx: 'a,
279     {
280         let start_index = self.targets.len();
281         let new_items_count = new_targets.len();
282         let new_items_count_total = new_items_count + self.targets.len();
283
284         self.targets.reserve(new_items_count);
285         self.inlines.ensure(new_items_count_total);
286
287         for (i, (Spanned { node: mono_item, .. }, inlined)) in new_targets.into_iter().enumerate() {
288             self.targets.push(*mono_item);
289             if *inlined {
290                 self.inlines.insert(i + start_index);
291             }
292         }
293
294         let end_index = self.targets.len();
295         assert!(self.index.insert(source, start_index..end_index).is_none());
296     }
297
298     // Internally iterate over all items referenced by `source` which will be
299     // made available for inlining.
300     pub fn with_inlining_candidates<F>(&self, source: MonoItem<'tcx>, mut f: F)
301     where
302         F: FnMut(MonoItem<'tcx>),
303     {
304         if let Some(range) = self.index.get(&source) {
305             for (i, candidate) in self.targets[range.clone()].iter().enumerate() {
306                 if self.inlines.contains(range.start + i) {
307                     f(*candidate);
308                 }
309             }
310         }
311     }
312
313     // Internally iterate over all items and the things each accesses.
314     pub fn iter_accesses<F>(&self, mut f: F)
315     where
316         F: FnMut(MonoItem<'tcx>, &[MonoItem<'tcx>]),
317     {
318         for (&accessor, range) in &self.index {
319             f(accessor, &self.targets[range.clone()])
320         }
321     }
322 }
323
324 #[instrument(skip(tcx, mode), level = "debug")]
325 pub fn collect_crate_mono_items(
326     tcx: TyCtxt<'_>,
327     mode: MonoItemCollectionMode,
328 ) -> (FxHashSet<MonoItem<'_>>, InliningMap<'_>) {
329     let _prof_timer = tcx.prof.generic_activity("monomorphization_collector");
330
331     let roots =
332         tcx.sess.time("monomorphization_collector_root_collections", || collect_roots(tcx, mode));
333
334     debug!("building mono item graph, beginning at roots");
335
336     let mut visited = MTLock::new(FxHashSet::default());
337     let mut inlining_map = MTLock::new(InliningMap::new());
338     let recursion_limit = tcx.recursion_limit();
339
340     {
341         let visited: MTRef<'_, _> = &mut visited;
342         let inlining_map: MTRef<'_, _> = &mut inlining_map;
343
344         tcx.sess.time("monomorphization_collector_graph_walk", || {
345             par_for_each_in(roots, |root| {
346                 let mut recursion_depths = DefIdMap::default();
347                 collect_items_rec(
348                     tcx,
349                     dummy_spanned(root),
350                     visited,
351                     &mut recursion_depths,
352                     recursion_limit,
353                     inlining_map,
354                 );
355             });
356         });
357     }
358
359     (visited.into_inner(), inlining_map.into_inner())
360 }
361
362 // Find all non-generic items by walking the HIR. These items serve as roots to
363 // start monomorphizing from.
364 #[instrument(skip(tcx, mode), level = "debug")]
365 fn collect_roots(tcx: TyCtxt<'_>, mode: MonoItemCollectionMode) -> Vec<MonoItem<'_>> {
366     debug!("collecting roots");
367     let mut roots = MonoItems { compute_inlining: false, tcx, items: Vec::new() };
368
369     {
370         let entry_fn = tcx.entry_fn(());
371
372         debug!("collect_roots: entry_fn = {:?}", entry_fn);
373
374         let mut collector = RootCollector { tcx, mode, entry_fn, output: &mut roots };
375
376         let crate_items = tcx.hir_crate_items(());
377
378         for id in crate_items.items() {
379             collector.process_item(id);
380         }
381
382         for id in crate_items.impl_items() {
383             collector.process_impl_item(id);
384         }
385
386         collector.push_extra_entry_roots();
387     }
388
389     // We can only codegen items that are instantiable - items all of
390     // whose predicates hold. Luckily, items that aren't instantiable
391     // can't actually be used, so we can just skip codegenning them.
392     roots
393         .items
394         .into_iter()
395         .filter_map(|(Spanned { node: mono_item, .. }, _)| {
396             mono_item.is_instantiable(tcx).then_some(mono_item)
397         })
398         .collect()
399 }
400
401 /// Collect all monomorphized items reachable from `starting_point`, and emit a note diagnostic if a
402 /// post-monorphization error is encountered during a collection step.
403 #[instrument(skip(tcx, visited, recursion_depths, recursion_limit, inlining_map), level = "debug")]
404 fn collect_items_rec<'tcx>(
405     tcx: TyCtxt<'tcx>,
406     starting_point: Spanned<MonoItem<'tcx>>,
407     visited: MTRef<'_, MTLock<FxHashSet<MonoItem<'tcx>>>>,
408     recursion_depths: &mut DefIdMap<usize>,
409     recursion_limit: Limit,
410     inlining_map: MTRef<'_, MTLock<InliningMap<'tcx>>>,
411 ) {
412     if !visited.lock_mut().insert(starting_point.node) {
413         // We've been here already, no need to search again.
414         return;
415     }
416
417     let mut neighbors = MonoItems { compute_inlining: true, tcx, items: Vec::new() };
418     let recursion_depth_reset;
419
420     //
421     // Post-monomorphization errors MVP
422     //
423     // We can encounter errors while monomorphizing an item, but we don't have a good way of
424     // showing a complete stack of spans ultimately leading to collecting the erroneous one yet.
425     // (It's also currently unclear exactly which diagnostics and information would be interesting
426     // to report in such cases)
427     //
428     // This leads to suboptimal error reporting: a post-monomorphization error (PME) will be
429     // shown with just a spanned piece of code causing the error, without information on where
430     // it was called from. This is especially obscure if the erroneous mono item is in a
431     // dependency. See for example issue #85155, where, before minimization, a PME happened two
432     // crates downstream from libcore's stdarch, without a way to know which dependency was the
433     // cause.
434     //
435     // If such an error occurs in the current crate, its span will be enough to locate the
436     // source. If the cause is in another crate, the goal here is to quickly locate which mono
437     // item in the current crate is ultimately responsible for causing the error.
438     //
439     // To give at least _some_ context to the user: while collecting mono items, we check the
440     // error count. If it has changed, a PME occurred, and we trigger some diagnostics about the
441     // current step of mono items collection.
442     //
443     // FIXME: don't rely on global state, instead bubble up errors. Note: this is very hard to do.
444     let error_count = tcx.sess.diagnostic().err_count();
445
446     match starting_point.node {
447         MonoItem::Static(def_id) => {
448             let instance = Instance::mono(tcx, def_id);
449
450             // Sanity check whether this ended up being collected accidentally
451             debug_assert!(should_codegen_locally(tcx, &instance));
452
453             let ty = instance.ty(tcx, ty::ParamEnv::reveal_all());
454             visit_drop_use(tcx, ty, true, starting_point.span, &mut neighbors);
455
456             recursion_depth_reset = None;
457
458             if let Ok(alloc) = tcx.eval_static_initializer(def_id) {
459                 for &id in alloc.inner().provenance().values() {
460                     collect_miri(tcx, id, &mut neighbors);
461                 }
462             }
463         }
464         MonoItem::Fn(instance) => {
465             // Sanity check whether this ended up being collected accidentally
466             debug_assert!(should_codegen_locally(tcx, &instance));
467
468             // Keep track of the monomorphization recursion depth
469             recursion_depth_reset = Some(check_recursion_limit(
470                 tcx,
471                 instance,
472                 starting_point.span,
473                 recursion_depths,
474                 recursion_limit,
475             ));
476             check_type_length_limit(tcx, instance);
477
478             rustc_data_structures::stack::ensure_sufficient_stack(|| {
479                 collect_neighbours(tcx, instance, &mut neighbors);
480             });
481         }
482         MonoItem::GlobalAsm(item_id) => {
483             recursion_depth_reset = None;
484
485             let item = tcx.hir().item(item_id);
486             if let hir::ItemKind::GlobalAsm(asm) = item.kind {
487                 for (op, op_sp) in asm.operands {
488                     match op {
489                         hir::InlineAsmOperand::Const { .. } => {
490                             // Only constants which resolve to a plain integer
491                             // are supported. Therefore the value should not
492                             // depend on any other items.
493                         }
494                         hir::InlineAsmOperand::SymFn { anon_const } => {
495                             let fn_ty =
496                                 tcx.typeck_body(anon_const.body).node_type(anon_const.hir_id);
497                             visit_fn_use(tcx, fn_ty, false, *op_sp, &mut neighbors);
498                         }
499                         hir::InlineAsmOperand::SymStatic { path: _, def_id } => {
500                             let instance = Instance::mono(tcx, *def_id);
501                             if should_codegen_locally(tcx, &instance) {
502                                 trace!("collecting static {:?}", def_id);
503                                 neighbors.push(dummy_spanned(MonoItem::Static(*def_id)));
504                             }
505                         }
506                         hir::InlineAsmOperand::In { .. }
507                         | hir::InlineAsmOperand::Out { .. }
508                         | hir::InlineAsmOperand::InOut { .. }
509                         | hir::InlineAsmOperand::SplitInOut { .. } => {
510                             span_bug!(*op_sp, "invalid operand type for global_asm!")
511                         }
512                     }
513                 }
514             } else {
515                 span_bug!(item.span, "Mismatch between hir::Item type and MonoItem type")
516             }
517         }
518     }
519
520     // Check for PMEs and emit a diagnostic if one happened. To try to show relevant edges of the
521     // mono item graph.
522     if tcx.sess.diagnostic().err_count() > error_count
523         && starting_point.node.is_generic_fn()
524         && starting_point.node.is_user_defined()
525     {
526         let formatted_item = with_no_trimmed_paths!(starting_point.node.to_string());
527         tcx.sess.span_note_without_error(
528             starting_point.span,
529             &format!("the above error was encountered while instantiating `{}`", formatted_item),
530         );
531     }
532     inlining_map.lock_mut().record_accesses(starting_point.node, &neighbors.items);
533
534     for (neighbour, _) in neighbors.items {
535         collect_items_rec(tcx, neighbour, visited, recursion_depths, recursion_limit, inlining_map);
536     }
537
538     if let Some((def_id, depth)) = recursion_depth_reset {
539         recursion_depths.insert(def_id, depth);
540     }
541 }
542
543 /// Format instance name that is already known to be too long for rustc.
544 /// Show only the first and last 32 characters to avoid blasting
545 /// the user's terminal with thousands of lines of type-name.
546 ///
547 /// If the type name is longer than before+after, it will be written to a file.
548 fn shrunk_instance_name<'tcx>(
549     tcx: TyCtxt<'tcx>,
550     instance: &Instance<'tcx>,
551     before: usize,
552     after: usize,
553 ) -> (String, Option<PathBuf>) {
554     let s = instance.to_string();
555
556     // Only use the shrunk version if it's really shorter.
557     // This also avoids the case where before and after slices overlap.
558     if s.chars().nth(before + after + 1).is_some() {
559         // An iterator of all byte positions including the end of the string.
560         let positions = || s.char_indices().map(|(i, _)| i).chain(iter::once(s.len()));
561
562         let shrunk = format!(
563             "{before}...{after}",
564             before = &s[..positions().nth(before).unwrap_or(s.len())],
565             after = &s[positions().rev().nth(after).unwrap_or(0)..],
566         );
567
568         let path = tcx.output_filenames(()).temp_path_ext("long-type.txt", None);
569         let written_to_path = std::fs::write(&path, s).ok().map(|_| path);
570
571         (shrunk, written_to_path)
572     } else {
573         (s, None)
574     }
575 }
576
577 fn check_recursion_limit<'tcx>(
578     tcx: TyCtxt<'tcx>,
579     instance: Instance<'tcx>,
580     span: Span,
581     recursion_depths: &mut DefIdMap<usize>,
582     recursion_limit: Limit,
583 ) -> (DefId, usize) {
584     let def_id = instance.def_id();
585     let recursion_depth = recursion_depths.get(&def_id).cloned().unwrap_or(0);
586     debug!(" => recursion depth={}", recursion_depth);
587
588     let adjusted_recursion_depth = if Some(def_id) == tcx.lang_items().drop_in_place_fn() {
589         // HACK: drop_in_place creates tight monomorphization loops. Give
590         // it more margin.
591         recursion_depth / 4
592     } else {
593         recursion_depth
594     };
595
596     // Code that needs to instantiate the same function recursively
597     // more than the recursion limit is assumed to be causing an
598     // infinite expansion.
599     if !recursion_limit.value_within_limit(adjusted_recursion_depth) {
600         let def_span = tcx.def_span(def_id);
601         let def_path_str = tcx.def_path_str(def_id);
602         let (shrunk, written_to_path) = shrunk_instance_name(tcx, &instance, 32, 32);
603         let mut path = PathBuf::new();
604         let was_written = if written_to_path.is_some() {
605             path = written_to_path.unwrap();
606             Some(())
607         } else {
608             None
609         };
610         tcx.sess.emit_fatal(RecursionLimit {
611             span,
612             shrunk,
613             def_span,
614             def_path_str,
615             was_written,
616             path,
617         });
618     }
619
620     recursion_depths.insert(def_id, recursion_depth + 1);
621
622     (def_id, recursion_depth)
623 }
624
625 fn check_type_length_limit<'tcx>(tcx: TyCtxt<'tcx>, instance: Instance<'tcx>) {
626     let type_length = instance
627         .substs
628         .iter()
629         .flat_map(|arg| arg.walk())
630         .filter(|arg| match arg.unpack() {
631             GenericArgKind::Type(_) | GenericArgKind::Const(_) => true,
632             GenericArgKind::Lifetime(_) => false,
633         })
634         .count();
635     debug!(" => type length={}", type_length);
636
637     // Rust code can easily create exponentially-long types using only a
638     // polynomial recursion depth. Even with the default recursion
639     // depth, you can easily get cases that take >2^60 steps to run,
640     // which means that rustc basically hangs.
641     //
642     // Bail out in these cases to avoid that bad user experience.
643     if !tcx.type_length_limit().value_within_limit(type_length) {
644         let (shrunk, written_to_path) = shrunk_instance_name(tcx, &instance, 32, 32);
645         let span = tcx.def_span(instance.def_id());
646         let mut path = PathBuf::new();
647         let was_written = if written_to_path.is_some() {
648             path = written_to_path.unwrap();
649             Some(())
650         } else {
651             None
652         };
653         tcx.sess.emit_fatal(TypeLengthLimit { span, shrunk, was_written, path, type_length });
654     }
655 }
656
657 struct MirNeighborCollector<'a, 'tcx> {
658     tcx: TyCtxt<'tcx>,
659     body: &'a mir::Body<'tcx>,
660     output: &'a mut MonoItems<'tcx>,
661     instance: Instance<'tcx>,
662 }
663
664 impl<'a, 'tcx> MirNeighborCollector<'a, 'tcx> {
665     pub fn monomorphize<T>(&self, value: T) -> T
666     where
667         T: TypeFoldable<'tcx>,
668     {
669         debug!("monomorphize: self.instance={:?}", self.instance);
670         self.instance.subst_mir_and_normalize_erasing_regions(
671             self.tcx,
672             ty::ParamEnv::reveal_all(),
673             value,
674         )
675     }
676 }
677
678 impl<'a, 'tcx> MirVisitor<'tcx> for MirNeighborCollector<'a, 'tcx> {
679     fn visit_rvalue(&mut self, rvalue: &mir::Rvalue<'tcx>, location: Location) {
680         debug!("visiting rvalue {:?}", *rvalue);
681
682         let span = self.body.source_info(location).span;
683
684         match *rvalue {
685             // When doing an cast from a regular pointer to a fat pointer, we
686             // have to instantiate all methods of the trait being cast to, so we
687             // can build the appropriate vtable.
688             mir::Rvalue::Cast(
689                 mir::CastKind::Pointer(PointerCast::Unsize),
690                 ref operand,
691                 target_ty,
692             )
693             | mir::Rvalue::Cast(mir::CastKind::DynStar, ref operand, target_ty) => {
694                 let target_ty = self.monomorphize(target_ty);
695                 let source_ty = operand.ty(self.body, self.tcx);
696                 let source_ty = self.monomorphize(source_ty);
697                 let (source_ty, target_ty) =
698                     find_vtable_types_for_unsizing(self.tcx, source_ty, target_ty);
699                 // This could also be a different Unsize instruction, like
700                 // from a fixed sized array to a slice. But we are only
701                 // interested in things that produce a vtable.
702                 if (target_ty.is_trait() && !source_ty.is_trait())
703                     || (target_ty.is_dyn_star() && !source_ty.is_dyn_star())
704                 {
705                     create_mono_items_for_vtable_methods(
706                         self.tcx,
707                         target_ty,
708                         source_ty,
709                         span,
710                         self.output,
711                     );
712                 }
713             }
714             mir::Rvalue::Cast(
715                 mir::CastKind::Pointer(PointerCast::ReifyFnPointer),
716                 ref operand,
717                 _,
718             ) => {
719                 let fn_ty = operand.ty(self.body, self.tcx);
720                 let fn_ty = self.monomorphize(fn_ty);
721                 visit_fn_use(self.tcx, fn_ty, false, span, &mut self.output);
722             }
723             mir::Rvalue::Cast(
724                 mir::CastKind::Pointer(PointerCast::ClosureFnPointer(_)),
725                 ref operand,
726                 _,
727             ) => {
728                 let source_ty = operand.ty(self.body, self.tcx);
729                 let source_ty = self.monomorphize(source_ty);
730                 match *source_ty.kind() {
731                     ty::Closure(def_id, substs) => {
732                         let instance = Instance::resolve_closure(
733                             self.tcx,
734                             def_id,
735                             substs,
736                             ty::ClosureKind::FnOnce,
737                         )
738                         .expect("failed to normalize and resolve closure during codegen");
739                         if should_codegen_locally(self.tcx, &instance) {
740                             self.output.push(create_fn_mono_item(self.tcx, instance, span));
741                         }
742                     }
743                     _ => bug!(),
744                 }
745             }
746             mir::Rvalue::ThreadLocalRef(def_id) => {
747                 assert!(self.tcx.is_thread_local_static(def_id));
748                 let instance = Instance::mono(self.tcx, def_id);
749                 if should_codegen_locally(self.tcx, &instance) {
750                     trace!("collecting thread-local static {:?}", def_id);
751                     self.output.push(respan(span, MonoItem::Static(def_id)));
752                 }
753             }
754             _ => { /* not interesting */ }
755         }
756
757         self.super_rvalue(rvalue, location);
758     }
759
760     /// This does not walk the constant, as it has been handled entirely here and trying
761     /// to walk it would attempt to evaluate the `ty::Const` inside, which doesn't necessarily
762     /// work, as some constants cannot be represented in the type system.
763     #[instrument(skip(self), level = "debug")]
764     fn visit_constant(&mut self, constant: &mir::Constant<'tcx>, location: Location) {
765         let literal = self.monomorphize(constant.literal);
766         let val = match literal {
767             mir::ConstantKind::Val(val, _) => val,
768             mir::ConstantKind::Ty(ct) => match ct.kind() {
769                 ty::ConstKind::Value(val) => self.tcx.valtree_to_const_val((ct.ty(), val)),
770                 ty::ConstKind::Unevaluated(ct) => {
771                     debug!(?ct);
772                     let param_env = ty::ParamEnv::reveal_all();
773                     match self.tcx.const_eval_resolve(param_env, ct, None) {
774                         // The `monomorphize` call should have evaluated that constant already.
775                         Ok(val) => val,
776                         Err(ErrorHandled::Reported(_) | ErrorHandled::Linted) => return,
777                         Err(ErrorHandled::TooGeneric) => span_bug!(
778                             self.body.source_info(location).span,
779                             "collection encountered polymorphic constant: {:?}",
780                             literal
781                         ),
782                     }
783                 }
784                 _ => return,
785             },
786         };
787         collect_const_value(self.tcx, val, self.output);
788         self.visit_ty(literal.ty(), TyContext::Location(location));
789     }
790
791     #[instrument(skip(self), level = "debug")]
792     fn visit_const(&mut self, constant: ty::Const<'tcx>, location: Location) {
793         debug!("visiting const {:?} @ {:?}", constant, location);
794
795         let substituted_constant = self.monomorphize(constant);
796         let param_env = ty::ParamEnv::reveal_all();
797
798         match substituted_constant.kind() {
799             ty::ConstKind::Value(val) => {
800                 let const_val = self.tcx.valtree_to_const_val((constant.ty(), val));
801                 collect_const_value(self.tcx, const_val, self.output)
802             }
803             ty::ConstKind::Unevaluated(unevaluated) => {
804                 match self.tcx.const_eval_resolve(param_env, unevaluated, None) {
805                     // The `monomorphize` call should have evaluated that constant already.
806                     Ok(val) => span_bug!(
807                         self.body.source_info(location).span,
808                         "collection encountered the unevaluated constant {} which evaluated to {:?}",
809                         substituted_constant,
810                         val
811                     ),
812                     Err(ErrorHandled::Reported(_) | ErrorHandled::Linted) => {}
813                     Err(ErrorHandled::TooGeneric) => span_bug!(
814                         self.body.source_info(location).span,
815                         "collection encountered polymorphic constant: {}",
816                         substituted_constant
817                     ),
818                 }
819             }
820             _ => {}
821         }
822
823         self.super_const(constant);
824     }
825
826     fn visit_terminator(&mut self, terminator: &mir::Terminator<'tcx>, location: Location) {
827         debug!("visiting terminator {:?} @ {:?}", terminator, location);
828         let source = self.body.source_info(location).span;
829
830         let tcx = self.tcx;
831         match terminator.kind {
832             mir::TerminatorKind::Call { ref func, .. } => {
833                 let callee_ty = func.ty(self.body, tcx);
834                 let callee_ty = self.monomorphize(callee_ty);
835                 visit_fn_use(self.tcx, callee_ty, true, source, &mut self.output)
836             }
837             mir::TerminatorKind::Drop { ref place, .. }
838             | mir::TerminatorKind::DropAndReplace { ref place, .. } => {
839                 let ty = place.ty(self.body, self.tcx).ty;
840                 let ty = self.monomorphize(ty);
841                 visit_drop_use(self.tcx, ty, true, source, self.output);
842             }
843             mir::TerminatorKind::InlineAsm { ref operands, .. } => {
844                 for op in operands {
845                     match *op {
846                         mir::InlineAsmOperand::SymFn { ref value } => {
847                             let fn_ty = self.monomorphize(value.literal.ty());
848                             visit_fn_use(self.tcx, fn_ty, false, source, &mut self.output);
849                         }
850                         mir::InlineAsmOperand::SymStatic { def_id } => {
851                             let instance = Instance::mono(self.tcx, def_id);
852                             if should_codegen_locally(self.tcx, &instance) {
853                                 trace!("collecting asm sym static {:?}", def_id);
854                                 self.output.push(respan(source, MonoItem::Static(def_id)));
855                             }
856                         }
857                         _ => {}
858                     }
859                 }
860             }
861             mir::TerminatorKind::Assert { ref msg, .. } => {
862                 let lang_item = match msg {
863                     mir::AssertKind::BoundsCheck { .. } => LangItem::PanicBoundsCheck,
864                     _ => LangItem::Panic,
865                 };
866                 let instance = Instance::mono(tcx, tcx.require_lang_item(lang_item, Some(source)));
867                 if should_codegen_locally(tcx, &instance) {
868                     self.output.push(create_fn_mono_item(tcx, instance, source));
869                 }
870             }
871             mir::TerminatorKind::Abort { .. } => {
872                 let instance = Instance::mono(
873                     tcx,
874                     tcx.require_lang_item(LangItem::PanicNoUnwind, Some(source)),
875                 );
876                 if should_codegen_locally(tcx, &instance) {
877                     self.output.push(create_fn_mono_item(tcx, instance, source));
878                 }
879             }
880             mir::TerminatorKind::Goto { .. }
881             | mir::TerminatorKind::SwitchInt { .. }
882             | mir::TerminatorKind::Resume
883             | mir::TerminatorKind::Return
884             | mir::TerminatorKind::Unreachable => {}
885             mir::TerminatorKind::GeneratorDrop
886             | mir::TerminatorKind::Yield { .. }
887             | mir::TerminatorKind::FalseEdge { .. }
888             | mir::TerminatorKind::FalseUnwind { .. } => bug!(),
889         }
890
891         self.super_terminator(terminator, location);
892     }
893
894     fn visit_operand(&mut self, operand: &mir::Operand<'tcx>, location: Location) {
895         self.super_operand(operand, location);
896         let limit = self.tcx.move_size_limit().0;
897         if limit == 0 {
898             return;
899         }
900         let limit = Size::from_bytes(limit);
901         let ty = operand.ty(self.body, self.tcx);
902         let ty = self.monomorphize(ty);
903         let layout = self.tcx.layout_of(ty::ParamEnv::reveal_all().and(ty));
904         if let Ok(layout) = layout {
905             if layout.size > limit {
906                 debug!(?layout);
907                 let source_info = self.body.source_info(location);
908                 debug!(?source_info);
909                 let lint_root = source_info.scope.lint_root(&self.body.source_scopes);
910                 debug!(?lint_root);
911                 let Some(lint_root) = lint_root else {
912                     // This happens when the issue is in a function from a foreign crate that
913                     // we monomorphized in the current crate. We can't get a `HirId` for things
914                     // in other crates.
915                     // FIXME: Find out where to report the lint on. Maybe simply crate-level lint root
916                     // but correct span? This would make the lint at least accept crate-level lint attributes.
917                     return;
918                 };
919                 self.tcx.emit_spanned_lint(
920                     LARGE_ASSIGNMENTS,
921                     lint_root,
922                     source_info.span,
923                     LargeAssignmentsLint {
924                         span: source_info.span,
925                         size: layout.size.bytes(),
926                         limit: limit.bytes(),
927                     },
928                 )
929             }
930         }
931     }
932
933     fn visit_local(
934         &mut self,
935         _place_local: Local,
936         _context: mir::visit::PlaceContext,
937         _location: Location,
938     ) {
939     }
940 }
941
942 fn visit_drop_use<'tcx>(
943     tcx: TyCtxt<'tcx>,
944     ty: Ty<'tcx>,
945     is_direct_call: bool,
946     source: Span,
947     output: &mut MonoItems<'tcx>,
948 ) {
949     let instance = Instance::resolve_drop_in_place(tcx, ty);
950     visit_instance_use(tcx, instance, is_direct_call, source, output);
951 }
952
953 fn visit_fn_use<'tcx>(
954     tcx: TyCtxt<'tcx>,
955     ty: Ty<'tcx>,
956     is_direct_call: bool,
957     source: Span,
958     output: &mut MonoItems<'tcx>,
959 ) {
960     if let ty::FnDef(def_id, substs) = *ty.kind() {
961         let instance = if is_direct_call {
962             ty::Instance::resolve(tcx, ty::ParamEnv::reveal_all(), def_id, substs).unwrap().unwrap()
963         } else {
964             ty::Instance::resolve_for_fn_ptr(tcx, ty::ParamEnv::reveal_all(), def_id, substs)
965                 .unwrap()
966         };
967         visit_instance_use(tcx, instance, is_direct_call, source, output);
968     }
969 }
970
971 fn visit_instance_use<'tcx>(
972     tcx: TyCtxt<'tcx>,
973     instance: ty::Instance<'tcx>,
974     is_direct_call: bool,
975     source: Span,
976     output: &mut MonoItems<'tcx>,
977 ) {
978     debug!("visit_item_use({:?}, is_direct_call={:?})", instance, is_direct_call);
979     if !should_codegen_locally(tcx, &instance) {
980         return;
981     }
982
983     match instance.def {
984         ty::InstanceDef::Virtual(..) | ty::InstanceDef::Intrinsic(_) => {
985             if !is_direct_call {
986                 bug!("{:?} being reified", instance);
987             }
988         }
989         ty::InstanceDef::DropGlue(_, None) => {
990             // Don't need to emit noop drop glue if we are calling directly.
991             if !is_direct_call {
992                 output.push(create_fn_mono_item(tcx, instance, source));
993             }
994         }
995         ty::InstanceDef::DropGlue(_, Some(_))
996         | ty::InstanceDef::VTableShim(..)
997         | ty::InstanceDef::ReifyShim(..)
998         | ty::InstanceDef::ClosureOnceShim { .. }
999         | ty::InstanceDef::Item(..)
1000         | ty::InstanceDef::FnPtrShim(..)
1001         | ty::InstanceDef::CloneShim(..) => {
1002             output.push(create_fn_mono_item(tcx, instance, source));
1003         }
1004     }
1005 }
1006
1007 /// Returns `true` if we should codegen an instance in the local crate, or returns `false` if we
1008 /// can just link to the upstream crate and therefore don't need a mono item.
1009 fn should_codegen_locally<'tcx>(tcx: TyCtxt<'tcx>, instance: &Instance<'tcx>) -> bool {
1010     let Some(def_id) = instance.def.def_id_if_not_guaranteed_local_codegen() else {
1011         return true;
1012     };
1013
1014     if tcx.is_foreign_item(def_id) {
1015         // Foreign items are always linked against, there's no way of instantiating them.
1016         return false;
1017     }
1018
1019     if def_id.is_local() {
1020         // Local items cannot be referred to locally without monomorphizing them locally.
1021         return true;
1022     }
1023
1024     if tcx.is_reachable_non_generic(def_id)
1025         || instance.polymorphize(tcx).upstream_monomorphization(tcx).is_some()
1026     {
1027         // We can link to the item in question, no instance needed in this crate.
1028         return false;
1029     }
1030
1031     if let DefKind::Static(_) = tcx.def_kind(def_id) {
1032         // We cannot monomorphize statics from upstream crates.
1033         return false;
1034     }
1035
1036     if !tcx.is_mir_available(def_id) {
1037         bug!("no MIR available for {:?}", def_id);
1038     }
1039
1040     true
1041 }
1042
1043 /// For a given pair of source and target type that occur in an unsizing coercion,
1044 /// this function finds the pair of types that determines the vtable linking
1045 /// them.
1046 ///
1047 /// For example, the source type might be `&SomeStruct` and the target type
1048 /// might be `&dyn SomeTrait` in a cast like:
1049 ///
1050 /// ```rust,ignore (not real code)
1051 /// let src: &SomeStruct = ...;
1052 /// let target = src as &dyn SomeTrait;
1053 /// ```
1054 ///
1055 /// Then the output of this function would be (SomeStruct, SomeTrait) since for
1056 /// constructing the `target` fat-pointer we need the vtable for that pair.
1057 ///
1058 /// Things can get more complicated though because there's also the case where
1059 /// the unsized type occurs as a field:
1060 ///
1061 /// ```rust
1062 /// struct ComplexStruct<T: ?Sized> {
1063 ///    a: u32,
1064 ///    b: f64,
1065 ///    c: T
1066 /// }
1067 /// ```
1068 ///
1069 /// In this case, if `T` is sized, `&ComplexStruct<T>` is a thin pointer. If `T`
1070 /// is unsized, `&SomeStruct` is a fat pointer, and the vtable it points to is
1071 /// for the pair of `T` (which is a trait) and the concrete type that `T` was
1072 /// originally coerced from:
1073 ///
1074 /// ```rust,ignore (not real code)
1075 /// let src: &ComplexStruct<SomeStruct> = ...;
1076 /// let target = src as &ComplexStruct<dyn SomeTrait>;
1077 /// ```
1078 ///
1079 /// Again, we want this `find_vtable_types_for_unsizing()` to provide the pair
1080 /// `(SomeStruct, SomeTrait)`.
1081 ///
1082 /// Finally, there is also the case of custom unsizing coercions, e.g., for
1083 /// smart pointers such as `Rc` and `Arc`.
1084 fn find_vtable_types_for_unsizing<'tcx>(
1085     tcx: TyCtxt<'tcx>,
1086     source_ty: Ty<'tcx>,
1087     target_ty: Ty<'tcx>,
1088 ) -> (Ty<'tcx>, Ty<'tcx>) {
1089     let ptr_vtable = |inner_source: Ty<'tcx>, inner_target: Ty<'tcx>| {
1090         let param_env = ty::ParamEnv::reveal_all();
1091         let type_has_metadata = |ty: Ty<'tcx>| -> bool {
1092             if ty.is_sized(tcx.at(DUMMY_SP), param_env) {
1093                 return false;
1094             }
1095             let tail = tcx.struct_tail_erasing_lifetimes(ty, param_env);
1096             match tail.kind() {
1097                 ty::Foreign(..) => false,
1098                 ty::Str | ty::Slice(..) | ty::Dynamic(..) => true,
1099                 _ => bug!("unexpected unsized tail: {:?}", tail),
1100             }
1101         };
1102         if type_has_metadata(inner_source) {
1103             (inner_source, inner_target)
1104         } else {
1105             tcx.struct_lockstep_tails_erasing_lifetimes(inner_source, inner_target, param_env)
1106         }
1107     };
1108
1109     match (&source_ty.kind(), &target_ty.kind()) {
1110         (&ty::Ref(_, a, _), &ty::Ref(_, b, _) | &ty::RawPtr(ty::TypeAndMut { ty: b, .. }))
1111         | (&ty::RawPtr(ty::TypeAndMut { ty: a, .. }), &ty::RawPtr(ty::TypeAndMut { ty: b, .. })) => {
1112             ptr_vtable(*a, *b)
1113         }
1114         (&ty::Adt(def_a, _), &ty::Adt(def_b, _)) if def_a.is_box() && def_b.is_box() => {
1115             ptr_vtable(source_ty.boxed_ty(), target_ty.boxed_ty())
1116         }
1117
1118         // T as dyn* Trait
1119         (_, &ty::Dynamic(_, _, ty::DynStar)) => ptr_vtable(source_ty, target_ty),
1120
1121         (&ty::Adt(source_adt_def, source_substs), &ty::Adt(target_adt_def, target_substs)) => {
1122             assert_eq!(source_adt_def, target_adt_def);
1123
1124             let CustomCoerceUnsized::Struct(coerce_index) =
1125                 crate::custom_coerce_unsize_info(tcx, source_ty, target_ty);
1126
1127             let source_fields = &source_adt_def.non_enum_variant().fields;
1128             let target_fields = &target_adt_def.non_enum_variant().fields;
1129
1130             assert!(
1131                 coerce_index < source_fields.len() && source_fields.len() == target_fields.len()
1132             );
1133
1134             find_vtable_types_for_unsizing(
1135                 tcx,
1136                 source_fields[coerce_index].ty(tcx, source_substs),
1137                 target_fields[coerce_index].ty(tcx, target_substs),
1138             )
1139         }
1140         _ => bug!(
1141             "find_vtable_types_for_unsizing: invalid coercion {:?} -> {:?}",
1142             source_ty,
1143             target_ty
1144         ),
1145     }
1146 }
1147
1148 #[instrument(skip(tcx), level = "debug", ret)]
1149 fn create_fn_mono_item<'tcx>(
1150     tcx: TyCtxt<'tcx>,
1151     instance: Instance<'tcx>,
1152     source: Span,
1153 ) -> Spanned<MonoItem<'tcx>> {
1154     let def_id = instance.def_id();
1155     if tcx.sess.opts.unstable_opts.profile_closures && def_id.is_local() && tcx.is_closure(def_id) {
1156         crate::util::dump_closure_profile(tcx, instance);
1157     }
1158
1159     respan(source, MonoItem::Fn(instance.polymorphize(tcx)))
1160 }
1161
1162 /// Creates a `MonoItem` for each method that is referenced by the vtable for
1163 /// the given trait/impl pair.
1164 fn create_mono_items_for_vtable_methods<'tcx>(
1165     tcx: TyCtxt<'tcx>,
1166     trait_ty: Ty<'tcx>,
1167     impl_ty: Ty<'tcx>,
1168     source: Span,
1169     output: &mut MonoItems<'tcx>,
1170 ) {
1171     assert!(!trait_ty.has_escaping_bound_vars() && !impl_ty.has_escaping_bound_vars());
1172
1173     if let ty::Dynamic(ref trait_ty, ..) = trait_ty.kind() {
1174         if let Some(principal) = trait_ty.principal() {
1175             let poly_trait_ref = principal.with_self_ty(tcx, impl_ty);
1176             assert!(!poly_trait_ref.has_escaping_bound_vars());
1177
1178             // Walk all methods of the trait, including those of its supertraits
1179             let entries = tcx.vtable_entries(poly_trait_ref);
1180             let methods = entries
1181                 .iter()
1182                 .filter_map(|entry| match entry {
1183                     VtblEntry::MetadataDropInPlace
1184                     | VtblEntry::MetadataSize
1185                     | VtblEntry::MetadataAlign
1186                     | VtblEntry::Vacant => None,
1187                     VtblEntry::TraitVPtr(_) => {
1188                         // all super trait items already covered, so skip them.
1189                         None
1190                     }
1191                     VtblEntry::Method(instance) => {
1192                         Some(*instance).filter(|instance| should_codegen_locally(tcx, instance))
1193                     }
1194                 })
1195                 .map(|item| create_fn_mono_item(tcx, item, source));
1196             output.extend(methods);
1197         }
1198
1199         // Also add the destructor.
1200         visit_drop_use(tcx, impl_ty, false, source, output);
1201     }
1202 }
1203
1204 //=-----------------------------------------------------------------------------
1205 // Root Collection
1206 //=-----------------------------------------------------------------------------
1207
1208 struct RootCollector<'a, 'tcx> {
1209     tcx: TyCtxt<'tcx>,
1210     mode: MonoItemCollectionMode,
1211     output: &'a mut MonoItems<'tcx>,
1212     entry_fn: Option<(DefId, EntryFnType)>,
1213 }
1214
1215 impl<'v> RootCollector<'_, 'v> {
1216     fn process_item(&mut self, id: hir::ItemId) {
1217         match self.tcx.def_kind(id.def_id) {
1218             DefKind::Enum | DefKind::Struct | DefKind::Union => {
1219                 let item = self.tcx.hir().item(id);
1220                 match item.kind {
1221                     hir::ItemKind::Enum(_, ref generics)
1222                     | hir::ItemKind::Struct(_, ref generics)
1223                     | hir::ItemKind::Union(_, ref generics) => {
1224                         if generics.params.is_empty() {
1225                             if self.mode == MonoItemCollectionMode::Eager {
1226                                 debug!(
1227                                     "RootCollector: ADT drop-glue for {}",
1228                                     self.tcx.def_path_str(item.def_id.to_def_id())
1229                                 );
1230
1231                                 let ty =
1232                                     Instance::new(item.def_id.to_def_id(), InternalSubsts::empty())
1233                                         .ty(self.tcx, ty::ParamEnv::reveal_all());
1234                                 visit_drop_use(self.tcx, ty, true, DUMMY_SP, self.output);
1235                             }
1236                         }
1237                     }
1238                     _ => bug!(),
1239                 }
1240             }
1241             DefKind::GlobalAsm => {
1242                 debug!(
1243                     "RootCollector: ItemKind::GlobalAsm({})",
1244                     self.tcx.def_path_str(id.def_id.to_def_id())
1245                 );
1246                 self.output.push(dummy_spanned(MonoItem::GlobalAsm(id)));
1247             }
1248             DefKind::Static(..) => {
1249                 debug!(
1250                     "RootCollector: ItemKind::Static({})",
1251                     self.tcx.def_path_str(id.def_id.to_def_id())
1252                 );
1253                 self.output.push(dummy_spanned(MonoItem::Static(id.def_id.to_def_id())));
1254             }
1255             DefKind::Const => {
1256                 // const items only generate mono items if they are
1257                 // actually used somewhere. Just declaring them is insufficient.
1258
1259                 // but even just declaring them must collect the items they refer to
1260                 if let Ok(val) = self.tcx.const_eval_poly(id.def_id.to_def_id()) {
1261                     collect_const_value(self.tcx, val, &mut self.output);
1262                 }
1263             }
1264             DefKind::Impl => {
1265                 if self.mode == MonoItemCollectionMode::Eager {
1266                     let item = self.tcx.hir().item(id);
1267                     create_mono_items_for_default_impls(self.tcx, item, self.output);
1268                 }
1269             }
1270             DefKind::Fn => {
1271                 self.push_if_root(id.def_id);
1272             }
1273             _ => {}
1274         }
1275     }
1276
1277     fn process_impl_item(&mut self, id: hir::ImplItemId) {
1278         if matches!(self.tcx.def_kind(id.def_id), DefKind::AssocFn) {
1279             self.push_if_root(id.def_id);
1280         }
1281     }
1282
1283     fn is_root(&self, def_id: LocalDefId) -> bool {
1284         !item_requires_monomorphization(self.tcx, def_id)
1285             && match self.mode {
1286                 MonoItemCollectionMode::Eager => true,
1287                 MonoItemCollectionMode::Lazy => {
1288                     self.entry_fn.and_then(|(id, _)| id.as_local()) == Some(def_id)
1289                         || self.tcx.is_reachable_non_generic(def_id)
1290                         || self
1291                             .tcx
1292                             .codegen_fn_attrs(def_id)
1293                             .flags
1294                             .contains(CodegenFnAttrFlags::RUSTC_STD_INTERNAL_SYMBOL)
1295                 }
1296             }
1297     }
1298
1299     /// If `def_id` represents a root, pushes it onto the list of
1300     /// outputs. (Note that all roots must be monomorphic.)
1301     #[instrument(skip(self), level = "debug")]
1302     fn push_if_root(&mut self, def_id: LocalDefId) {
1303         if self.is_root(def_id) {
1304             debug!("found root");
1305
1306             let instance = Instance::mono(self.tcx, def_id.to_def_id());
1307             self.output.push(create_fn_mono_item(self.tcx, instance, DUMMY_SP));
1308         }
1309     }
1310
1311     /// As a special case, when/if we encounter the
1312     /// `main()` function, we also have to generate a
1313     /// monomorphized copy of the start lang item based on
1314     /// the return type of `main`. This is not needed when
1315     /// the user writes their own `start` manually.
1316     fn push_extra_entry_roots(&mut self) {
1317         let Some((main_def_id, EntryFnType::Main { .. })) = self.entry_fn else {
1318             return;
1319         };
1320
1321         let start_def_id = match self.tcx.lang_items().require(LangItem::Start) {
1322             Ok(s) => s,
1323             Err(lang_item_err) => {
1324                 self.tcx
1325                     .sess
1326                     .emit_fatal(RequiresLangItem { lang_item: lang_item_err.0.name().to_string() });
1327             }
1328         };
1329         let main_ret_ty = self.tcx.fn_sig(main_def_id).output();
1330
1331         // Given that `main()` has no arguments,
1332         // then its return type cannot have
1333         // late-bound regions, since late-bound
1334         // regions must appear in the argument
1335         // listing.
1336         let main_ret_ty = self.tcx.normalize_erasing_regions(
1337             ty::ParamEnv::reveal_all(),
1338             main_ret_ty.no_bound_vars().unwrap(),
1339         );
1340
1341         let start_instance = Instance::resolve(
1342             self.tcx,
1343             ty::ParamEnv::reveal_all(),
1344             start_def_id,
1345             self.tcx.intern_substs(&[main_ret_ty.into()]),
1346         )
1347         .unwrap()
1348         .unwrap();
1349
1350         self.output.push(create_fn_mono_item(self.tcx, start_instance, DUMMY_SP));
1351     }
1352 }
1353
1354 fn item_requires_monomorphization(tcx: TyCtxt<'_>, def_id: LocalDefId) -> bool {
1355     let generics = tcx.generics_of(def_id);
1356     generics.requires_monomorphization(tcx)
1357 }
1358
1359 fn create_mono_items_for_default_impls<'tcx>(
1360     tcx: TyCtxt<'tcx>,
1361     item: &'tcx hir::Item<'tcx>,
1362     output: &mut MonoItems<'tcx>,
1363 ) {
1364     match item.kind {
1365         hir::ItemKind::Impl(ref impl_) => {
1366             for param in impl_.generics.params {
1367                 match param.kind {
1368                     hir::GenericParamKind::Lifetime { .. } => {}
1369                     hir::GenericParamKind::Type { .. } | hir::GenericParamKind::Const { .. } => {
1370                         return;
1371                     }
1372                 }
1373             }
1374
1375             debug!(
1376                 "create_mono_items_for_default_impls(item={})",
1377                 tcx.def_path_str(item.def_id.to_def_id())
1378             );
1379
1380             if let Some(trait_ref) = tcx.impl_trait_ref(item.def_id) {
1381                 let param_env = ty::ParamEnv::reveal_all();
1382                 let trait_ref = tcx.normalize_erasing_regions(param_env, trait_ref);
1383                 let overridden_methods = tcx.impl_item_implementor_ids(item.def_id);
1384                 for method in tcx.provided_trait_methods(trait_ref.def_id) {
1385                     if overridden_methods.contains_key(&method.def_id) {
1386                         continue;
1387                     }
1388
1389                     if tcx.generics_of(method.def_id).own_requires_monomorphization() {
1390                         continue;
1391                     }
1392
1393                     let substs =
1394                         InternalSubsts::for_item(tcx, method.def_id, |param, _| match param.kind {
1395                             GenericParamDefKind::Lifetime => tcx.lifetimes.re_erased.into(),
1396                             GenericParamDefKind::Type { .. }
1397                             | GenericParamDefKind::Const { .. } => {
1398                                 trait_ref.substs[param.index as usize]
1399                             }
1400                         });
1401                     let instance = ty::Instance::resolve(tcx, param_env, method.def_id, substs)
1402                         .unwrap()
1403                         .unwrap();
1404
1405                     let mono_item = create_fn_mono_item(tcx, instance, DUMMY_SP);
1406                     if mono_item.node.is_instantiable(tcx) && should_codegen_locally(tcx, &instance)
1407                     {
1408                         output.push(mono_item);
1409                     }
1410                 }
1411             }
1412         }
1413         _ => bug!(),
1414     }
1415 }
1416
1417 /// Scans the miri alloc in order to find function calls, closures, and drop-glue.
1418 fn collect_miri<'tcx>(tcx: TyCtxt<'tcx>, alloc_id: AllocId, output: &mut MonoItems<'tcx>) {
1419     match tcx.global_alloc(alloc_id) {
1420         GlobalAlloc::Static(def_id) => {
1421             assert!(!tcx.is_thread_local_static(def_id));
1422             let instance = Instance::mono(tcx, def_id);
1423             if should_codegen_locally(tcx, &instance) {
1424                 trace!("collecting static {:?}", def_id);
1425                 output.push(dummy_spanned(MonoItem::Static(def_id)));
1426             }
1427         }
1428         GlobalAlloc::Memory(alloc) => {
1429             trace!("collecting {:?} with {:#?}", alloc_id, alloc);
1430             for &inner in alloc.inner().provenance().values() {
1431                 rustc_data_structures::stack::ensure_sufficient_stack(|| {
1432                     collect_miri(tcx, inner, output);
1433                 });
1434             }
1435         }
1436         GlobalAlloc::Function(fn_instance) => {
1437             if should_codegen_locally(tcx, &fn_instance) {
1438                 trace!("collecting {:?} with {:#?}", alloc_id, fn_instance);
1439                 output.push(create_fn_mono_item(tcx, fn_instance, DUMMY_SP));
1440             }
1441         }
1442         GlobalAlloc::VTable(ty, trait_ref) => {
1443             let alloc_id = tcx.vtable_allocation((ty, trait_ref));
1444             collect_miri(tcx, alloc_id, output)
1445         }
1446     }
1447 }
1448
1449 /// Scans the MIR in order to find function calls, closures, and drop-glue.
1450 #[instrument(skip(tcx, output), level = "debug")]
1451 fn collect_neighbours<'tcx>(
1452     tcx: TyCtxt<'tcx>,
1453     instance: Instance<'tcx>,
1454     output: &mut MonoItems<'tcx>,
1455 ) {
1456     let body = tcx.instance_mir(instance.def);
1457     MirNeighborCollector { tcx, body: &body, output, instance }.visit_body(&body);
1458 }
1459
1460 #[instrument(skip(tcx, output), level = "debug")]
1461 fn collect_const_value<'tcx>(
1462     tcx: TyCtxt<'tcx>,
1463     value: ConstValue<'tcx>,
1464     output: &mut MonoItems<'tcx>,
1465 ) {
1466     match value {
1467         ConstValue::Scalar(Scalar::Ptr(ptr, _size)) => collect_miri(tcx, ptr.provenance, output),
1468         ConstValue::Slice { data: alloc, start: _, end: _ } | ConstValue::ByRef { alloc, .. } => {
1469             for &id in alloc.inner().provenance().values() {
1470                 collect_miri(tcx, id, output);
1471             }
1472         }
1473         _ => {}
1474     }
1475 }