]> git.lizzy.rs Git - rust.git/blob - compiler/rustc_metadata/src/locator.rs
Clean up `find_library_crate`.
[rust.git] / compiler / rustc_metadata / src / locator.rs
1 //! Finds crate binaries and loads their metadata
2 //!
3 //! Might I be the first to welcome you to a world of platform differences,
4 //! version requirements, dependency graphs, conflicting desires, and fun! This
5 //! is the major guts (along with metadata::creader) of the compiler for loading
6 //! crates and resolving dependencies. Let's take a tour!
7 //!
8 //! # The problem
9 //!
10 //! Each invocation of the compiler is immediately concerned with one primary
11 //! problem, to connect a set of crates to resolved crates on the filesystem.
12 //! Concretely speaking, the compiler follows roughly these steps to get here:
13 //!
14 //! 1. Discover a set of `extern crate` statements.
15 //! 2. Transform these directives into crate names. If the directive does not
16 //!    have an explicit name, then the identifier is the name.
17 //! 3. For each of these crate names, find a corresponding crate on the
18 //!    filesystem.
19 //!
20 //! Sounds easy, right? Let's walk into some of the nuances.
21 //!
22 //! ## Transitive Dependencies
23 //!
24 //! Let's say we've got three crates: A, B, and C. A depends on B, and B depends
25 //! on C. When we're compiling A, we primarily need to find and locate B, but we
26 //! also end up needing to find and locate C as well.
27 //!
28 //! The reason for this is that any of B's types could be composed of C's types,
29 //! any function in B could return a type from C, etc. To be able to guarantee
30 //! that we can always type-check/translate any function, we have to have
31 //! complete knowledge of the whole ecosystem, not just our immediate
32 //! dependencies.
33 //!
34 //! So now as part of the "find a corresponding crate on the filesystem" step
35 //! above, this involves also finding all crates for *all upstream
36 //! dependencies*. This includes all dependencies transitively.
37 //!
38 //! ## Rlibs and Dylibs
39 //!
40 //! The compiler has two forms of intermediate dependencies. These are dubbed
41 //! rlibs and dylibs for the static and dynamic variants, respectively. An rlib
42 //! is a rustc-defined file format (currently just an ar archive) while a dylib
43 //! is a platform-defined dynamic library. Each library has a metadata somewhere
44 //! inside of it.
45 //!
46 //! A third kind of dependency is an rmeta file. These are metadata files and do
47 //! not contain any code, etc. To a first approximation, these are treated in the
48 //! same way as rlibs. Where there is both an rlib and an rmeta file, the rlib
49 //! gets priority (even if the rmeta file is newer). An rmeta file is only
50 //! useful for checking a downstream crate, attempting to link one will cause an
51 //! error.
52 //!
53 //! When translating a crate name to a crate on the filesystem, we all of a
54 //! sudden need to take into account both rlibs and dylibs! Linkage later on may
55 //! use either one of these files, as each has their pros/cons. The job of crate
56 //! loading is to discover what's possible by finding all candidates.
57 //!
58 //! Most parts of this loading systems keep the dylib/rlib as just separate
59 //! variables.
60 //!
61 //! ## Where to look?
62 //!
63 //! We can't exactly scan your whole hard drive when looking for dependencies,
64 //! so we need to places to look. Currently the compiler will implicitly add the
65 //! target lib search path ($prefix/lib/rustlib/$target/lib) to any compilation,
66 //! and otherwise all -L flags are added to the search paths.
67 //!
68 //! ## What criterion to select on?
69 //!
70 //! This a pretty tricky area of loading crates. Given a file, how do we know
71 //! whether it's the right crate? Currently, the rules look along these lines:
72 //!
73 //! 1. Does the filename match an rlib/dylib pattern? That is to say, does the
74 //!    filename have the right prefix/suffix?
75 //! 2. Does the filename have the right prefix for the crate name being queried?
76 //!    This is filtering for files like `libfoo*.rlib` and such. If the crate
77 //!    we're looking for was originally compiled with -C extra-filename, the
78 //!    extra filename will be included in this prefix to reduce reading
79 //!    metadata from crates that would otherwise share our prefix.
80 //! 3. Is the file an actual rust library? This is done by loading the metadata
81 //!    from the library and making sure it's actually there.
82 //! 4. Does the name in the metadata agree with the name of the library?
83 //! 5. Does the target in the metadata agree with the current target?
84 //! 6. Does the SVH match? (more on this later)
85 //!
86 //! If the file answers `yes` to all these questions, then the file is
87 //! considered as being *candidate* for being accepted. It is illegal to have
88 //! more than two candidates as the compiler has no method by which to resolve
89 //! this conflict. Additionally, rlib/dylib candidates are considered
90 //! separately.
91 //!
92 //! After all this has happened, we have 1 or two files as candidates. These
93 //! represent the rlib/dylib file found for a library, and they're returned as
94 //! being found.
95 //!
96 //! ### What about versions?
97 //!
98 //! A lot of effort has been put forth to remove versioning from the compiler.
99 //! There have been forays in the past to have versioning baked in, but it was
100 //! largely always deemed insufficient to the point that it was recognized that
101 //! it's probably something the compiler shouldn't do anyway due to its
102 //! complicated nature and the state of the half-baked solutions.
103 //!
104 //! With a departure from versioning, the primary criterion for loading crates
105 //! is just the name of a crate. If we stopped here, it would imply that you
106 //! could never link two crates of the same name from different sources
107 //! together, which is clearly a bad state to be in.
108 //!
109 //! To resolve this problem, we come to the next section!
110 //!
111 //! # Expert Mode
112 //!
113 //! A number of flags have been added to the compiler to solve the "version
114 //! problem" in the previous section, as well as generally enabling more
115 //! powerful usage of the crate loading system of the compiler. The goal of
116 //! these flags and options are to enable third-party tools to drive the
117 //! compiler with prior knowledge about how the world should look.
118 //!
119 //! ## The `--extern` flag
120 //!
121 //! The compiler accepts a flag of this form a number of times:
122 //!
123 //! ```text
124 //! --extern crate-name=path/to/the/crate.rlib
125 //! ```
126 //!
127 //! This flag is basically the following letter to the compiler:
128 //!
129 //! > Dear rustc,
130 //! >
131 //! > When you are attempting to load the immediate dependency `crate-name`, I
132 //! > would like you to assume that the library is located at
133 //! > `path/to/the/crate.rlib`, and look nowhere else. Also, please do not
134 //! > assume that the path I specified has the name `crate-name`.
135 //!
136 //! This flag basically overrides most matching logic except for validating that
137 //! the file is indeed a rust library. The same `crate-name` can be specified
138 //! twice to specify the rlib/dylib pair.
139 //!
140 //! ## Enabling "multiple versions"
141 //!
142 //! This basically boils down to the ability to specify arbitrary packages to
143 //! the compiler. For example, if crate A wanted to use Bv1 and Bv2, then it
144 //! would look something like:
145 //!
146 //! ```compile_fail,E0463
147 //! extern crate b1;
148 //! extern crate b2;
149 //!
150 //! fn main() {}
151 //! ```
152 //!
153 //! and the compiler would be invoked as:
154 //!
155 //! ```text
156 //! rustc a.rs --extern b1=path/to/libb1.rlib --extern b2=path/to/libb2.rlib
157 //! ```
158 //!
159 //! In this scenario there are two crates named `b` and the compiler must be
160 //! manually driven to be informed where each crate is.
161 //!
162 //! ## Frobbing symbols
163 //!
164 //! One of the immediate problems with linking the same library together twice
165 //! in the same problem is dealing with duplicate symbols. The primary way to
166 //! deal with this in rustc is to add hashes to the end of each symbol.
167 //!
168 //! In order to force hashes to change between versions of a library, if
169 //! desired, the compiler exposes an option `-C metadata=foo`, which is used to
170 //! initially seed each symbol hash. The string `foo` is prepended to each
171 //! string-to-hash to ensure that symbols change over time.
172 //!
173 //! ## Loading transitive dependencies
174 //!
175 //! Dealing with same-named-but-distinct crates is not just a local problem, but
176 //! one that also needs to be dealt with for transitive dependencies. Note that
177 //! in the letter above `--extern` flags only apply to the *local* set of
178 //! dependencies, not the upstream transitive dependencies. Consider this
179 //! dependency graph:
180 //!
181 //! ```text
182 //! A.1   A.2
183 //! |     |
184 //! |     |
185 //! B     C
186 //!  \   /
187 //!   \ /
188 //!    D
189 //! ```
190 //!
191 //! In this scenario, when we compile `D`, we need to be able to distinctly
192 //! resolve `A.1` and `A.2`, but an `--extern` flag cannot apply to these
193 //! transitive dependencies.
194 //!
195 //! Note that the key idea here is that `B` and `C` are both *already compiled*.
196 //! That is, they have already resolved their dependencies. Due to unrelated
197 //! technical reasons, when a library is compiled, it is only compatible with
198 //! the *exact same* version of the upstream libraries it was compiled against.
199 //! We use the "Strict Version Hash" to identify the exact copy of an upstream
200 //! library.
201 //!
202 //! With this knowledge, we know that `B` and `C` will depend on `A` with
203 //! different SVH values, so we crawl the normal `-L` paths looking for
204 //! `liba*.rlib` and filter based on the contained SVH.
205 //!
206 //! In the end, this ends up not needing `--extern` to specify upstream
207 //! transitive dependencies.
208 //!
209 //! # Wrapping up
210 //!
211 //! That's the general overview of loading crates in the compiler, but it's by
212 //! no means all of the necessary details. Take a look at the rest of
213 //! metadata::locator or metadata::creader for all the juicy details!
214
215 use crate::creader::Library;
216 use crate::rmeta::{rustc_version, MetadataBlob, METADATA_HEADER};
217
218 use rustc_data_structures::fx::{FxHashMap, FxHashSet};
219 use rustc_data_structures::memmap::Mmap;
220 use rustc_data_structures::owning_ref::OwningRef;
221 use rustc_data_structures::svh::Svh;
222 use rustc_data_structures::sync::MetadataRef;
223 use rustc_errors::{struct_span_err, FatalError};
224 use rustc_session::config::{self, CrateType};
225 use rustc_session::cstore::{CrateSource, MetadataLoader};
226 use rustc_session::filesearch::FileSearch;
227 use rustc_session::search_paths::PathKind;
228 use rustc_session::utils::CanonicalizedPath;
229 use rustc_session::Session;
230 use rustc_span::symbol::{sym, Symbol};
231 use rustc_span::Span;
232 use rustc_target::spec::{Target, TargetTriple};
233
234 use snap::read::FrameDecoder;
235 use std::fmt::Write as _;
236 use std::io::{Read, Result as IoResult, Write};
237 use std::path::{Path, PathBuf};
238 use std::{cmp, fmt, fs};
239 use tracing::{debug, info};
240
241 #[derive(Clone)]
242 crate struct CrateLocator<'a> {
243     // Immutable per-session configuration.
244     only_needs_metadata: bool,
245     sysroot: &'a Path,
246     metadata_loader: &'a dyn MetadataLoader,
247
248     // Immutable per-search configuration.
249     crate_name: Symbol,
250     exact_paths: Vec<CanonicalizedPath>,
251     pub hash: Option<Svh>,
252     extra_filename: Option<&'a str>,
253     pub target: &'a Target,
254     pub triple: TargetTriple,
255     pub filesearch: FileSearch<'a>,
256     pub is_proc_macro: bool,
257
258     // Mutable in-progress state or output.
259     crate_rejections: CrateRejections,
260 }
261
262 #[derive(Clone)]
263 crate struct CratePaths {
264     name: Symbol,
265     source: CrateSource,
266 }
267
268 impl CratePaths {
269     crate fn new(name: Symbol, source: CrateSource) -> CratePaths {
270         CratePaths { name, source }
271     }
272 }
273
274 #[derive(Copy, Clone, PartialEq)]
275 crate enum CrateFlavor {
276     Rlib,
277     Rmeta,
278     Dylib,
279 }
280
281 impl fmt::Display for CrateFlavor {
282     fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
283         f.write_str(match *self {
284             CrateFlavor::Rlib => "rlib",
285             CrateFlavor::Rmeta => "rmeta",
286             CrateFlavor::Dylib => "dylib",
287         })
288     }
289 }
290
291 impl<'a> CrateLocator<'a> {
292     crate fn new(
293         sess: &'a Session,
294         metadata_loader: &'a dyn MetadataLoader,
295         crate_name: Symbol,
296         hash: Option<Svh>,
297         extra_filename: Option<&'a str>,
298         is_host: bool,
299         path_kind: PathKind,
300     ) -> CrateLocator<'a> {
301         // The all loop is because `--crate-type=rlib --crate-type=rlib` is
302         // legal and produces both inside this type.
303         let is_rlib = sess.crate_types().iter().all(|c| *c == CrateType::Rlib);
304         let needs_object_code = sess.opts.output_types.should_codegen();
305         // If we're producing an rlib, then we don't need object code.
306         // Or, if we're not producing object code, then we don't need it either
307         // (e.g., if we're a cdylib but emitting just metadata).
308         let only_needs_metadata = is_rlib || !needs_object_code;
309
310         CrateLocator {
311             only_needs_metadata,
312             sysroot: &sess.sysroot,
313             metadata_loader,
314             crate_name,
315             exact_paths: if hash.is_none() {
316                 sess.opts
317                     .externs
318                     .get(crate_name.as_str())
319                     .into_iter()
320                     .filter_map(|entry| entry.files())
321                     .flatten()
322                     .cloned()
323                     .collect()
324             } else {
325                 // SVH being specified means this is a transitive dependency,
326                 // so `--extern` options do not apply.
327                 Vec::new()
328             },
329             hash,
330             extra_filename,
331             target: if is_host { &sess.host } else { &sess.target },
332             triple: if is_host {
333                 TargetTriple::from_triple(config::host_triple())
334             } else {
335                 sess.opts.target_triple.clone()
336             },
337             filesearch: if is_host {
338                 sess.host_filesearch(path_kind)
339             } else {
340                 sess.target_filesearch(path_kind)
341             },
342             is_proc_macro: false,
343             crate_rejections: CrateRejections::default(),
344         }
345     }
346
347     crate fn reset(&mut self) {
348         self.crate_rejections.via_hash.clear();
349         self.crate_rejections.via_triple.clear();
350         self.crate_rejections.via_kind.clear();
351         self.crate_rejections.via_version.clear();
352         self.crate_rejections.via_filename.clear();
353         self.crate_rejections.via_invalid.clear();
354     }
355
356     crate fn maybe_load_library_crate(&mut self) -> Result<Option<Library>, CrateError> {
357         if !self.exact_paths.is_empty() {
358             return self.find_commandline_library();
359         }
360         let mut seen_paths = FxHashSet::default();
361         if let Some(extra_filename) = self.extra_filename {
362             if let library @ Some(_) = self.find_library_crate(extra_filename, &mut seen_paths)? {
363                 return Ok(library);
364             }
365         }
366         self.find_library_crate("", &mut seen_paths)
367     }
368
369     fn find_library_crate(
370         &mut self,
371         extra_prefix: &str,
372         seen_paths: &mut FxHashSet<PathBuf>,
373     ) -> Result<Option<Library>, CrateError> {
374         let rmeta_prefix = &format!("lib{}{}", self.crate_name, extra_prefix);
375         let rlib_prefix = rmeta_prefix;
376         let dylib_prefix =
377             &format!("{}{}{}", self.target.dll_prefix, self.crate_name, extra_prefix);
378         let staticlib_prefix =
379             &format!("{}{}{}", self.target.staticlib_prefix, self.crate_name, extra_prefix);
380
381         let rmeta_suffix = ".rmeta";
382         let rlib_suffix = ".rlib";
383         let dylib_suffix = &self.target.dll_suffix;
384         let staticlib_suffix = &self.target.staticlib_suffix;
385
386         let mut candidates: FxHashMap<_, (FxHashMap<_, _>, FxHashMap<_, _>, FxHashMap<_, _>)> =
387             Default::default();
388         let mut staticlibs = vec![];
389
390         // First, find all possible candidate rlibs and dylibs purely based on
391         // the name of the files themselves. We're trying to match against an
392         // exact crate name and a possibly an exact hash.
393         //
394         // During this step, we can filter all found libraries based on the
395         // name and id found in the crate id (we ignore the path portion for
396         // filename matching), as well as the exact hash (if specified). If we
397         // end up having many candidates, we must look at the metadata to
398         // perform exact matches against hashes/crate ids. Note that opening up
399         // the metadata is where we do an exact match against the full contents
400         // of the crate id (path/name/id).
401         //
402         // The goal of this step is to look at as little metadata as possible.
403         for search_path in self.filesearch.search_paths() {
404             debug!("searching {}", search_path.dir.display());
405             for spf in search_path.files.iter() {
406                 debug!("testing {}", spf.path.display());
407
408                 let f = &spf.file_name_str;
409                 let (hash, kind) = if f.starts_with(rlib_prefix) && f.ends_with(rlib_suffix) {
410                     (&f[rlib_prefix.len()..(f.len() - rlib_suffix.len())], CrateFlavor::Rlib)
411                 } else if f.starts_with(rmeta_prefix) && f.ends_with(rmeta_suffix) {
412                     (&f[rmeta_prefix.len()..(f.len() - rmeta_suffix.len())], CrateFlavor::Rmeta)
413                 } else if f.starts_with(dylib_prefix) && f.ends_with(dylib_suffix) {
414                     (&f[dylib_prefix.len()..(f.len() - dylib_suffix.len())], CrateFlavor::Dylib)
415                 } else {
416                     if f.starts_with(staticlib_prefix) && f.ends_with(staticlib_suffix) {
417                         staticlibs.push(CrateMismatch {
418                             path: spf.path.clone(),
419                             got: "static".to_string(),
420                         });
421                     }
422                     continue;
423                 };
424
425                 info!("lib candidate: {}", spf.path.display());
426
427                 let (rlibs, rmetas, dylibs) = candidates.entry(hash.to_string()).or_default();
428                 let path = fs::canonicalize(&spf.path).unwrap_or_else(|_| spf.path.clone());
429                 if seen_paths.contains(&path) {
430                     continue;
431                 };
432                 seen_paths.insert(path.clone());
433                 match kind {
434                     CrateFlavor::Rlib => rlibs.insert(path, search_path.kind),
435                     CrateFlavor::Rmeta => rmetas.insert(path, search_path.kind),
436                     CrateFlavor::Dylib => dylibs.insert(path, search_path.kind),
437                 };
438             }
439         }
440
441         self.crate_rejections.via_kind.extend(staticlibs);
442
443         // We have now collected all known libraries into a set of candidates
444         // keyed of the filename hash listed. For each filename, we also have a
445         // list of rlibs/dylibs that apply. Here, we map each of these lists
446         // (per hash), to a Library candidate for returning.
447         //
448         // A Library candidate is created if the metadata for the set of
449         // libraries corresponds to the crate id and hash criteria that this
450         // search is being performed for.
451         let mut libraries = FxHashMap::default();
452         for (_hash, (rlibs, rmetas, dylibs)) in candidates {
453             if let Some((svh, lib)) = self.extract_lib(rlibs, rmetas, dylibs)? {
454                 libraries.insert(svh, lib);
455             }
456         }
457
458         // Having now translated all relevant found hashes into libraries, see
459         // what we've got and figure out if we found multiple candidates for
460         // libraries or not.
461         match libraries.len() {
462             0 => Ok(None),
463             1 => Ok(Some(libraries.into_iter().next().unwrap().1)),
464             _ => Err(CrateError::MultipleMatchingCrates(self.crate_name, libraries)),
465         }
466     }
467
468     fn extract_lib(
469         &mut self,
470         rlibs: FxHashMap<PathBuf, PathKind>,
471         rmetas: FxHashMap<PathBuf, PathKind>,
472         dylibs: FxHashMap<PathBuf, PathKind>,
473     ) -> Result<Option<(Svh, Library)>, CrateError> {
474         let mut slot = None;
475         // Order here matters, rmeta should come first. See comment in
476         // `extract_one` below.
477         let source = CrateSource {
478             rmeta: self.extract_one(rmetas, CrateFlavor::Rmeta, &mut slot)?,
479             rlib: self.extract_one(rlibs, CrateFlavor::Rlib, &mut slot)?,
480             dylib: self.extract_one(dylibs, CrateFlavor::Dylib, &mut slot)?,
481         };
482         Ok(slot.map(|(svh, metadata)| (svh, Library { source, metadata })))
483     }
484
485     fn needs_crate_flavor(&self, flavor: CrateFlavor) -> bool {
486         if flavor == CrateFlavor::Dylib && self.is_proc_macro {
487             return true;
488         }
489
490         if self.only_needs_metadata {
491             flavor == CrateFlavor::Rmeta
492         } else {
493             // we need all flavors (perhaps not true, but what we do for now)
494             true
495         }
496     }
497
498     // Attempts to extract *one* library from the set `m`. If the set has no
499     // elements, `None` is returned. If the set has more than one element, then
500     // the errors and notes are emitted about the set of libraries.
501     //
502     // With only one library in the set, this function will extract it, and then
503     // read the metadata from it if `*slot` is `None`. If the metadata couldn't
504     // be read, it is assumed that the file isn't a valid rust library (no
505     // errors are emitted).
506     fn extract_one(
507         &mut self,
508         m: FxHashMap<PathBuf, PathKind>,
509         flavor: CrateFlavor,
510         slot: &mut Option<(Svh, MetadataBlob)>,
511     ) -> Result<Option<(PathBuf, PathKind)>, CrateError> {
512         // If we are producing an rlib, and we've already loaded metadata, then
513         // we should not attempt to discover further crate sources (unless we're
514         // locating a proc macro; exact logic is in needs_crate_flavor). This means
515         // that under -Zbinary-dep-depinfo we will not emit a dependency edge on
516         // the *unused* rlib, and by returning `None` here immediately we
517         // guarantee that we do indeed not use it.
518         //
519         // See also #68149 which provides more detail on why emitting the
520         // dependency on the rlib is a bad thing.
521         //
522         // We currently do not verify that these other sources are even in sync,
523         // and this is arguably a bug (see #10786), but because reading metadata
524         // is quite slow (especially from dylibs) we currently do not read it
525         // from the other crate sources.
526         if slot.is_some() {
527             if m.is_empty() || !self.needs_crate_flavor(flavor) {
528                 return Ok(None);
529             } else if m.len() == 1 {
530                 return Ok(Some(m.into_iter().next().unwrap()));
531             }
532         }
533
534         let mut ret: Option<(PathBuf, PathKind)> = None;
535         let mut err_data: Option<Vec<PathBuf>> = None;
536         for (lib, kind) in m {
537             info!("{} reading metadata from: {}", flavor, lib.display());
538             if flavor == CrateFlavor::Rmeta && lib.metadata().map_or(false, |m| m.len() == 0) {
539                 // Empty files will cause get_metadata_section to fail. Rmeta
540                 // files can be empty, for example with binaries (which can
541                 // often appear with `cargo check` when checking a library as
542                 // a unittest). We don't want to emit a user-visible warning
543                 // in this case as it is not a real problem.
544                 debug!("skipping empty file");
545                 continue;
546             }
547             let (hash, metadata) =
548                 match get_metadata_section(self.target, flavor, &lib, self.metadata_loader) {
549                     Ok(blob) => {
550                         if let Some(h) = self.crate_matches(&blob, &lib) {
551                             (h, blob)
552                         } else {
553                             info!("metadata mismatch");
554                             continue;
555                         }
556                     }
557                     Err(MetadataError::LoadFailure(err)) => {
558                         info!("no metadata found: {}", err);
559                         // The file was present and created by the same compiler version, but we
560                         // couldn't load it for some reason.  Give a hard error instead of silently
561                         // ignoring it, but only if we would have given an error anyway.
562                         self.crate_rejections
563                             .via_invalid
564                             .push(CrateMismatch { path: lib, got: err });
565                         continue;
566                     }
567                     Err(err @ MetadataError::NotPresent(_)) => {
568                         info!("no metadata found: {}", err);
569                         continue;
570                     }
571                 };
572             // If we see multiple hashes, emit an error about duplicate candidates.
573             if slot.as_ref().map_or(false, |s| s.0 != hash) {
574                 if let Some(candidates) = err_data {
575                     return Err(CrateError::MultipleCandidates(
576                         self.crate_name,
577                         flavor,
578                         candidates,
579                     ));
580                 }
581                 err_data = Some(vec![ret.as_ref().unwrap().0.clone()]);
582                 *slot = None;
583             }
584             if let Some(candidates) = &mut err_data {
585                 candidates.push(lib);
586                 continue;
587             }
588
589             // Ok so at this point we've determined that `(lib, kind)` above is
590             // a candidate crate to load, and that `slot` is either none (this
591             // is the first crate of its kind) or if some the previous path has
592             // the exact same hash (e.g., it's the exact same crate).
593             //
594             // In principle these two candidate crates are exactly the same so
595             // we can choose either of them to link. As a stupidly gross hack,
596             // however, we favor crate in the sysroot.
597             //
598             // You can find more info in rust-lang/rust#39518 and various linked
599             // issues, but the general gist is that during testing libstd the
600             // compilers has two candidates to choose from: one in the sysroot
601             // and one in the deps folder. These two crates are the exact same
602             // crate but if the compiler chooses the one in the deps folder
603             // it'll cause spurious errors on Windows.
604             //
605             // As a result, we favor the sysroot crate here. Note that the
606             // candidates are all canonicalized, so we canonicalize the sysroot
607             // as well.
608             if let Some((prev, _)) = &ret {
609                 let sysroot = self.sysroot;
610                 let sysroot = sysroot.canonicalize().unwrap_or_else(|_| sysroot.to_path_buf());
611                 if prev.starts_with(&sysroot) {
612                     continue;
613                 }
614             }
615             *slot = Some((hash, metadata));
616             ret = Some((lib, kind));
617         }
618
619         if let Some(candidates) = err_data {
620             Err(CrateError::MultipleCandidates(self.crate_name, flavor, candidates))
621         } else {
622             Ok(ret)
623         }
624     }
625
626     fn crate_matches(&mut self, metadata: &MetadataBlob, libpath: &Path) -> Option<Svh> {
627         let rustc_version = rustc_version();
628         let found_version = metadata.get_rustc_version();
629         if found_version != rustc_version {
630             info!("Rejecting via version: expected {} got {}", rustc_version, found_version);
631             self.crate_rejections
632                 .via_version
633                 .push(CrateMismatch { path: libpath.to_path_buf(), got: found_version });
634             return None;
635         }
636
637         let root = metadata.get_root();
638         if root.is_proc_macro_crate() != self.is_proc_macro {
639             info!(
640                 "Rejecting via proc macro: expected {} got {}",
641                 self.is_proc_macro,
642                 root.is_proc_macro_crate(),
643             );
644             return None;
645         }
646
647         if self.exact_paths.is_empty() && self.crate_name != root.name() {
648             info!("Rejecting via crate name");
649             return None;
650         }
651
652         if root.triple() != &self.triple {
653             info!("Rejecting via crate triple: expected {} got {}", self.triple, root.triple());
654             self.crate_rejections.via_triple.push(CrateMismatch {
655                 path: libpath.to_path_buf(),
656                 got: root.triple().to_string(),
657             });
658             return None;
659         }
660
661         let hash = root.hash();
662         if let Some(expected_hash) = self.hash {
663             if hash != expected_hash {
664                 info!("Rejecting via hash: expected {} got {}", expected_hash, hash);
665                 self.crate_rejections
666                     .via_hash
667                     .push(CrateMismatch { path: libpath.to_path_buf(), got: hash.to_string() });
668                 return None;
669             }
670         }
671
672         Some(hash)
673     }
674
675     fn find_commandline_library(&mut self) -> Result<Option<Library>, CrateError> {
676         // First, filter out all libraries that look suspicious. We only accept
677         // files which actually exist that have the correct naming scheme for
678         // rlibs/dylibs.
679         let mut rlibs = FxHashMap::default();
680         let mut rmetas = FxHashMap::default();
681         let mut dylibs = FxHashMap::default();
682         for loc in &self.exact_paths {
683             if !loc.canonicalized().exists() {
684                 return Err(CrateError::ExternLocationNotExist(
685                     self.crate_name,
686                     loc.original().clone(),
687                 ));
688             }
689             let file = match loc.original().file_name().and_then(|s| s.to_str()) {
690                 Some(file) => file,
691                 None => {
692                     return Err(CrateError::ExternLocationNotFile(
693                         self.crate_name,
694                         loc.original().clone(),
695                     ));
696                 }
697             };
698
699             if file.starts_with("lib") && (file.ends_with(".rlib") || file.ends_with(".rmeta"))
700                 || file.starts_with(&self.target.dll_prefix)
701                     && file.ends_with(&self.target.dll_suffix)
702             {
703                 // Make sure there's at most one rlib and at most one dylib.
704                 // Note to take care and match against the non-canonicalized name:
705                 // some systems save build artifacts into content-addressed stores
706                 // that do not preserve extensions, and then link to them using
707                 // e.g. symbolic links. If we canonicalize too early, we resolve
708                 // the symlink, the file type is lost and we might treat rlibs and
709                 // rmetas as dylibs.
710                 let loc_canon = loc.canonicalized().clone();
711                 let loc = loc.original();
712                 if loc.file_name().unwrap().to_str().unwrap().ends_with(".rlib") {
713                     rlibs.insert(loc_canon, PathKind::ExternFlag);
714                 } else if loc.file_name().unwrap().to_str().unwrap().ends_with(".rmeta") {
715                     rmetas.insert(loc_canon, PathKind::ExternFlag);
716                 } else {
717                     dylibs.insert(loc_canon, PathKind::ExternFlag);
718                 }
719             } else {
720                 self.crate_rejections
721                     .via_filename
722                     .push(CrateMismatch { path: loc.original().clone(), got: String::new() });
723             }
724         }
725
726         // Extract the dylib/rlib/rmeta triple.
727         Ok(self.extract_lib(rlibs, rmetas, dylibs)?.map(|(_, lib)| lib))
728     }
729
730     crate fn into_error(self, root: Option<CratePaths>) -> CrateError {
731         CrateError::LocatorCombined(CombinedLocatorError {
732             crate_name: self.crate_name,
733             root,
734             triple: self.triple,
735             dll_prefix: self.target.dll_prefix.clone(),
736             dll_suffix: self.target.dll_suffix.clone(),
737             crate_rejections: self.crate_rejections,
738         })
739     }
740 }
741
742 fn get_metadata_section<'p>(
743     target: &Target,
744     flavor: CrateFlavor,
745     filename: &'p Path,
746     loader: &dyn MetadataLoader,
747 ) -> Result<MetadataBlob, MetadataError<'p>> {
748     if !filename.exists() {
749         return Err(MetadataError::NotPresent(filename));
750     }
751     let raw_bytes: MetadataRef = match flavor {
752         CrateFlavor::Rlib => {
753             loader.get_rlib_metadata(target, filename).map_err(MetadataError::LoadFailure)?
754         }
755         CrateFlavor::Dylib => {
756             let buf =
757                 loader.get_dylib_metadata(target, filename).map_err(MetadataError::LoadFailure)?;
758             // The header is uncompressed
759             let header_len = METADATA_HEADER.len();
760             debug!("checking {} bytes of metadata-version stamp", header_len);
761             let header = &buf[..cmp::min(header_len, buf.len())];
762             if header != METADATA_HEADER {
763                 return Err(MetadataError::LoadFailure(format!(
764                     "invalid metadata version found: {}",
765                     filename.display()
766                 )));
767             }
768
769             // Header is okay -> inflate the actual metadata
770             let compressed_bytes = &buf[header_len..];
771             debug!("inflating {} bytes of compressed metadata", compressed_bytes.len());
772             // Assume the decompressed data will be at least the size of the compressed data, so we
773             // don't have to grow the buffer as much.
774             let mut inflated = Vec::with_capacity(compressed_bytes.len());
775             match FrameDecoder::new(compressed_bytes).read_to_end(&mut inflated) {
776                 Ok(_) => rustc_erase_owner!(OwningRef::new(inflated).map_owner_box()),
777                 Err(_) => {
778                     return Err(MetadataError::LoadFailure(format!(
779                         "failed to decompress metadata: {}",
780                         filename.display()
781                     )));
782                 }
783             }
784         }
785         CrateFlavor::Rmeta => {
786             // mmap the file, because only a small fraction of it is read.
787             let file = std::fs::File::open(filename).map_err(|_| {
788                 MetadataError::LoadFailure(format!(
789                     "failed to open rmeta metadata: '{}'",
790                     filename.display()
791                 ))
792             })?;
793             let mmap = unsafe { Mmap::map(file) };
794             let mmap = mmap.map_err(|_| {
795                 MetadataError::LoadFailure(format!(
796                     "failed to mmap rmeta metadata: '{}'",
797                     filename.display()
798                 ))
799             })?;
800
801             rustc_erase_owner!(OwningRef::new(mmap).map_owner_box())
802         }
803     };
804     let blob = MetadataBlob::new(raw_bytes);
805     if blob.is_compatible() {
806         Ok(blob)
807     } else {
808         Err(MetadataError::LoadFailure(format!(
809             "invalid metadata version found: {}",
810             filename.display()
811         )))
812     }
813 }
814
815 /// Look for a plugin registrar. Returns its library path and crate disambiguator.
816 pub fn find_plugin_registrar(
817     sess: &Session,
818     metadata_loader: &dyn MetadataLoader,
819     span: Span,
820     name: Symbol,
821 ) -> PathBuf {
822     find_plugin_registrar_impl(sess, metadata_loader, name).unwrap_or_else(|err| {
823         // `core` is always available if we got as far as loading plugins.
824         err.report(sess, span, false);
825         FatalError.raise()
826     })
827 }
828
829 fn find_plugin_registrar_impl<'a>(
830     sess: &'a Session,
831     metadata_loader: &dyn MetadataLoader,
832     name: Symbol,
833 ) -> Result<PathBuf, CrateError> {
834     info!("find plugin registrar `{}`", name);
835     let mut locator = CrateLocator::new(
836         sess,
837         metadata_loader,
838         name,
839         None, // hash
840         None, // extra_filename
841         true, // is_host
842         PathKind::Crate,
843     );
844
845     match locator.maybe_load_library_crate()? {
846         Some(library) => match library.source.dylib {
847             Some(dylib) => Ok(dylib.0),
848             None => Err(CrateError::NonDylibPlugin(name)),
849         },
850         None => Err(locator.into_error(None)),
851     }
852 }
853
854 /// A diagnostic function for dumping crate metadata to an output stream.
855 pub fn list_file_metadata(
856     target: &Target,
857     path: &Path,
858     metadata_loader: &dyn MetadataLoader,
859     out: &mut dyn Write,
860 ) -> IoResult<()> {
861     let filename = path.file_name().unwrap().to_str().unwrap();
862     let flavor = if filename.ends_with(".rlib") {
863         CrateFlavor::Rlib
864     } else if filename.ends_with(".rmeta") {
865         CrateFlavor::Rmeta
866     } else {
867         CrateFlavor::Dylib
868     };
869     match get_metadata_section(target, flavor, path, metadata_loader) {
870         Ok(metadata) => metadata.list_crate_metadata(out),
871         Err(msg) => write!(out, "{}\n", msg),
872     }
873 }
874
875 // ------------------------------------------ Error reporting -------------------------------------
876
877 #[derive(Clone)]
878 struct CrateMismatch {
879     path: PathBuf,
880     got: String,
881 }
882
883 #[derive(Clone, Default)]
884 struct CrateRejections {
885     via_hash: Vec<CrateMismatch>,
886     via_triple: Vec<CrateMismatch>,
887     via_kind: Vec<CrateMismatch>,
888     via_version: Vec<CrateMismatch>,
889     via_filename: Vec<CrateMismatch>,
890     via_invalid: Vec<CrateMismatch>,
891 }
892
893 /// Candidate rejection reasons collected during crate search.
894 /// If no candidate is accepted, then these reasons are presented to the user,
895 /// otherwise they are ignored.
896 crate struct CombinedLocatorError {
897     crate_name: Symbol,
898     root: Option<CratePaths>,
899     triple: TargetTriple,
900     dll_prefix: String,
901     dll_suffix: String,
902     crate_rejections: CrateRejections,
903 }
904
905 crate enum CrateError {
906     NonAsciiName(Symbol),
907     ExternLocationNotExist(Symbol, PathBuf),
908     ExternLocationNotFile(Symbol, PathBuf),
909     MultipleCandidates(Symbol, CrateFlavor, Vec<PathBuf>),
910     MultipleMatchingCrates(Symbol, FxHashMap<Svh, Library>),
911     SymbolConflictsCurrent(Symbol),
912     SymbolConflictsOthers(Symbol),
913     StableCrateIdCollision(Symbol, Symbol),
914     DlOpen(String),
915     DlSym(String),
916     LocatorCombined(CombinedLocatorError),
917     NonDylibPlugin(Symbol),
918 }
919
920 enum MetadataError<'a> {
921     /// The file was missing.
922     NotPresent(&'a Path),
923     /// The file was present and invalid.
924     LoadFailure(String),
925 }
926
927 impl fmt::Display for MetadataError<'_> {
928     fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
929         match self {
930             MetadataError::NotPresent(filename) => {
931                 f.write_str(&format!("no such file: '{}'", filename.display()))
932             }
933             MetadataError::LoadFailure(msg) => f.write_str(msg),
934         }
935     }
936 }
937
938 impl CrateError {
939     crate fn report(self, sess: &Session, span: Span, missing_core: bool) {
940         let mut diag = match self {
941             CrateError::NonAsciiName(crate_name) => sess.struct_span_err(
942                 span,
943                 &format!("cannot load a crate with a non-ascii name `{}`", crate_name),
944             ),
945             CrateError::ExternLocationNotExist(crate_name, loc) => sess.struct_span_err(
946                 span,
947                 &format!("extern location for {} does not exist: {}", crate_name, loc.display()),
948             ),
949             CrateError::ExternLocationNotFile(crate_name, loc) => sess.struct_span_err(
950                 span,
951                 &format!("extern location for {} is not a file: {}", crate_name, loc.display()),
952             ),
953             CrateError::MultipleCandidates(crate_name, flavor, candidates) => {
954                 let mut err = struct_span_err!(
955                     sess,
956                     span,
957                     E0465,
958                     "multiple {} candidates for `{}` found",
959                     flavor,
960                     crate_name,
961                 );
962                 for (i, candidate) in candidates.iter().enumerate() {
963                     err.span_note(span, &format!("candidate #{}: {}", i + 1, candidate.display()));
964                 }
965                 err
966             }
967             CrateError::MultipleMatchingCrates(crate_name, libraries) => {
968                 let mut err = struct_span_err!(
969                     sess,
970                     span,
971                     E0464,
972                     "multiple matching crates for `{}`",
973                     crate_name
974                 );
975                 let mut libraries: Vec<_> = libraries.into_values().collect();
976                 // Make ordering of candidates deterministic.
977                 // This has to `clone()` to work around lifetime restrictions with `sort_by_key()`.
978                 // `sort_by()` could be used instead, but this is in the error path,
979                 // so the performance shouldn't matter.
980                 libraries.sort_by_cached_key(|lib| lib.source.paths().next().unwrap().clone());
981                 let candidates = libraries
982                     .iter()
983                     .map(|lib| {
984                         let crate_name = lib.metadata.get_root().name();
985                         let crate_name = crate_name.as_str();
986                         let mut paths = lib.source.paths();
987
988                         // This `unwrap()` should be okay because there has to be at least one
989                         // source file. `CrateSource`'s docs confirm that too.
990                         let mut s = format!(
991                             "\ncrate `{}`: {}",
992                             crate_name,
993                             paths.next().unwrap().display()
994                         );
995                         let padding = 8 + crate_name.len();
996                         for path in paths {
997                             write!(s, "\n{:>padding$}", path.display(), padding = padding).unwrap();
998                         }
999                         s
1000                     })
1001                     .collect::<String>();
1002                 err.note(&format!("candidates:{}", candidates));
1003                 err
1004             }
1005             CrateError::SymbolConflictsCurrent(root_name) => struct_span_err!(
1006                 sess,
1007                 span,
1008                 E0519,
1009                 "the current crate is indistinguishable from one of its dependencies: it has the \
1010                  same crate-name `{}` and was compiled with the same `-C metadata` arguments. \
1011                  This will result in symbol conflicts between the two.",
1012                 root_name,
1013             ),
1014             CrateError::SymbolConflictsOthers(root_name) => struct_span_err!(
1015                 sess,
1016                 span,
1017                 E0523,
1018                 "found two different crates with name `{}` that are not distinguished by differing \
1019                  `-C metadata`. This will result in symbol conflicts between the two.",
1020                 root_name,
1021             ),
1022             CrateError::StableCrateIdCollision(crate_name0, crate_name1) => {
1023                 let msg = format!(
1024                     "found crates (`{}` and `{}`) with colliding StableCrateId values.",
1025                     crate_name0, crate_name1
1026                 );
1027                 sess.struct_span_err(span, &msg)
1028             }
1029             CrateError::DlOpen(s) | CrateError::DlSym(s) => sess.struct_span_err(span, &s),
1030             CrateError::LocatorCombined(locator) => {
1031                 let crate_name = locator.crate_name;
1032                 let add = match &locator.root {
1033                     None => String::new(),
1034                     Some(r) => format!(" which `{}` depends on", r.name),
1035                 };
1036                 let mut msg = "the following crate versions were found:".to_string();
1037                 let mut err = if !locator.crate_rejections.via_hash.is_empty() {
1038                     let mut err = struct_span_err!(
1039                         sess,
1040                         span,
1041                         E0460,
1042                         "found possibly newer version of crate `{}`{}",
1043                         crate_name,
1044                         add,
1045                     );
1046                     err.note("perhaps that crate needs to be recompiled?");
1047                     let mismatches = locator.crate_rejections.via_hash.iter();
1048                     for CrateMismatch { path, .. } in mismatches {
1049                         msg.push_str(&format!("\ncrate `{}`: {}", crate_name, path.display()));
1050                     }
1051                     if let Some(r) = locator.root {
1052                         for path in r.source.paths() {
1053                             msg.push_str(&format!("\ncrate `{}`: {}", r.name, path.display()));
1054                         }
1055                     }
1056                     err.note(&msg);
1057                     err
1058                 } else if !locator.crate_rejections.via_triple.is_empty() {
1059                     let mut err = struct_span_err!(
1060                         sess,
1061                         span,
1062                         E0461,
1063                         "couldn't find crate `{}` with expected target triple {}{}",
1064                         crate_name,
1065                         locator.triple,
1066                         add,
1067                     );
1068                     let mismatches = locator.crate_rejections.via_triple.iter();
1069                     for CrateMismatch { path, got } in mismatches {
1070                         msg.push_str(&format!(
1071                             "\ncrate `{}`, target triple {}: {}",
1072                             crate_name,
1073                             got,
1074                             path.display(),
1075                         ));
1076                     }
1077                     err.note(&msg);
1078                     err
1079                 } else if !locator.crate_rejections.via_kind.is_empty() {
1080                     let mut err = struct_span_err!(
1081                         sess,
1082                         span,
1083                         E0462,
1084                         "found staticlib `{}` instead of rlib or dylib{}",
1085                         crate_name,
1086                         add,
1087                     );
1088                     err.help("please recompile that crate using --crate-type lib");
1089                     let mismatches = locator.crate_rejections.via_kind.iter();
1090                     for CrateMismatch { path, .. } in mismatches {
1091                         msg.push_str(&format!("\ncrate `{}`: {}", crate_name, path.display()));
1092                     }
1093                     err.note(&msg);
1094                     err
1095                 } else if !locator.crate_rejections.via_version.is_empty() {
1096                     let mut err = struct_span_err!(
1097                         sess,
1098                         span,
1099                         E0514,
1100                         "found crate `{}` compiled by an incompatible version of rustc{}",
1101                         crate_name,
1102                         add,
1103                     );
1104                     err.help(&format!(
1105                         "please recompile that crate using this compiler ({}) \
1106                          (consider running `cargo clean` first)",
1107                         rustc_version(),
1108                     ));
1109                     let mismatches = locator.crate_rejections.via_version.iter();
1110                     for CrateMismatch { path, got } in mismatches {
1111                         msg.push_str(&format!(
1112                             "\ncrate `{}` compiled by {}: {}",
1113                             crate_name,
1114                             got,
1115                             path.display(),
1116                         ));
1117                     }
1118                     err.note(&msg);
1119                     err
1120                 } else if !locator.crate_rejections.via_invalid.is_empty() {
1121                     let mut err = struct_span_err!(
1122                         sess,
1123                         span,
1124                         E0786,
1125                         "found invalid metadata files for crate `{}`{}",
1126                         crate_name,
1127                         add,
1128                     );
1129                     for CrateMismatch { path: _, got } in locator.crate_rejections.via_invalid {
1130                         err.note(&got);
1131                     }
1132                     err
1133                 } else {
1134                     let mut err = struct_span_err!(
1135                         sess,
1136                         span,
1137                         E0463,
1138                         "can't find crate for `{}`{}",
1139                         crate_name,
1140                         add,
1141                     );
1142
1143                     if (crate_name == sym::std || crate_name == sym::core)
1144                         && locator.triple != TargetTriple::from_triple(config::host_triple())
1145                     {
1146                         if missing_core {
1147                             err.note(&format!(
1148                                 "the `{}` target may not be installed",
1149                                 locator.triple
1150                             ));
1151                         } else {
1152                             err.note(&format!(
1153                                 "the `{}` target may not support the standard library",
1154                                 locator.triple
1155                             ));
1156                         }
1157                         // NOTE: this suggests using rustup, even though the user may not have it installed.
1158                         // That's because they could choose to install it; or this may give them a hint which
1159                         // target they need to install from their distro.
1160                         if missing_core {
1161                             err.help(&format!(
1162                                 "consider downloading the target with `rustup target add {}`",
1163                                 locator.triple
1164                             ));
1165                         }
1166                         // Suggest using #![no_std]. #[no_core] is unstable and not really supported anyway.
1167                         // NOTE: this is a dummy span if `extern crate std` was injected by the compiler.
1168                         // If it's not a dummy, that means someone added `extern crate std` explicitly and `#![no_std]` won't help.
1169                         if !missing_core && span.is_dummy() {
1170                             let current_crate =
1171                                 sess.opts.crate_name.as_deref().unwrap_or("<unknown>");
1172                             err.note(&format!(
1173                                 "`std` is required by `{}` because it does not declare `#![no_std]`",
1174                                 current_crate
1175                             ));
1176                         }
1177                         if sess.is_nightly_build() {
1178                             err.help("consider building the standard library from source with `cargo build -Zbuild-std`");
1179                         }
1180                     } else if crate_name
1181                         == Symbol::intern(&sess.opts.debugging_opts.profiler_runtime)
1182                     {
1183                         err.note("the compiler may have been built without the profiler runtime");
1184                     } else if crate_name.as_str().starts_with("rustc_") {
1185                         err.help(
1186                             "maybe you need to install the missing components with: \
1187                              `rustup component add rust-src rustc-dev llvm-tools-preview`",
1188                         );
1189                     }
1190                     err.span_label(span, "can't find crate");
1191                     err
1192                 };
1193
1194                 if !locator.crate_rejections.via_filename.is_empty() {
1195                     let mismatches = locator.crate_rejections.via_filename.iter();
1196                     for CrateMismatch { path, .. } in mismatches {
1197                         err.note(&format!(
1198                             "extern location for {} is of an unknown type: {}",
1199                             crate_name,
1200                             path.display(),
1201                         ))
1202                         .help(&format!(
1203                             "file name should be lib*.rlib or {}*.{}",
1204                             locator.dll_prefix, locator.dll_suffix
1205                         ));
1206                     }
1207                 }
1208                 err
1209             }
1210             CrateError::NonDylibPlugin(crate_name) => struct_span_err!(
1211                 sess,
1212                 span,
1213                 E0457,
1214                 "plugin `{}` only found in rlib format, but must be available in dylib format",
1215                 crate_name,
1216             ),
1217         };
1218
1219         diag.emit();
1220     }
1221 }