]> git.lizzy.rs Git - rust.git/blob - src/librustc/metadata/loader.rs
auto merge of #16364 : tbu-/rust/pr_checkeddiv0, r=alexcrichton
[rust.git] / src / librustc / metadata / loader.rs
1 // Copyright 2012 The Rust Project Developers. See the COPYRIGHT
2 // file at the top-level directory of this distribution and at
3 // http://rust-lang.org/COPYRIGHT.
4 //
5 // Licensed under the Apache License, Version 2.0 <LICENSE-APACHE or
6 // http://www.apache.org/licenses/LICENSE-2.0> or the MIT license
7 // <LICENSE-MIT or http://opensource.org/licenses/MIT>, at your
8 // option. This file may not be copied, modified, or distributed
9 // except according to those terms.
10
11 //! Finds crate binaries and loads their metadata
12 //!
13 //! Might I be the first to welcome you to a world of platform differences,
14 //! version requirements, dependency graphs, conflicting desires, and fun! This
15 //! is the major guts (along with metadata::creader) of the compiler for loading
16 //! crates and resolving dependencies. Let's take a tour!
17 //!
18 //! # The problem
19 //!
20 //! Each invocation of the compiler is immediately concerned with one primary
21 //! problem, to connect a set of crates to resolved crates on the filesystem.
22 //! Concretely speaking, the compiler follows roughly these steps to get here:
23 //!
24 //! 1. Discover a set of `extern crate` statements.
25 //! 2. Transform these directives into crate names. If the directive does not
26 //!    have an explicit name, then the identifier is the name.
27 //! 3. For each of these crate names, find a corresponding crate on the
28 //!    filesystem.
29 //!
30 //! Sounds easy, right? Let's walk into some of the nuances.
31 //!
32 //! ## Transitive Dependencies
33 //!
34 //! Let's say we've got three crates: A, B, and C. A depends on B, and B depends
35 //! on C. When we're compiling A, we primarily need to find and locate B, but we
36 //! also end up needing to find and locate C as well.
37 //!
38 //! The reason for this is that any of B's types could be composed of C's types,
39 //! any function in B could return a type from C, etc. To be able to guarantee
40 //! that we can always typecheck/translate any function, we have to have
41 //! complete knowledge of the whole ecosystem, not just our immediate
42 //! dependencies.
43 //!
44 //! So now as part of the "find a corresponding crate on the filesystem" step
45 //! above, this involves also finding all crates for *all upstream
46 //! dependencies*. This includes all dependencies transitively.
47 //!
48 //! ## Rlibs and Dylibs
49 //!
50 //! The compiler has two forms of intermediate dependencies. These are dubbed
51 //! rlibs and dylibs for the static and dynamic variants, respectively. An rlib
52 //! is a rustc-defined file format (currently just an ar archive) while a dylib
53 //! is a platform-defined dynamic library. Each library has a metadata somewhere
54 //! inside of it.
55 //!
56 //! When translating a crate name to a crate on the filesystem, we all of a
57 //! sudden need to take into account both rlibs and dylibs! Linkage later on may
58 //! use either one of these files, as each has their pros/cons. The job of crate
59 //! loading is to discover what's possible by finding all candidates.
60 //!
61 //! Most parts of this loading systems keep the dylib/rlib as just separate
62 //! variables.
63 //!
64 //! ## Where to look?
65 //!
66 //! We can't exactly scan your whole hard drive when looking for dependencies,
67 //! so we need to places to look. Currently the compiler will implicitly add the
68 //! target lib search path ($prefix/lib/rustlib/$target/lib) to any compilation,
69 //! and otherwise all -L flags are added to the search paths.
70 //!
71 //! ## What criterion to select on?
72 //!
73 //! This a pretty tricky area of loading crates. Given a file, how do we know
74 //! whether it's the right crate? Currently, the rules look along these lines:
75 //!
76 //! 1. Does the filename match an rlib/dylib pattern? That is to say, does the
77 //!    filename have the right prefix/suffix?
78 //! 2. Does the filename have the right prefix for the crate name being queried?
79 //!    This is filtering for files like `libfoo*.rlib` and such.
80 //! 3. Is the file an actual rust library? This is done by loading the metadata
81 //!    from the library and making sure it's actually there.
82 //! 4. Does the name in the metadata agree with the name of the library?
83 //! 5. Does the target in the metadata agree with the current target?
84 //! 6. Does the SVH match? (more on this later)
85 //!
86 //! If the file answers `yes` to all these questions, then the file is
87 //! considered as being *candidate* for being accepted. It is illegal to have
88 //! more than two candidates as the compiler has no method by which to resolve
89 //! this conflict. Additionally, rlib/dylib candidates are considered
90 //! separately.
91 //!
92 //! After all this has happened, we have 1 or two files as candidates. These
93 //! represent the rlib/dylib file found for a library, and they're returned as
94 //! being found.
95 //!
96 //! ### What about versions?
97 //!
98 //! A lot of effort has been put forth to remove versioning from the compiler.
99 //! There have been forays in the past to have versioning baked in, but it was
100 //! largely always deemed insufficient to the point that it was recognized that
101 //! it's probably something the compiler shouldn't do anyway due to its
102 //! complicated nature and the state of the half-baked solutions.
103 //!
104 //! With a departure from versioning, the primary criterion for loading crates
105 //! is just the name of a crate. If we stopped here, it would imply that you
106 //! could never link two crates of the same name from different sources
107 //! together, which is clearly a bad state to be in.
108 //!
109 //! To resolve this problem, we come to the next section!
110 //!
111 //! # Expert Mode
112 //!
113 //! A number of flags have been added to the compiler to solve the "version
114 //! problem" in the previous section, as well as generally enabling more
115 //! powerful usage of the crate loading system of the compiler. The goal of
116 //! these flags and options are to enable third-party tools to drive the
117 //! compiler with prior knowledge about how the world should look.
118 //!
119 //! ## The `--extern` flag
120 //!
121 //! The compiler accepts a flag of this form a number of times:
122 //!
123 //! ```notrust
124 //! --extern crate-name=path/to/the/crate.rlib
125 //! ```
126 //!
127 //! This flag is basically the following letter to the compiler:
128 //!
129 //! > Dear rustc,
130 //! >
131 //! > When you are attempting to load the immediate dependency `crate-name`, I
132 //! > would like you too assume that the library is located at
133 //! > `path/to/the/crate.rlib`, and look nowhere else. Also, please do not
134 //! > assume that the path I specified has the name `crate-name`.
135 //!
136 //! This flag basically overrides most matching logic except for validating that
137 //! the file is indeed a rust library. The same `crate-name` can be specified
138 //! twice to specify the rlib/dylib pair.
139 //!
140 //! ## Enabling "multiple versions"
141 //!
142 //! This basically boils down to the ability to specify arbitrary packages to
143 //! the compiler. For example, if crate A wanted to use Bv1 and Bv2, then it
144 //! would look something like:
145 //!
146 //! ```ignore
147 //! extern crate b1;
148 //! extern crate b2;
149 //!
150 //! fn main() {}
151 //! ```
152 //!
153 //! and the compiler would be invoked as:
154 //!
155 //! ```notrust
156 //! rustc a.rs --extern b1=path/to/libb1.rlib --extern b2=path/to/libb2.rlib
157 //! ```
158 //!
159 //! In this scenario there are two crates named `b` and the compiler must be
160 //! manually driven to be informed where each crate is.
161 //!
162 //! ## Frobbing symbols
163 //!
164 //! One of the immediate problems with linking the same library together twice
165 //! in the same problem is dealing with duplicate symbols. The primary way to
166 //! deal with this in rustc is to add hashes to the end of each symbol.
167 //!
168 //! In order to force hashes to change between versions of a library, if
169 //! desired, the compiler exposes an option `-C metadata=foo`, which is used to
170 //! initially seed each symbol hash. The string `foo` is prepended to each
171 //! string-to-hash to ensure that symbols change over time.
172 //!
173 //! ## Loading transitive dependencies
174 //!
175 //! Dealing with same-named-but-distinct crates is not just a local problem, but
176 //! one that also needs to be dealt with for transitive dependencies. Note that
177 //! in the letter above `--extern` flags only apply to the *local* set of
178 //! dependencies, not the upstream transitive dependencies. Consider this
179 //! dependency graph:
180 //!
181 //! ```notrust
182 //! A.1   A.2
183 //! |     |
184 //! |     |
185 //! B     C
186 //!  \   /
187 //!   \ /
188 //!    D
189 //! ```
190 //!
191 //! In this scenario, when we compile `D`, we need to be able to distinctly
192 //! resolve `A.1` and `A.2`, but an `--extern` flag cannot apply to these
193 //! transitive dependencies.
194 //!
195 //! Note that the key idea here is that `B` and `C` are both *already compiled*.
196 //! That is, they have already resolved their dependencies. Due to unrelated
197 //! technical reasons, when a library is compiled, it is only compatible with
198 //! the *exact same* version of the upstream libraries it was compiled against.
199 //! We use the "Strict Version Hash" to identify the exact copy of an upstream
200 //! library.
201 //!
202 //! With this knowledge, we know that `B` and `C` will depend on `A` with
203 //! different SVH values, so we crawl the normal `-L` paths looking for
204 //! `liba*.rlib` and filter based on the contained SVH.
205 //!
206 //! In the end, this ends up not needing `--extern` to specify upstream
207 //! transitive dependencies.
208 //!
209 //! # Wrapping up
210 //!
211 //! That's the general overview of loading crates in the compiler, but it's by
212 //! no means all of the necessary details. Take a look at the rest of
213 //! metadata::loader or metadata::creader for all the juicy details!
214
215 use back::archive::{METADATA_FILENAME};
216 use back::svh::Svh;
217 use driver::session::Session;
218 use llvm;
219 use llvm::{False, ObjectFile, mk_section_iter};
220 use llvm::archive_ro::ArchiveRO;
221 use metadata::cstore::{MetadataBlob, MetadataVec, MetadataArchive};
222 use metadata::decoder;
223 use metadata::encoder;
224 use metadata::filesearch::{FileSearch, FileMatches, FileDoesntMatch};
225 use syntax::abi;
226 use syntax::codemap::Span;
227 use syntax::diagnostic::SpanHandler;
228 use util::fs;
229
230 use std::c_str::ToCStr;
231 use std::cmp;
232 use std::io;
233 use std::mem;
234 use std::ptr;
235 use std::slice;
236 use std::string;
237
238 use std::collections::{HashMap, HashSet};
239 use flate;
240 use time;
241
242 pub static MACOS_DLL_PREFIX: &'static str = "lib";
243 pub static MACOS_DLL_SUFFIX: &'static str = ".dylib";
244
245 pub static WIN32_DLL_PREFIX: &'static str = "";
246 pub static WIN32_DLL_SUFFIX: &'static str = ".dll";
247
248 pub static LINUX_DLL_PREFIX: &'static str = "lib";
249 pub static LINUX_DLL_SUFFIX: &'static str = ".so";
250
251 pub static FREEBSD_DLL_PREFIX: &'static str = "lib";
252 pub static FREEBSD_DLL_SUFFIX: &'static str = ".so";
253
254 pub static DRAGONFLY_DLL_PREFIX: &'static str = "lib";
255 pub static DRAGONFLY_DLL_SUFFIX: &'static str = ".so";
256
257 pub static ANDROID_DLL_PREFIX: &'static str = "lib";
258 pub static ANDROID_DLL_SUFFIX: &'static str = ".so";
259
260 pub struct CrateMismatch {
261     path: Path,
262     got: String,
263 }
264
265 pub struct Context<'a> {
266     pub sess: &'a Session,
267     pub span: Span,
268     pub ident: &'a str,
269     pub crate_name: &'a str,
270     pub hash: Option<&'a Svh>,
271     pub triple: &'a str,
272     pub os: abi::Os,
273     pub filesearch: FileSearch<'a>,
274     pub root: &'a Option<CratePaths>,
275     pub rejected_via_hash: Vec<CrateMismatch>,
276     pub rejected_via_triple: Vec<CrateMismatch>,
277     pub should_match_name: bool,
278 }
279
280 pub struct Library {
281     pub dylib: Option<Path>,
282     pub rlib: Option<Path>,
283     pub metadata: MetadataBlob,
284 }
285
286 pub struct ArchiveMetadata {
287     _archive: ArchiveRO,
288     // See comments in ArchiveMetadata::new for why this is static
289     data: &'static [u8],
290 }
291
292 pub struct CratePaths {
293     pub ident: String,
294     pub dylib: Option<Path>,
295     pub rlib: Option<Path>
296 }
297
298 impl CratePaths {
299     fn paths(&self) -> Vec<Path> {
300         match (&self.dylib, &self.rlib) {
301             (&None,    &None)              => vec!(),
302             (&Some(ref p), &None) |
303             (&None, &Some(ref p))          => vec!(p.clone()),
304             (&Some(ref p1), &Some(ref p2)) => vec!(p1.clone(), p2.clone()),
305         }
306     }
307 }
308
309 impl<'a> Context<'a> {
310     pub fn maybe_load_library_crate(&mut self) -> Option<Library> {
311         self.find_library_crate()
312     }
313
314     pub fn load_library_crate(&mut self) -> Library {
315         match self.find_library_crate() {
316             Some(t) => t,
317             None => {
318                 self.report_load_errs();
319                 unreachable!()
320             }
321         }
322     }
323
324     pub fn report_load_errs(&mut self) {
325         let message = if self.rejected_via_hash.len() > 0 {
326             format!("found possibly newer version of crate `{}`",
327                     self.ident)
328         } else if self.rejected_via_triple.len() > 0 {
329             format!("found incorrect triple for crate `{}`", self.ident)
330         } else {
331             format!("can't find crate for `{}`", self.ident)
332         };
333         let message = match self.root {
334             &None => message,
335             &Some(ref r) => format!("{} which `{}` depends on",
336                                     message, r.ident)
337         };
338         self.sess.span_err(self.span, message.as_slice());
339
340         let mismatches = self.rejected_via_triple.iter();
341         if self.rejected_via_triple.len() > 0 {
342             self.sess.span_note(self.span,
343                                 format!("expected triple of {}",
344                                         self.triple).as_slice());
345             for (i, &CrateMismatch{ ref path, ref got }) in mismatches.enumerate() {
346                 self.sess.fileline_note(self.span,
347                     format!("crate `{}` path {}{}, triple {}: {}",
348                             self.ident, "#", i+1, got, path.display()).as_slice());
349             }
350         }
351         if self.rejected_via_hash.len() > 0 {
352             self.sess.span_note(self.span, "perhaps this crate needs \
353                                             to be recompiled?");
354             let mismatches = self.rejected_via_hash.iter();
355             for (i, &CrateMismatch{ ref path, .. }) in mismatches.enumerate() {
356                 self.sess.fileline_note(self.span,
357                     format!("crate `{}` path {}{}: {}",
358                             self.ident, "#", i+1, path.display()).as_slice());
359             }
360             match self.root {
361                 &None => {}
362                 &Some(ref r) => {
363                     for (i, path) in r.paths().iter().enumerate() {
364                         self.sess.fileline_note(self.span,
365                             format!("crate `{}` path #{}: {}",
366                                     r.ident, i+1, path.display()).as_slice());
367                     }
368                 }
369             }
370         }
371         self.sess.abort_if_errors();
372     }
373
374     fn find_library_crate(&mut self) -> Option<Library> {
375         // If an SVH is specified, then this is a transitive dependency that
376         // must be loaded via -L plus some filtering.
377         if self.hash.is_none() {
378             self.should_match_name = false;
379             match self.find_commandline_library() {
380                 Some(l) => return Some(l),
381                 None => {}
382             }
383             self.should_match_name = true;
384         }
385
386         let dypair = self.dylibname();
387
388         // want: crate_name.dir_part() + prefix + crate_name.file_part + "-"
389         let dylib_prefix = dypair.map(|(prefix, _)| {
390             format!("{}{}", prefix, self.crate_name)
391         });
392         let rlib_prefix = format!("lib{}", self.crate_name);
393
394         let mut candidates = HashMap::new();
395
396         // First, find all possible candidate rlibs and dylibs purely based on
397         // the name of the files themselves. We're trying to match against an
398         // exact crate name and a possibly an exact hash.
399         //
400         // During this step, we can filter all found libraries based on the
401         // name and id found in the crate id (we ignore the path portion for
402         // filename matching), as well as the exact hash (if specified). If we
403         // end up having many candidates, we must look at the metadata to
404         // perform exact matches against hashes/crate ids. Note that opening up
405         // the metadata is where we do an exact match against the full contents
406         // of the crate id (path/name/id).
407         //
408         // The goal of this step is to look at as little metadata as possible.
409         self.filesearch.search(|path| {
410             let file = match path.filename_str() {
411                 None => return FileDoesntMatch,
412                 Some(file) => file,
413             };
414             let (hash, rlib) = if file.starts_with(rlib_prefix.as_slice()) &&
415                     file.ends_with(".rlib") {
416                 (file.slice(rlib_prefix.len(), file.len() - ".rlib".len()),
417                  true)
418             } else if dypair.map_or(false, |(_, suffix)| {
419                 file.starts_with(dylib_prefix.get_ref().as_slice()) &&
420                 file.ends_with(suffix)
421             }) {
422                 let (_, suffix) = dypair.unwrap();
423                 let dylib_prefix = dylib_prefix.get_ref().as_slice();
424                 (file.slice(dylib_prefix.len(), file.len() - suffix.len()),
425                  false)
426             } else {
427                 return FileDoesntMatch
428             };
429             info!("lib candidate: {}", path.display());
430             let slot = candidates.find_or_insert_with(hash.to_string(), |_| {
431                 (HashSet::new(), HashSet::new())
432             });
433             let (ref mut rlibs, ref mut dylibs) = *slot;
434             if rlib {
435                 rlibs.insert(fs::realpath(path).unwrap());
436             } else {
437                 dylibs.insert(fs::realpath(path).unwrap());
438             }
439             FileMatches
440         });
441
442         // We have now collected all known libraries into a set of candidates
443         // keyed of the filename hash listed. For each filename, we also have a
444         // list of rlibs/dylibs that apply. Here, we map each of these lists
445         // (per hash), to a Library candidate for returning.
446         //
447         // A Library candidate is created if the metadata for the set of
448         // libraries corresponds to the crate id and hash criteria that this
449         // search is being performed for.
450         let mut libraries = Vec::new();
451         for (_hash, (rlibs, dylibs)) in candidates.move_iter() {
452             let mut metadata = None;
453             let rlib = self.extract_one(rlibs, "rlib", &mut metadata);
454             let dylib = self.extract_one(dylibs, "dylib", &mut metadata);
455             match metadata {
456                 Some(metadata) => {
457                     libraries.push(Library {
458                         dylib: dylib,
459                         rlib: rlib,
460                         metadata: metadata,
461                     })
462                 }
463                 None => {}
464             }
465         }
466
467         // Having now translated all relevant found hashes into libraries, see
468         // what we've got and figure out if we found multiple candidates for
469         // libraries or not.
470         match libraries.len() {
471             0 => None,
472             1 => Some(libraries.move_iter().next().unwrap()),
473             _ => {
474                 self.sess.span_err(self.span,
475                     format!("multiple matching crates for `{}`",
476                             self.crate_name).as_slice());
477                 self.sess.note("candidates:");
478                 for lib in libraries.iter() {
479                     match lib.dylib {
480                         Some(ref p) => {
481                             self.sess.note(format!("path: {}",
482                                                    p.display()).as_slice());
483                         }
484                         None => {}
485                     }
486                     match lib.rlib {
487                         Some(ref p) => {
488                             self.sess.note(format!("path: {}",
489                                                    p.display()).as_slice());
490                         }
491                         None => {}
492                     }
493                     let data = lib.metadata.as_slice();
494                     let name = decoder::get_crate_name(data);
495                     note_crate_name(self.sess.diagnostic(), name.as_slice());
496                 }
497                 None
498             }
499         }
500     }
501
502     // Attempts to extract *one* library from the set `m`. If the set has no
503     // elements, `None` is returned. If the set has more than one element, then
504     // the errors and notes are emitted about the set of libraries.
505     //
506     // With only one library in the set, this function will extract it, and then
507     // read the metadata from it if `*slot` is `None`. If the metadata couldn't
508     // be read, it is assumed that the file isn't a valid rust library (no
509     // errors are emitted).
510     fn extract_one(&mut self, m: HashSet<Path>, flavor: &str,
511                    slot: &mut Option<MetadataBlob>) -> Option<Path> {
512         let mut ret = None::<Path>;
513         let mut error = 0u;
514
515         if slot.is_some() {
516             // FIXME(#10786): for an optimization, we only read one of the
517             //                library's metadata sections. In theory we should
518             //                read both, but reading dylib metadata is quite
519             //                slow.
520             if m.len() == 0 {
521                 return None
522             } else if m.len() == 1 {
523                 return Some(m.move_iter().next().unwrap())
524             }
525         }
526
527         for lib in m.move_iter() {
528             info!("{} reading metadata from: {}", flavor, lib.display());
529             let metadata = match get_metadata_section(self.os, &lib) {
530                 Ok(blob) => {
531                     if self.crate_matches(blob.as_slice(), &lib) {
532                         blob
533                     } else {
534                         info!("metadata mismatch");
535                         continue
536                     }
537                 }
538                 Err(_) => {
539                     info!("no metadata found");
540                     continue
541                 }
542             };
543             if ret.is_some() {
544                 self.sess.span_err(self.span,
545                                    format!("multiple {} candidates for `{}` \
546                                             found",
547                                            flavor,
548                                            self.crate_name).as_slice());
549                 self.sess.span_note(self.span,
550                                     format!(r"candidate #1: {}",
551                                             ret.get_ref()
552                                                .display()).as_slice());
553                 error = 1;
554                 ret = None;
555             }
556             if error > 0 {
557                 error += 1;
558                 self.sess.span_note(self.span,
559                                     format!(r"candidate #{}: {}", error,
560                                             lib.display()).as_slice());
561                 continue
562             }
563             *slot = Some(metadata);
564             ret = Some(lib);
565         }
566         return if error > 0 {None} else {ret}
567     }
568
569     fn crate_matches(&mut self, crate_data: &[u8], libpath: &Path) -> bool {
570         if self.should_match_name {
571             match decoder::maybe_get_crate_name(crate_data) {
572                 Some(ref name) if self.crate_name == name.as_slice() => {}
573                 _ => { info!("Rejecting via crate name"); return false }
574             }
575         }
576         let hash = match decoder::maybe_get_crate_hash(crate_data) {
577             Some(hash) => hash, None => {
578                 info!("Rejecting via lack of crate hash");
579                 return false;
580             }
581         };
582
583         let triple = match decoder::get_crate_triple(crate_data) {
584             None => { debug!("triple not present"); return false }
585             Some(t) => t,
586         };
587         if triple.as_slice() != self.triple {
588             info!("Rejecting via crate triple: expected {} got {}", self.triple, triple);
589             self.rejected_via_triple.push(CrateMismatch {
590                 path: libpath.clone(),
591                 got: triple.to_string()
592             });
593             return false;
594         }
595
596         match self.hash {
597             None => true,
598             Some(myhash) => {
599                 if *myhash != hash {
600                     info!("Rejecting via hash: expected {} got {}", *myhash, hash);
601                     self.rejected_via_hash.push(CrateMismatch {
602                         path: libpath.clone(),
603                         got: myhash.as_str().to_string()
604                     });
605                     false
606                 } else {
607                     true
608                 }
609             }
610         }
611     }
612
613
614     // Returns the corresponding (prefix, suffix) that files need to have for
615     // dynamic libraries
616     fn dylibname(&self) -> Option<(&'static str, &'static str)> {
617         match self.os {
618             abi::OsWindows => Some((WIN32_DLL_PREFIX, WIN32_DLL_SUFFIX)),
619             abi::OsMacos => Some((MACOS_DLL_PREFIX, MACOS_DLL_SUFFIX)),
620             abi::OsLinux => Some((LINUX_DLL_PREFIX, LINUX_DLL_SUFFIX)),
621             abi::OsAndroid => Some((ANDROID_DLL_PREFIX, ANDROID_DLL_SUFFIX)),
622             abi::OsFreebsd => Some((FREEBSD_DLL_PREFIX, FREEBSD_DLL_SUFFIX)),
623             abi::OsDragonfly => Some((DRAGONFLY_DLL_PREFIX, DRAGONFLY_DLL_SUFFIX)),
624             abi::OsiOS => None,
625         }
626     }
627
628     fn find_commandline_library(&mut self) -> Option<Library> {
629         let locs = match self.sess.opts.externs.find_equiv(&self.crate_name) {
630             Some(s) => s,
631             None => return None,
632         };
633
634         // First, filter out all libraries that look suspicious. We only accept
635         // files which actually exist that have the correct naming scheme for
636         // rlibs/dylibs.
637         let sess = self.sess;
638         let dylibname = self.dylibname();
639         let mut locs = locs.iter().map(|l| Path::new(l.as_slice())).filter(|loc| {
640             if !loc.exists() {
641                 sess.err(format!("extern location does not exist: {}",
642                                  loc.display()).as_slice());
643                 return false;
644             }
645             let file = loc.filename_str().unwrap();
646             if file.starts_with("lib") && file.ends_with(".rlib") {
647                 return true
648             } else {
649                 match dylibname {
650                     Some((prefix, suffix)) => {
651                         if file.starts_with(prefix) && file.ends_with(suffix) {
652                             return true
653                         }
654                     }
655                     None => {}
656                 }
657             }
658             sess.err(format!("extern location is of an unknown type: {}",
659                              loc.display()).as_slice());
660             false
661         });
662
663         // Now that we have an iterator of good candidates, make sure there's at
664         // most one rlib and at most one dylib.
665         let mut rlibs = HashSet::new();
666         let mut dylibs = HashSet::new();
667         for loc in locs {
668             if loc.filename_str().unwrap().ends_with(".rlib") {
669                 rlibs.insert(fs::realpath(&loc).unwrap());
670             } else {
671                 dylibs.insert(fs::realpath(&loc).unwrap());
672             }
673         }
674
675         // Extract the rlib/dylib pair.
676         let mut metadata = None;
677         let rlib = self.extract_one(rlibs, "rlib", &mut metadata);
678         let dylib = self.extract_one(dylibs, "dylib", &mut metadata);
679
680         if rlib.is_none() && dylib.is_none() { return None }
681         match metadata {
682             Some(metadata) => Some(Library {
683                 dylib: dylib,
684                 rlib: rlib,
685                 metadata: metadata,
686             }),
687             None => None,
688         }
689     }
690 }
691
692 pub fn note_crate_name(diag: &SpanHandler, name: &str) {
693     diag.handler().note(format!("crate name: {}", name).as_slice());
694 }
695
696 impl ArchiveMetadata {
697     fn new(ar: ArchiveRO) -> Option<ArchiveMetadata> {
698         let data: &'static [u8] = {
699             let data = match ar.read(METADATA_FILENAME) {
700                 Some(data) => data,
701                 None => {
702                     debug!("didn't find '{}' in the archive", METADATA_FILENAME);
703                     return None;
704                 }
705             };
706             // This data is actually a pointer inside of the archive itself, but
707             // we essentially want to cache it because the lookup inside the
708             // archive is a fairly expensive operation (and it's queried for
709             // *very* frequently). For this reason, we transmute it to the
710             // static lifetime to put into the struct. Note that the buffer is
711             // never actually handed out with a static lifetime, but rather the
712             // buffer is loaned with the lifetime of this containing object.
713             // Hence, we're guaranteed that the buffer will never be used after
714             // this object is dead, so this is a safe operation to transmute and
715             // store the data as a static buffer.
716             unsafe { mem::transmute(data) }
717         };
718         Some(ArchiveMetadata {
719             _archive: ar,
720             data: data,
721         })
722     }
723
724     pub fn as_slice<'a>(&'a self) -> &'a [u8] { self.data }
725 }
726
727 // Just a small wrapper to time how long reading metadata takes.
728 fn get_metadata_section(os: abi::Os, filename: &Path) -> Result<MetadataBlob, String> {
729     let start = time::precise_time_ns();
730     let ret = get_metadata_section_imp(os, filename);
731     info!("reading {} => {}ms", filename.filename_display(),
732            (time::precise_time_ns() - start) / 1000000);
733     return ret;
734 }
735
736 fn get_metadata_section_imp(os: abi::Os, filename: &Path) -> Result<MetadataBlob, String> {
737     if !filename.exists() {
738         return Err(format!("no such file: '{}'", filename.display()));
739     }
740     if filename.filename_str().unwrap().ends_with(".rlib") {
741         // Use ArchiveRO for speed here, it's backed by LLVM and uses mmap
742         // internally to read the file. We also avoid even using a memcpy by
743         // just keeping the archive along while the metadata is in use.
744         let archive = match ArchiveRO::open(filename) {
745             Some(ar) => ar,
746             None => {
747                 debug!("llvm didn't like `{}`", filename.display());
748                 return Err(format!("failed to read rlib metadata: '{}'",
749                                    filename.display()));
750             }
751         };
752         return match ArchiveMetadata::new(archive).map(|ar| MetadataArchive(ar)) {
753             None => {
754                 return Err((format!("failed to read rlib metadata: '{}'",
755                                     filename.display())))
756             }
757             Some(blob) => return Ok(blob)
758         }
759     }
760     unsafe {
761         let mb = filename.with_c_str(|buf| {
762             llvm::LLVMRustCreateMemoryBufferWithContentsOfFile(buf)
763         });
764         if mb as int == 0 {
765             return Err(format!("error reading library: '{}'",
766                                filename.display()))
767         }
768         let of = match ObjectFile::new(mb) {
769             Some(of) => of,
770             _ => {
771                 return Err((format!("provided path not an object file: '{}'",
772                                     filename.display())))
773             }
774         };
775         let si = mk_section_iter(of.llof);
776         while llvm::LLVMIsSectionIteratorAtEnd(of.llof, si.llsi) == False {
777             let mut name_buf = ptr::null();
778             let name_len = llvm::LLVMRustGetSectionName(si.llsi, &mut name_buf);
779             let name = string::raw::from_buf_len(name_buf as *const u8,
780                                               name_len as uint);
781             debug!("get_metadata_section: name {}", name);
782             if read_meta_section_name(os).as_slice() == name.as_slice() {
783                 let cbuf = llvm::LLVMGetSectionContents(si.llsi);
784                 let csz = llvm::LLVMGetSectionSize(si.llsi) as uint;
785                 let mut found =
786                     Err(format!("metadata not found: '{}'", filename.display()));
787                 let cvbuf: *const u8 = mem::transmute(cbuf);
788                 let vlen = encoder::metadata_encoding_version.len();
789                 debug!("checking {} bytes of metadata-version stamp",
790                        vlen);
791                 let minsz = cmp::min(vlen, csz);
792                 let version_ok = slice::raw::buf_as_slice(cvbuf, minsz,
793                     |buf0| buf0 == encoder::metadata_encoding_version);
794                 if !version_ok {
795                     return Err((format!("incompatible metadata version found: '{}'",
796                                         filename.display())));
797                 }
798
799                 let cvbuf1 = cvbuf.offset(vlen as int);
800                 debug!("inflating {} bytes of compressed metadata",
801                        csz - vlen);
802                 slice::raw::buf_as_slice(cvbuf1, csz-vlen, |bytes| {
803                     match flate::inflate_bytes(bytes) {
804                         Some(inflated) => found = Ok(MetadataVec(inflated)),
805                         None => {
806                             found =
807                                 Err(format!("failed to decompress \
808                                              metadata for: '{}'",
809                                             filename.display()))
810                         }
811                     }
812                 });
813                 if found.is_ok() {
814                     return found;
815                 }
816             }
817             llvm::LLVMMoveToNextSection(si.llsi);
818         }
819         return Err(format!("metadata not found: '{}'", filename.display()));
820     }
821 }
822
823 pub fn meta_section_name(os: abi::Os) -> Option<&'static str> {
824     match os {
825         abi::OsMacos => Some("__DATA,__note.rustc"),
826         abi::OsiOS => Some("__DATA,__note.rustc"),
827         abi::OsWindows => Some(".note.rustc"),
828         abi::OsLinux => Some(".note.rustc"),
829         abi::OsAndroid => Some(".note.rustc"),
830         abi::OsFreebsd => Some(".note.rustc"),
831         abi::OsDragonfly => Some(".note.rustc"),
832     }
833 }
834
835 pub fn read_meta_section_name(os: abi::Os) -> &'static str {
836     match os {
837         abi::OsMacos => "__note.rustc",
838         abi::OsiOS => unreachable!(),
839         abi::OsWindows => ".note.rustc",
840         abi::OsLinux => ".note.rustc",
841         abi::OsAndroid => ".note.rustc",
842         abi::OsFreebsd => ".note.rustc",
843         abi::OsDragonfly => ".note.rustc"
844     }
845 }
846
847 // A diagnostic function for dumping crate metadata to an output stream
848 pub fn list_file_metadata(os: abi::Os, path: &Path,
849                           out: &mut io::Writer) -> io::IoResult<()> {
850     match get_metadata_section(os, path) {
851         Ok(bytes) => decoder::list_crate_metadata(bytes.as_slice(), out),
852         Err(msg) => {
853             write!(out, "{}\n", msg)
854         }
855     }
856 }