]> git.lizzy.rs Git - rust.git/blob - src/libsyntax_pos/lib.rs
98d7d77308f89e78ce6204e777a8c1d232d78f12
[rust.git] / src / libsyntax_pos / lib.rs
1 // Copyright 2012-2013 The Rust Project Developers. See the COPYRIGHT
2 // file at the top-level directory of this distribution and at
3 // http://rust-lang.org/COPYRIGHT.
4 //
5 // Licensed under the Apache License, Version 2.0 <LICENSE-APACHE or
6 // http://www.apache.org/licenses/LICENSE-2.0> or the MIT license
7 // <LICENSE-MIT or http://opensource.org/licenses/MIT>, at your
8 // option. This file may not be copied, modified, or distributed
9 // except according to those terms.
10
11 //! The source positions and related helper functions
12 //!
13 //! # Note
14 //!
15 //! This API is completely unstable and subject to change.
16
17 #![doc(html_logo_url = "https://www.rust-lang.org/logos/rust-logo-128x128-blk-v2.png",
18       html_favicon_url = "https://doc.rust-lang.org/favicon.ico",
19       html_root_url = "https://doc.rust-lang.org/nightly/")]
20
21 #![feature(const_fn)]
22 #![feature(crate_visibility_modifier)]
23 #![feature(custom_attribute)]
24 #![cfg_attr(not(stage0), feature(nll))]
25 #![feature(non_exhaustive)]
26 #![feature(optin_builtin_traits)]
27 #![feature(specialization)]
28 #![feature(stdsimd)]
29
30 use std::borrow::Cow;
31 use std::cell::Cell;
32 use std::cmp::{self, Ordering};
33 use std::fmt;
34 use std::hash::{Hasher, Hash};
35 use std::ops::{Add, Sub};
36 use std::path::PathBuf;
37
38 use rustc_data_structures::stable_hasher::StableHasher;
39 use rustc_data_structures::sync::{Lrc, Lock};
40
41 extern crate arena;
42 extern crate rustc_data_structures;
43
44 #[macro_use]
45 extern crate scoped_tls;
46
47 use serialize::{Encodable, Decodable, Encoder, Decoder};
48
49 extern crate serialize;
50 extern crate serialize as rustc_serialize; // used by deriving
51
52 #[macro_use]
53 extern crate cfg_if;
54
55 extern crate unicode_width;
56
57 pub mod edition;
58 pub mod hygiene;
59 pub use hygiene::{Mark, SyntaxContext, ExpnInfo, ExpnFormat, CompilerDesugaringKind};
60
61 mod span_encoding;
62 pub use span_encoding::{Span, DUMMY_SP};
63
64 pub mod symbol;
65
66 mod analyze_filemap;
67
68 pub struct Globals {
69     symbol_interner: Lock<symbol::Interner>,
70     span_interner: Lock<span_encoding::SpanInterner>,
71     hygiene_data: Lock<hygiene::HygieneData>,
72 }
73
74 impl Globals {
75     pub fn new() -> Globals {
76         Globals {
77             symbol_interner: Lock::new(symbol::Interner::fresh()),
78             span_interner: Lock::new(span_encoding::SpanInterner::default()),
79             hygiene_data: Lock::new(hygiene::HygieneData::new()),
80         }
81     }
82 }
83
84 scoped_thread_local!(pub static GLOBALS: Globals);
85
86 /// Differentiates between real files and common virtual files
87 #[derive(Debug, Eq, PartialEq, Clone, Ord, PartialOrd, Hash, RustcDecodable, RustcEncodable)]
88 pub enum FileName {
89     Real(PathBuf),
90     /// e.g. "std" macros
91     Macros(String),
92     /// call to `quote!`
93     QuoteExpansion,
94     /// Command line
95     Anon,
96     /// Hack in src/libsyntax/parse.rs
97     /// FIXME(jseyfried)
98     MacroExpansion,
99     ProcMacroSourceCode,
100     /// Strings provided as --cfg [cfgspec] stored in a crate_cfg
101     CfgSpec,
102     /// Strings provided as crate attributes in the CLI
103     CliCrateAttr,
104     /// Custom sources for explicit parser calls from plugins and drivers
105     Custom(String),
106 }
107
108 impl std::fmt::Display for FileName {
109     fn fmt(&self, fmt: &mut std::fmt::Formatter) -> std::fmt::Result {
110         use self::FileName::*;
111         match *self {
112             Real(ref path) => write!(fmt, "{}", path.display()),
113             Macros(ref name) => write!(fmt, "<{} macros>", name),
114             QuoteExpansion => write!(fmt, "<quote expansion>"),
115             MacroExpansion => write!(fmt, "<macro expansion>"),
116             Anon => write!(fmt, "<anon>"),
117             ProcMacroSourceCode => write!(fmt, "<proc-macro source code>"),
118             CfgSpec => write!(fmt, "cfgspec"),
119             CliCrateAttr => write!(fmt, "<crate attribute>"),
120             Custom(ref s) => write!(fmt, "<{}>", s),
121         }
122     }
123 }
124
125 impl From<PathBuf> for FileName {
126     fn from(p: PathBuf) -> Self {
127         assert!(!p.to_string_lossy().ends_with('>'));
128         FileName::Real(p)
129     }
130 }
131
132 impl FileName {
133     pub fn is_real(&self) -> bool {
134         use self::FileName::*;
135         match *self {
136             Real(_) => true,
137             Macros(_) |
138             Anon |
139             MacroExpansion |
140             ProcMacroSourceCode |
141             CfgSpec |
142             CliCrateAttr |
143             Custom(_) |
144             QuoteExpansion => false,
145         }
146     }
147
148     pub fn is_macros(&self) -> bool {
149         use self::FileName::*;
150         match *self {
151             Real(_) |
152             Anon |
153             MacroExpansion |
154             ProcMacroSourceCode |
155             CfgSpec |
156             CliCrateAttr |
157             Custom(_) |
158             QuoteExpansion => false,
159             Macros(_) => true,
160         }
161     }
162 }
163
164 /// Spans represent a region of code, used for error reporting. Positions in spans
165 /// are *absolute* positions from the beginning of the codemap, not positions
166 /// relative to FileMaps. Methods on the CodeMap can be used to relate spans back
167 /// to the original source.
168 /// You must be careful if the span crosses more than one file - you will not be
169 /// able to use many of the functions on spans in codemap and you cannot assume
170 /// that the length of the span = hi - lo; there may be space in the BytePos
171 /// range between files.
172 ///
173 /// `SpanData` is public because `Span` uses a thread-local interner and can't be
174 /// sent to other threads, but some pieces of performance infra run in a separate thread.
175 /// Using `Span` is generally preferred.
176 #[derive(Clone, Copy, Hash, PartialEq, Eq, Ord, PartialOrd)]
177 pub struct SpanData {
178     pub lo: BytePos,
179     pub hi: BytePos,
180     /// Information about where the macro came from, if this piece of
181     /// code was created by a macro expansion.
182     pub ctxt: SyntaxContext,
183 }
184
185 impl SpanData {
186     #[inline]
187     pub fn with_lo(&self, lo: BytePos) -> Span {
188         Span::new(lo, self.hi, self.ctxt)
189     }
190     #[inline]
191     pub fn with_hi(&self, hi: BytePos) -> Span {
192         Span::new(self.lo, hi, self.ctxt)
193     }
194     #[inline]
195     pub fn with_ctxt(&self, ctxt: SyntaxContext) -> Span {
196         Span::new(self.lo, self.hi, ctxt)
197     }
198 }
199
200 // The interner is pointed to by a thread local value which is only set on the main thread
201 // with parallelization is disabled. So we don't allow Span to transfer between threads
202 // to avoid panics and other errors, even though it would be memory safe to do so.
203 #[cfg(not(parallel_queries))]
204 impl !Send for Span {}
205 #[cfg(not(parallel_queries))]
206 impl !Sync for Span {}
207
208 impl PartialOrd for Span {
209     fn partial_cmp(&self, rhs: &Self) -> Option<Ordering> {
210         PartialOrd::partial_cmp(&self.data(), &rhs.data())
211     }
212 }
213 impl Ord for Span {
214     fn cmp(&self, rhs: &Self) -> Ordering {
215         Ord::cmp(&self.data(), &rhs.data())
216     }
217 }
218
219 /// A collection of spans. Spans have two orthogonal attributes:
220 ///
221 /// - they can be *primary spans*. In this case they are the locus of
222 ///   the error, and would be rendered with `^^^`.
223 /// - they can have a *label*. In this case, the label is written next
224 ///   to the mark in the snippet when we render.
225 #[derive(Clone, Debug, Hash, PartialEq, Eq, RustcEncodable, RustcDecodable)]
226 pub struct MultiSpan {
227     primary_spans: Vec<Span>,
228     span_labels: Vec<(Span, String)>,
229 }
230
231 impl Span {
232     #[inline]
233     pub fn lo(self) -> BytePos {
234         self.data().lo
235     }
236     #[inline]
237     pub fn with_lo(self, lo: BytePos) -> Span {
238         self.data().with_lo(lo)
239     }
240     #[inline]
241     pub fn hi(self) -> BytePos {
242         self.data().hi
243     }
244     #[inline]
245     pub fn with_hi(self, hi: BytePos) -> Span {
246         self.data().with_hi(hi)
247     }
248     #[inline]
249     pub fn ctxt(self) -> SyntaxContext {
250         self.data().ctxt
251     }
252     #[inline]
253     pub fn with_ctxt(self, ctxt: SyntaxContext) -> Span {
254         self.data().with_ctxt(ctxt)
255     }
256
257     /// Returns `true` if this is a dummy span with any hygienic context.
258     #[inline]
259     pub fn is_dummy(self) -> bool {
260         let span = self.data();
261         span.lo.0 == 0 && span.hi.0 == 0
262     }
263
264     /// Returns a new span representing an empty span at the beginning of this span
265     #[inline]
266     pub fn shrink_to_lo(self) -> Span {
267         let span = self.data();
268         span.with_hi(span.lo)
269     }
270     /// Returns a new span representing an empty span at the end of this span
271     #[inline]
272     pub fn shrink_to_hi(self) -> Span {
273         let span = self.data();
274         span.with_lo(span.hi)
275     }
276
277     /// Returns `self` if `self` is not the dummy span, and `other` otherwise.
278     pub fn substitute_dummy(self, other: Span) -> Span {
279         if self.is_dummy() { other } else { self }
280     }
281
282     /// Return true if `self` fully encloses `other`.
283     pub fn contains(self, other: Span) -> bool {
284         let span = self.data();
285         let other = other.data();
286         span.lo <= other.lo && other.hi <= span.hi
287     }
288
289     /// Return true if the spans are equal with regards to the source text.
290     ///
291     /// Use this instead of `==` when either span could be generated code,
292     /// and you only care that they point to the same bytes of source text.
293     pub fn source_equal(&self, other: &Span) -> bool {
294         let span = self.data();
295         let other = other.data();
296         span.lo == other.lo && span.hi == other.hi
297     }
298
299     /// Returns `Some(span)`, where the start is trimmed by the end of `other`
300     pub fn trim_start(self, other: Span) -> Option<Span> {
301         let span = self.data();
302         let other = other.data();
303         if span.hi > other.hi {
304             Some(span.with_lo(cmp::max(span.lo, other.hi)))
305         } else {
306             None
307         }
308     }
309
310     /// Return the source span - this is either the supplied span, or the span for
311     /// the macro callsite that expanded to it.
312     pub fn source_callsite(self) -> Span {
313         self.ctxt().outer().expn_info().map(|info| info.call_site.source_callsite()).unwrap_or(self)
314     }
315
316     /// The `Span` for the tokens in the previous macro expansion from which `self` was generated,
317     /// if any
318     pub fn parent(self) -> Option<Span> {
319         self.ctxt().outer().expn_info().map(|i| i.call_site)
320     }
321
322     /// Edition of the crate from which this span came.
323     pub fn edition(self) -> edition::Edition {
324         self.ctxt().outer().expn_info().map_or_else(|| hygiene::default_edition(),
325                                                     |einfo| einfo.edition)
326     }
327
328     /// Return the source callee.
329     ///
330     /// Returns `None` if the supplied span has no expansion trace,
331     /// else returns the `ExpnInfo` for the macro definition
332     /// corresponding to the source callsite.
333     pub fn source_callee(self) -> Option<ExpnInfo> {
334         fn source_callee(info: ExpnInfo) -> ExpnInfo {
335             match info.call_site.ctxt().outer().expn_info() {
336                 Some(info) => source_callee(info),
337                 None => info,
338             }
339         }
340         self.ctxt().outer().expn_info().map(source_callee)
341     }
342
343     /// Check if a span is "internal" to a macro in which #[unstable]
344     /// items can be used (that is, a macro marked with
345     /// `#[allow_internal_unstable]`).
346     pub fn allows_unstable(&self) -> bool {
347         match self.ctxt().outer().expn_info() {
348             Some(info) => info.allow_internal_unstable,
349             None => false,
350         }
351     }
352
353     /// Check if this span arises from a compiler desugaring of kind `kind`.
354     pub fn is_compiler_desugaring(&self, kind: CompilerDesugaringKind) -> bool {
355         match self.ctxt().outer().expn_info() {
356             Some(info) => match info.format {
357                 ExpnFormat::CompilerDesugaring(k) => k == kind,
358                 _ => false,
359             },
360             None => false,
361         }
362     }
363
364     /// Return the compiler desugaring that created this span, or None
365     /// if this span is not from a desugaring.
366     pub fn compiler_desugaring_kind(&self) -> Option<CompilerDesugaringKind> {
367         match self.ctxt().outer().expn_info() {
368             Some(info) => match info.format {
369                 ExpnFormat::CompilerDesugaring(k) => Some(k),
370                 _ => None
371             },
372             None => None
373         }
374     }
375
376     /// Check if a span is "internal" to a macro in which `unsafe`
377     /// can be used without triggering the `unsafe_code` lint
378     //  (that is, a macro marked with `#[allow_internal_unsafe]`).
379     pub fn allows_unsafe(&self) -> bool {
380         match self.ctxt().outer().expn_info() {
381             Some(info) => info.allow_internal_unsafe,
382             None => false,
383         }
384     }
385
386     pub fn macro_backtrace(mut self) -> Vec<MacroBacktrace> {
387         let mut prev_span = DUMMY_SP;
388         let mut result = vec![];
389         while let Some(info) = self.ctxt().outer().expn_info() {
390             // Don't print recursive invocations
391             if !info.call_site.source_equal(&prev_span) {
392                 let (pre, post) = match info.format {
393                     ExpnFormat::MacroAttribute(..) => ("#[", "]"),
394                     ExpnFormat::MacroBang(..) => ("", "!"),
395                     ExpnFormat::CompilerDesugaring(..) => ("desugaring of `", "`"),
396                 };
397                 result.push(MacroBacktrace {
398                     call_site: info.call_site,
399                     macro_decl_name: format!("{}{}{}", pre, info.format.name(), post),
400                     def_site_span: info.def_site,
401                 });
402             }
403
404             prev_span = self;
405             self = info.call_site;
406         }
407         result
408     }
409
410     /// Return a `Span` that would enclose both `self` and `end`.
411     pub fn to(self, end: Span) -> Span {
412         let span_data = self.data();
413         let end_data = end.data();
414         // FIXME(jseyfried): self.ctxt should always equal end.ctxt here (c.f. issue #23480)
415         // Return the macro span on its own to avoid weird diagnostic output. It is preferable to
416         // have an incomplete span than a completely nonsensical one.
417         if span_data.ctxt != end_data.ctxt {
418             if span_data.ctxt == SyntaxContext::empty() {
419                 return end;
420             } else if end_data.ctxt == SyntaxContext::empty() {
421                 return self;
422             }
423             // both span fall within a macro
424             // FIXME(estebank) check if it is the *same* macro
425         }
426         Span::new(
427             cmp::min(span_data.lo, end_data.lo),
428             cmp::max(span_data.hi, end_data.hi),
429             if span_data.ctxt == SyntaxContext::empty() { end_data.ctxt } else { span_data.ctxt },
430         )
431     }
432
433     /// Return a `Span` between the end of `self` to the beginning of `end`.
434     pub fn between(self, end: Span) -> Span {
435         let span = self.data();
436         let end = end.data();
437         Span::new(
438             span.hi,
439             end.lo,
440             if end.ctxt == SyntaxContext::empty() { end.ctxt } else { span.ctxt },
441         )
442     }
443
444     /// Return a `Span` between the beginning of `self` to the beginning of `end`.
445     pub fn until(self, end: Span) -> Span {
446         let span = self.data();
447         let end = end.data();
448         Span::new(
449             span.lo,
450             end.lo,
451             if end.ctxt == SyntaxContext::empty() { end.ctxt } else { span.ctxt },
452         )
453     }
454
455     pub fn from_inner_byte_pos(self, start: usize, end: usize) -> Span {
456         let span = self.data();
457         Span::new(span.lo + BytePos::from_usize(start),
458                   span.lo + BytePos::from_usize(end),
459                   span.ctxt)
460     }
461
462     #[inline]
463     pub fn apply_mark(self, mark: Mark) -> Span {
464         let span = self.data();
465         span.with_ctxt(span.ctxt.apply_mark(mark))
466     }
467
468     #[inline]
469     pub fn remove_mark(&mut self) -> Mark {
470         let mut span = self.data();
471         let mark = span.ctxt.remove_mark();
472         *self = Span::new(span.lo, span.hi, span.ctxt);
473         mark
474     }
475
476     #[inline]
477     pub fn adjust(&mut self, expansion: Mark) -> Option<Mark> {
478         let mut span = self.data();
479         let mark = span.ctxt.adjust(expansion);
480         *self = Span::new(span.lo, span.hi, span.ctxt);
481         mark
482     }
483
484     #[inline]
485     pub fn glob_adjust(&mut self, expansion: Mark, glob_ctxt: SyntaxContext)
486                        -> Option<Option<Mark>> {
487         let mut span = self.data();
488         let mark = span.ctxt.glob_adjust(expansion, glob_ctxt);
489         *self = Span::new(span.lo, span.hi, span.ctxt);
490         mark
491     }
492
493     #[inline]
494     pub fn reverse_glob_adjust(&mut self, expansion: Mark, glob_ctxt: SyntaxContext)
495                                -> Option<Option<Mark>> {
496         let mut span = self.data();
497         let mark = span.ctxt.reverse_glob_adjust(expansion, glob_ctxt);
498         *self = Span::new(span.lo, span.hi, span.ctxt);
499         mark
500     }
501
502     #[inline]
503     pub fn modern(self) -> Span {
504         let span = self.data();
505         span.with_ctxt(span.ctxt.modern())
506     }
507
508     #[inline]
509     pub fn modern_and_legacy(self) -> Span {
510         let span = self.data();
511         span.with_ctxt(span.ctxt.modern_and_legacy())
512     }
513 }
514
515 #[derive(Clone, Debug)]
516 pub struct SpanLabel {
517     /// The span we are going to include in the final snippet.
518     pub span: Span,
519
520     /// Is this a primary span? This is the "locus" of the message,
521     /// and is indicated with a `^^^^` underline, versus `----`.
522     pub is_primary: bool,
523
524     /// What label should we attach to this span (if any)?
525     pub label: Option<String>,
526 }
527
528 impl Default for Span {
529     fn default() -> Self {
530         DUMMY_SP
531     }
532 }
533
534 impl serialize::UseSpecializedEncodable for Span {
535     fn default_encode<S: Encoder>(&self, s: &mut S) -> Result<(), S::Error> {
536         let span = self.data();
537         s.emit_struct("Span", 2, |s| {
538             s.emit_struct_field("lo", 0, |s| {
539                 span.lo.encode(s)
540             })?;
541
542             s.emit_struct_field("hi", 1, |s| {
543                 span.hi.encode(s)
544             })
545         })
546     }
547 }
548
549 impl serialize::UseSpecializedDecodable for Span {
550     fn default_decode<D: Decoder>(d: &mut D) -> Result<Span, D::Error> {
551         d.read_struct("Span", 2, |d| {
552             let lo = d.read_struct_field("lo", 0, Decodable::decode)?;
553             let hi = d.read_struct_field("hi", 1, Decodable::decode)?;
554             Ok(Span::new(lo, hi, NO_EXPANSION))
555         })
556     }
557 }
558
559 fn default_span_debug(span: Span, f: &mut fmt::Formatter) -> fmt::Result {
560     f.debug_struct("Span")
561         .field("lo", &span.lo())
562         .field("hi", &span.hi())
563         .field("ctxt", &span.ctxt())
564         .finish()
565 }
566
567 impl fmt::Debug for Span {
568     fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
569         SPAN_DEBUG.with(|span_debug| span_debug.get()(*self, f))
570     }
571 }
572
573 impl fmt::Debug for SpanData {
574     fn fmt(&self, f: &mut fmt::Formatter) -> fmt::Result {
575         SPAN_DEBUG.with(|span_debug| span_debug.get()(Span::new(self.lo, self.hi, self.ctxt), f))
576     }
577 }
578
579 impl MultiSpan {
580     pub fn new() -> MultiSpan {
581         MultiSpan {
582             primary_spans: vec![],
583             span_labels: vec![]
584         }
585     }
586
587     pub fn from_span(primary_span: Span) -> MultiSpan {
588         MultiSpan {
589             primary_spans: vec![primary_span],
590             span_labels: vec![]
591         }
592     }
593
594     pub fn from_spans(vec: Vec<Span>) -> MultiSpan {
595         MultiSpan {
596             primary_spans: vec,
597             span_labels: vec![]
598         }
599     }
600
601     pub fn push_span_label(&mut self, span: Span, label: String) {
602         self.span_labels.push((span, label));
603     }
604
605     /// Selects the first primary span (if any)
606     pub fn primary_span(&self) -> Option<Span> {
607         self.primary_spans.first().cloned()
608     }
609
610     /// Returns all primary spans.
611     pub fn primary_spans(&self) -> &[Span] {
612         &self.primary_spans
613     }
614
615     /// Replaces all occurrences of one Span with another. Used to move Spans in areas that don't
616     /// display well (like std macros). Returns true if replacements occurred.
617     pub fn replace(&mut self, before: Span, after: Span) -> bool {
618         let mut replacements_occurred = false;
619         for primary_span in &mut self.primary_spans {
620             if *primary_span == before {
621                 *primary_span = after;
622                 replacements_occurred = true;
623             }
624         }
625         for span_label in &mut self.span_labels {
626             if span_label.0 == before {
627                 span_label.0 = after;
628                 replacements_occurred = true;
629             }
630         }
631         replacements_occurred
632     }
633
634     /// Returns the strings to highlight. We always ensure that there
635     /// is an entry for each of the primary spans -- for each primary
636     /// span P, if there is at least one label with span P, we return
637     /// those labels (marked as primary). But otherwise we return
638     /// `SpanLabel` instances with empty labels.
639     pub fn span_labels(&self) -> Vec<SpanLabel> {
640         let is_primary = |span| self.primary_spans.contains(&span);
641
642         let mut span_labels = self.span_labels.iter().map(|&(span, ref label)|
643             SpanLabel {
644                 span,
645                 is_primary: is_primary(span),
646                 label: Some(label.clone())
647             }
648         ).collect::<Vec<_>>();
649
650         for &span in &self.primary_spans {
651             if !span_labels.iter().any(|sl| sl.span == span) {
652                 span_labels.push(SpanLabel {
653                     span,
654                     is_primary: true,
655                     label: None
656                 });
657             }
658         }
659
660         span_labels
661     }
662 }
663
664 impl From<Span> for MultiSpan {
665     fn from(span: Span) -> MultiSpan {
666         MultiSpan::from_span(span)
667     }
668 }
669
670 impl From<Vec<Span>> for MultiSpan {
671     fn from(spans: Vec<Span>) -> MultiSpan {
672         MultiSpan::from_spans(spans)
673     }
674 }
675
676 pub const NO_EXPANSION: SyntaxContext = SyntaxContext::empty();
677
678 /// Identifies an offset of a multi-byte character in a FileMap
679 #[derive(Copy, Clone, RustcEncodable, RustcDecodable, Eq, PartialEq, Debug)]
680 pub struct MultiByteChar {
681     /// The absolute offset of the character in the CodeMap
682     pub pos: BytePos,
683     /// The number of bytes, >=2
684     pub bytes: u8,
685 }
686
687 /// Identifies an offset of a non-narrow character in a FileMap
688 #[derive(Copy, Clone, RustcEncodable, RustcDecodable, Eq, PartialEq, Debug)]
689 pub enum NonNarrowChar {
690     /// Represents a zero-width character
691     ZeroWidth(BytePos),
692     /// Represents a wide (fullwidth) character
693     Wide(BytePos),
694     /// Represents a tab character, represented visually with a width of 4 characters
695     Tab(BytePos),
696 }
697
698 impl NonNarrowChar {
699     fn new(pos: BytePos, width: usize) -> Self {
700         match width {
701             0 => NonNarrowChar::ZeroWidth(pos),
702             2 => NonNarrowChar::Wide(pos),
703             4 => NonNarrowChar::Tab(pos),
704             _ => panic!("width {} given for non-narrow character", width),
705         }
706     }
707
708     /// Returns the absolute offset of the character in the CodeMap
709     pub fn pos(&self) -> BytePos {
710         match *self {
711             NonNarrowChar::ZeroWidth(p) |
712             NonNarrowChar::Wide(p) |
713             NonNarrowChar::Tab(p) => p,
714         }
715     }
716
717     /// Returns the width of the character, 0 (zero-width) or 2 (wide)
718     pub fn width(&self) -> usize {
719         match *self {
720             NonNarrowChar::ZeroWidth(_) => 0,
721             NonNarrowChar::Wide(_) => 2,
722             NonNarrowChar::Tab(_) => 4,
723         }
724     }
725 }
726
727 impl Add<BytePos> for NonNarrowChar {
728     type Output = Self;
729
730     fn add(self, rhs: BytePos) -> Self {
731         match self {
732             NonNarrowChar::ZeroWidth(pos) => NonNarrowChar::ZeroWidth(pos + rhs),
733             NonNarrowChar::Wide(pos) => NonNarrowChar::Wide(pos + rhs),
734             NonNarrowChar::Tab(pos) => NonNarrowChar::Tab(pos + rhs),
735         }
736     }
737 }
738
739 impl Sub<BytePos> for NonNarrowChar {
740     type Output = Self;
741
742     fn sub(self, rhs: BytePos) -> Self {
743         match self {
744             NonNarrowChar::ZeroWidth(pos) => NonNarrowChar::ZeroWidth(pos - rhs),
745             NonNarrowChar::Wide(pos) => NonNarrowChar::Wide(pos - rhs),
746             NonNarrowChar::Tab(pos) => NonNarrowChar::Tab(pos - rhs),
747         }
748     }
749 }
750
751 /// The state of the lazy external source loading mechanism of a FileMap.
752 #[derive(PartialEq, Eq, Clone)]
753 pub enum ExternalSource {
754     /// The external source has been loaded already.
755     Present(String),
756     /// No attempt has been made to load the external source.
757     AbsentOk,
758     /// A failed attempt has been made to load the external source.
759     AbsentErr,
760     /// No external source has to be loaded, since the FileMap represents a local crate.
761     Unneeded,
762 }
763
764 impl ExternalSource {
765     pub fn is_absent(&self) -> bool {
766         match *self {
767             ExternalSource::Present(_) => false,
768             _ => true,
769         }
770     }
771
772     pub fn get_source(&self) -> Option<&str> {
773         match *self {
774             ExternalSource::Present(ref src) => Some(src),
775             _ => None,
776         }
777     }
778 }
779
780 /// A single source in the CodeMap.
781 #[derive(Clone)]
782 pub struct FileMap {
783     /// The name of the file that the source came from, source that doesn't
784     /// originate from files has names between angle brackets by convention,
785     /// e.g. `<anon>`
786     pub name: FileName,
787     /// True if the `name` field above has been modified by --remap-path-prefix
788     pub name_was_remapped: bool,
789     /// The unmapped path of the file that the source came from.
790     /// Set to `None` if the FileMap was imported from an external crate.
791     pub unmapped_path: Option<FileName>,
792     /// Indicates which crate this FileMap was imported from.
793     pub crate_of_origin: u32,
794     /// The complete source code
795     pub src: Option<Lrc<String>>,
796     /// The source code's hash
797     pub src_hash: u128,
798     /// The external source code (used for external crates, which will have a `None`
799     /// value as `self.src`.
800     pub external_src: Lock<ExternalSource>,
801     /// The start position of this source in the CodeMap
802     pub start_pos: BytePos,
803     /// The end position of this source in the CodeMap
804     pub end_pos: BytePos,
805     /// Locations of lines beginnings in the source code
806     pub lines: Vec<BytePos>,
807     /// Locations of multi-byte characters in the source code
808     pub multibyte_chars: Vec<MultiByteChar>,
809     /// Width of characters that are not narrow in the source code
810     pub non_narrow_chars: Vec<NonNarrowChar>,
811     /// A hash of the filename, used for speeding up the incr. comp. hashing.
812     pub name_hash: u128,
813 }
814
815 impl Encodable for FileMap {
816     fn encode<S: Encoder>(&self, s: &mut S) -> Result<(), S::Error> {
817         s.emit_struct("FileMap", 8, |s| {
818             s.emit_struct_field("name", 0, |s| self.name.encode(s))?;
819             s.emit_struct_field("name_was_remapped", 1, |s| self.name_was_remapped.encode(s))?;
820             s.emit_struct_field("src_hash", 2, |s| self.src_hash.encode(s))?;
821             s.emit_struct_field("start_pos", 4, |s| self.start_pos.encode(s))?;
822             s.emit_struct_field("end_pos", 5, |s| self.end_pos.encode(s))?;
823             s.emit_struct_field("lines", 6, |s| {
824                 let lines = &self.lines[..];
825                 // store the length
826                 s.emit_u32(lines.len() as u32)?;
827
828                 if !lines.is_empty() {
829                     // In order to preserve some space, we exploit the fact that
830                     // the lines list is sorted and individual lines are
831                     // probably not that long. Because of that we can store lines
832                     // as a difference list, using as little space as possible
833                     // for the differences.
834                     let max_line_length = if lines.len() == 1 {
835                         0
836                     } else {
837                         lines.windows(2)
838                              .map(|w| w[1] - w[0])
839                              .map(|bp| bp.to_usize())
840                              .max()
841                              .unwrap()
842                     };
843
844                     let bytes_per_diff: u8 = match max_line_length {
845                         0 ..= 0xFF => 1,
846                         0x100 ..= 0xFFFF => 2,
847                         _ => 4
848                     };
849
850                     // Encode the number of bytes used per diff.
851                     bytes_per_diff.encode(s)?;
852
853                     // Encode the first element.
854                     lines[0].encode(s)?;
855
856                     let diff_iter = (&lines[..]).windows(2)
857                                                 .map(|w| (w[1] - w[0]));
858
859                     match bytes_per_diff {
860                         1 => for diff in diff_iter { (diff.0 as u8).encode(s)? },
861                         2 => for diff in diff_iter { (diff.0 as u16).encode(s)? },
862                         4 => for diff in diff_iter { diff.0.encode(s)? },
863                         _ => unreachable!()
864                     }
865                 }
866
867                 Ok(())
868             })?;
869             s.emit_struct_field("multibyte_chars", 7, |s| {
870                 self.multibyte_chars.encode(s)
871             })?;
872             s.emit_struct_field("non_narrow_chars", 8, |s| {
873                 self.non_narrow_chars.encode(s)
874             })?;
875             s.emit_struct_field("name_hash", 9, |s| {
876                 self.name_hash.encode(s)
877             })
878         })
879     }
880 }
881
882 impl Decodable for FileMap {
883     fn decode<D: Decoder>(d: &mut D) -> Result<FileMap, D::Error> {
884
885         d.read_struct("FileMap", 8, |d| {
886             let name: FileName = d.read_struct_field("name", 0, |d| Decodable::decode(d))?;
887             let name_was_remapped: bool =
888                 d.read_struct_field("name_was_remapped", 1, |d| Decodable::decode(d))?;
889             let src_hash: u128 =
890                 d.read_struct_field("src_hash", 2, |d| Decodable::decode(d))?;
891             let start_pos: BytePos =
892                 d.read_struct_field("start_pos", 4, |d| Decodable::decode(d))?;
893             let end_pos: BytePos = d.read_struct_field("end_pos", 5, |d| Decodable::decode(d))?;
894             let lines: Vec<BytePos> = d.read_struct_field("lines", 6, |d| {
895                 let num_lines: u32 = Decodable::decode(d)?;
896                 let mut lines = Vec::with_capacity(num_lines as usize);
897
898                 if num_lines > 0 {
899                     // Read the number of bytes used per diff.
900                     let bytes_per_diff: u8 = Decodable::decode(d)?;
901
902                     // Read the first element.
903                     let mut line_start: BytePos = Decodable::decode(d)?;
904                     lines.push(line_start);
905
906                     for _ in 1..num_lines {
907                         let diff = match bytes_per_diff {
908                             1 => d.read_u8()? as u32,
909                             2 => d.read_u16()? as u32,
910                             4 => d.read_u32()?,
911                             _ => unreachable!()
912                         };
913
914                         line_start = line_start + BytePos(diff);
915
916                         lines.push(line_start);
917                     }
918                 }
919
920                 Ok(lines)
921             })?;
922             let multibyte_chars: Vec<MultiByteChar> =
923                 d.read_struct_field("multibyte_chars", 7, |d| Decodable::decode(d))?;
924             let non_narrow_chars: Vec<NonNarrowChar> =
925                 d.read_struct_field("non_narrow_chars", 8, |d| Decodable::decode(d))?;
926             let name_hash: u128 =
927                 d.read_struct_field("name_hash", 9, |d| Decodable::decode(d))?;
928             Ok(FileMap {
929                 name,
930                 name_was_remapped,
931                 unmapped_path: None,
932                 // `crate_of_origin` has to be set by the importer.
933                 // This value matches up with rustc::hir::def_id::INVALID_CRATE.
934                 // That constant is not available here unfortunately :(
935                 crate_of_origin: ::std::u32::MAX - 1,
936                 start_pos,
937                 end_pos,
938                 src: None,
939                 src_hash,
940                 external_src: Lock::new(ExternalSource::AbsentOk),
941                 lines,
942                 multibyte_chars,
943                 non_narrow_chars,
944                 name_hash,
945             })
946         })
947     }
948 }
949
950 impl fmt::Debug for FileMap {
951     fn fmt(&self, fmt: &mut fmt::Formatter) -> fmt::Result {
952         write!(fmt, "FileMap({})", self.name)
953     }
954 }
955
956 impl FileMap {
957     pub fn new(name: FileName,
958                name_was_remapped: bool,
959                unmapped_path: FileName,
960                mut src: String,
961                start_pos: BytePos) -> FileMap {
962         remove_bom(&mut src);
963
964         let src_hash = {
965             let mut hasher: StableHasher<u128> = StableHasher::new();
966             hasher.write(src.as_bytes());
967             hasher.finish()
968         };
969         let name_hash = {
970             let mut hasher: StableHasher<u128> = StableHasher::new();
971             name.hash(&mut hasher);
972             hasher.finish()
973         };
974         let end_pos = start_pos.to_usize() + src.len();
975
976         let (lines, multibyte_chars, non_narrow_chars) =
977             analyze_filemap::analyze_filemap(&src[..], start_pos);
978
979         FileMap {
980             name,
981             name_was_remapped,
982             unmapped_path: Some(unmapped_path),
983             crate_of_origin: 0,
984             src: Some(Lrc::new(src)),
985             src_hash,
986             external_src: Lock::new(ExternalSource::Unneeded),
987             start_pos,
988             end_pos: Pos::from_usize(end_pos),
989             lines,
990             multibyte_chars,
991             non_narrow_chars,
992             name_hash,
993         }
994     }
995
996     /// Return the BytePos of the beginning of the current line.
997     pub fn line_begin_pos(&self, pos: BytePos) -> BytePos {
998         let line_index = self.lookup_line(pos).unwrap();
999         self.lines[line_index]
1000     }
1001
1002     /// Add externally loaded source.
1003     /// If the hash of the input doesn't match or no input is supplied via None,
1004     /// it is interpreted as an error and the corresponding enum variant is set.
1005     /// The return value signifies whether some kind of source is present.
1006     pub fn add_external_src<F>(&self, get_src: F) -> bool
1007         where F: FnOnce() -> Option<String>
1008     {
1009         if *self.external_src.borrow() == ExternalSource::AbsentOk {
1010             let src = get_src();
1011             let mut external_src = self.external_src.borrow_mut();
1012             // Check that no-one else have provided the source while we were getting it
1013             if *external_src == ExternalSource::AbsentOk {
1014                 if let Some(src) = src {
1015                     let mut hasher: StableHasher<u128> = StableHasher::new();
1016                     hasher.write(src.as_bytes());
1017
1018                     if hasher.finish() == self.src_hash {
1019                         *external_src = ExternalSource::Present(src);
1020                         return true;
1021                     }
1022                 } else {
1023                     *external_src = ExternalSource::AbsentErr;
1024                 }
1025
1026                 false
1027             } else {
1028                 self.src.is_some() || external_src.get_source().is_some()
1029             }
1030         } else {
1031             self.src.is_some() || self.external_src.borrow().get_source().is_some()
1032         }
1033     }
1034
1035     /// Get a line from the list of pre-computed line-beginnings.
1036     /// The line number here is 0-based.
1037     pub fn get_line(&self, line_number: usize) -> Option<Cow<str>> {
1038         fn get_until_newline(src: &str, begin: usize) -> &str {
1039             // We can't use `lines.get(line_number+1)` because we might
1040             // be parsing when we call this function and thus the current
1041             // line is the last one we have line info for.
1042             let slice = &src[begin..];
1043             match slice.find('\n') {
1044                 Some(e) => &slice[..e],
1045                 None => slice
1046             }
1047         }
1048
1049         let begin = {
1050             let line = if let Some(line) = self.lines.get(line_number) {
1051                 line
1052             } else {
1053                 return None;
1054             };
1055             let begin: BytePos = *line - self.start_pos;
1056             begin.to_usize()
1057         };
1058
1059         if let Some(ref src) = self.src {
1060             Some(Cow::from(get_until_newline(src, begin)))
1061         } else if let Some(src) = self.external_src.borrow().get_source() {
1062             Some(Cow::Owned(String::from(get_until_newline(src, begin))))
1063         } else {
1064             None
1065         }
1066     }
1067
1068     pub fn is_real_file(&self) -> bool {
1069         self.name.is_real()
1070     }
1071
1072     pub fn is_imported(&self) -> bool {
1073         self.src.is_none()
1074     }
1075
1076     pub fn byte_length(&self) -> u32 {
1077         self.end_pos.0 - self.start_pos.0
1078     }
1079     pub fn count_lines(&self) -> usize {
1080         self.lines.len()
1081     }
1082
1083     /// Find the line containing the given position. The return value is the
1084     /// index into the `lines` array of this FileMap, not the 1-based line
1085     /// number. If the filemap is empty or the position is located before the
1086     /// first line, None is returned.
1087     pub fn lookup_line(&self, pos: BytePos) -> Option<usize> {
1088         if self.lines.len() == 0 {
1089             return None;
1090         }
1091
1092         let line_index = lookup_line(&self.lines[..], pos);
1093         assert!(line_index < self.lines.len() as isize);
1094         if line_index >= 0 {
1095             Some(line_index as usize)
1096         } else {
1097             None
1098         }
1099     }
1100
1101     pub fn line_bounds(&self, line_index: usize) -> (BytePos, BytePos) {
1102         if self.start_pos == self.end_pos {
1103             return (self.start_pos, self.end_pos);
1104         }
1105
1106         assert!(line_index < self.lines.len());
1107         if line_index == (self.lines.len() - 1) {
1108             (self.lines[line_index], self.end_pos)
1109         } else {
1110             (self.lines[line_index], self.lines[line_index + 1])
1111         }
1112     }
1113
1114     #[inline]
1115     pub fn contains(&self, byte_pos: BytePos) -> bool {
1116         byte_pos >= self.start_pos && byte_pos <= self.end_pos
1117     }
1118 }
1119
1120 /// Remove utf-8 BOM if any.
1121 fn remove_bom(src: &mut String) {
1122     if src.starts_with("\u{feff}") {
1123         src.drain(..3);
1124     }
1125 }
1126
1127 // _____________________________________________________________________________
1128 // Pos, BytePos, CharPos
1129 //
1130
1131 pub trait Pos {
1132     fn from_usize(n: usize) -> Self;
1133     fn to_usize(&self) -> usize;
1134     fn from_u32(n: u32) -> Self;
1135     fn to_u32(&self) -> u32;
1136 }
1137
1138 /// A byte offset. Keep this small (currently 32-bits), as AST contains
1139 /// a lot of them.
1140 #[derive(Clone, Copy, PartialEq, Eq, Hash, PartialOrd, Ord, Debug)]
1141 pub struct BytePos(pub u32);
1142
1143 /// A character offset. Because of multibyte utf8 characters, a byte offset
1144 /// is not equivalent to a character offset. The CodeMap will convert BytePos
1145 /// values to CharPos values as necessary.
1146 #[derive(Copy, Clone, PartialEq, Eq, Hash, PartialOrd, Ord, Debug)]
1147 pub struct CharPos(pub usize);
1148
1149 // FIXME: Lots of boilerplate in these impls, but so far my attempts to fix
1150 // have been unsuccessful
1151
1152 impl Pos for BytePos {
1153     #[inline(always)]
1154     fn from_usize(n: usize) -> BytePos { BytePos(n as u32) }
1155
1156     #[inline(always)]
1157     fn to_usize(&self) -> usize { self.0 as usize }
1158
1159     #[inline(always)]
1160     fn from_u32(n: u32) -> BytePos { BytePos(n) }
1161
1162     #[inline(always)]
1163     fn to_u32(&self) -> u32 { self.0 }
1164 }
1165
1166 impl Add for BytePos {
1167     type Output = BytePos;
1168
1169     #[inline(always)]
1170     fn add(self, rhs: BytePos) -> BytePos {
1171         BytePos((self.to_usize() + rhs.to_usize()) as u32)
1172     }
1173 }
1174
1175 impl Sub for BytePos {
1176     type Output = BytePos;
1177
1178     #[inline(always)]
1179     fn sub(self, rhs: BytePos) -> BytePos {
1180         BytePos((self.to_usize() - rhs.to_usize()) as u32)
1181     }
1182 }
1183
1184 impl Encodable for BytePos {
1185     fn encode<S: Encoder>(&self, s: &mut S) -> Result<(), S::Error> {
1186         s.emit_u32(self.0)
1187     }
1188 }
1189
1190 impl Decodable for BytePos {
1191     fn decode<D: Decoder>(d: &mut D) -> Result<BytePos, D::Error> {
1192         Ok(BytePos(d.read_u32()?))
1193     }
1194 }
1195
1196 impl Pos for CharPos {
1197     #[inline(always)]
1198     fn from_usize(n: usize) -> CharPos { CharPos(n) }
1199
1200     #[inline(always)]
1201     fn to_usize(&self) -> usize { self.0 }
1202
1203     #[inline(always)]
1204     fn from_u32(n: u32) -> CharPos { CharPos(n as usize) }
1205
1206     #[inline(always)]
1207     fn to_u32(&self) -> u32 { self.0 as u32}
1208 }
1209
1210 impl Add for CharPos {
1211     type Output = CharPos;
1212
1213     #[inline(always)]
1214     fn add(self, rhs: CharPos) -> CharPos {
1215         CharPos(self.to_usize() + rhs.to_usize())
1216     }
1217 }
1218
1219 impl Sub for CharPos {
1220     type Output = CharPos;
1221
1222     #[inline(always)]
1223     fn sub(self, rhs: CharPos) -> CharPos {
1224         CharPos(self.to_usize() - rhs.to_usize())
1225     }
1226 }
1227
1228 // _____________________________________________________________________________
1229 // Loc, LocWithOpt, FileMapAndLine, FileMapAndBytePos
1230 //
1231
1232 /// A source code location used for error reporting
1233 #[derive(Debug, Clone)]
1234 pub struct Loc {
1235     /// Information about the original source
1236     pub file: Lrc<FileMap>,
1237     /// The (1-based) line number
1238     pub line: usize,
1239     /// The (0-based) column offset
1240     pub col: CharPos,
1241     /// The (0-based) column offset when displayed
1242     pub col_display: usize,
1243 }
1244
1245 /// A source code location used as the result of lookup_char_pos_adj
1246 // Actually, *none* of the clients use the filename *or* file field;
1247 // perhaps they should just be removed.
1248 #[derive(Debug)]
1249 pub struct LocWithOpt {
1250     pub filename: FileName,
1251     pub line: usize,
1252     pub col: CharPos,
1253     pub file: Option<Lrc<FileMap>>,
1254 }
1255
1256 // used to be structural records. Better names, anyone?
1257 #[derive(Debug)]
1258 pub struct FileMapAndLine { pub fm: Lrc<FileMap>, pub line: usize }
1259 #[derive(Debug)]
1260 pub struct FileMapAndBytePos { pub fm: Lrc<FileMap>, pub pos: BytePos }
1261
1262 #[derive(Copy, Clone, Debug, PartialEq, Eq)]
1263 pub struct LineInfo {
1264     /// Index of line, starting from 0.
1265     pub line_index: usize,
1266
1267     /// Column in line where span begins, starting from 0.
1268     pub start_col: CharPos,
1269
1270     /// Column in line where span ends, starting from 0, exclusive.
1271     pub end_col: CharPos,
1272 }
1273
1274 pub struct FileLines {
1275     pub file: Lrc<FileMap>,
1276     pub lines: Vec<LineInfo>
1277 }
1278
1279 thread_local!(pub static SPAN_DEBUG: Cell<fn(Span, &mut fmt::Formatter) -> fmt::Result> =
1280                 Cell::new(default_span_debug));
1281
1282 #[derive(Debug)]
1283 pub struct MacroBacktrace {
1284     /// span where macro was applied to generate this code
1285     pub call_site: Span,
1286
1287     /// name of macro that was applied (e.g., "foo!" or "#[derive(Eq)]")
1288     pub macro_decl_name: String,
1289
1290     /// span where macro was defined (if known)
1291     pub def_site_span: Option<Span>,
1292 }
1293
1294 // _____________________________________________________________________________
1295 // SpanLinesError, SpanSnippetError, DistinctSources, MalformedCodemapPositions
1296 //
1297
1298 pub type FileLinesResult = Result<FileLines, SpanLinesError>;
1299
1300 #[derive(Clone, PartialEq, Eq, Debug)]
1301 pub enum SpanLinesError {
1302     IllFormedSpan(Span),
1303     DistinctSources(DistinctSources),
1304 }
1305
1306 #[derive(Clone, PartialEq, Eq, Debug)]
1307 pub enum SpanSnippetError {
1308     IllFormedSpan(Span),
1309     DistinctSources(DistinctSources),
1310     MalformedForCodemap(MalformedCodemapPositions),
1311     SourceNotAvailable { filename: FileName }
1312 }
1313
1314 #[derive(Clone, PartialEq, Eq, Debug)]
1315 pub struct DistinctSources {
1316     pub begin: (FileName, BytePos),
1317     pub end: (FileName, BytePos)
1318 }
1319
1320 #[derive(Clone, PartialEq, Eq, Debug)]
1321 pub struct MalformedCodemapPositions {
1322     pub name: FileName,
1323     pub source_len: usize,
1324     pub begin_pos: BytePos,
1325     pub end_pos: BytePos
1326 }
1327
1328 // Given a slice of line start positions and a position, returns the index of
1329 // the line the position is on. Returns -1 if the position is located before
1330 // the first line.
1331 fn lookup_line(lines: &[BytePos], pos: BytePos) -> isize {
1332     match lines.binary_search(&pos) {
1333         Ok(line) => line as isize,
1334         Err(line) => line as isize - 1
1335     }
1336 }
1337
1338 #[cfg(test)]
1339 mod tests {
1340     use super::{lookup_line, BytePos};
1341
1342     #[test]
1343     fn test_lookup_line() {
1344
1345         let lines = &[BytePos(3), BytePos(17), BytePos(28)];
1346
1347         assert_eq!(lookup_line(lines, BytePos(0)), -1);
1348         assert_eq!(lookup_line(lines, BytePos(3)),  0);
1349         assert_eq!(lookup_line(lines, BytePos(4)),  0);
1350
1351         assert_eq!(lookup_line(lines, BytePos(16)), 0);
1352         assert_eq!(lookup_line(lines, BytePos(17)), 1);
1353         assert_eq!(lookup_line(lines, BytePos(18)), 1);
1354
1355         assert_eq!(lookup_line(lines, BytePos(28)), 2);
1356         assert_eq!(lookup_line(lines, BytePos(29)), 2);
1357     }
1358 }