]> git.lizzy.rs Git - rust.git/blob - compiler/rustc_builtin_macros/src/format.rs
Auto merge of #88835 - FabianWolff:issue-88770, r=petrochenkov
[rust.git] / compiler / rustc_builtin_macros / src / format.rs
1 use ArgumentType::*;
2 use Position::*;
3
4 use rustc_ast as ast;
5 use rustc_ast::ptr::P;
6 use rustc_ast::tokenstream::TokenStream;
7 use rustc_ast::{token, BlockCheckMode, UnsafeSource};
8 use rustc_data_structures::fx::{FxHashMap, FxHashSet};
9 use rustc_errors::{pluralize, Applicability, DiagnosticBuilder};
10 use rustc_expand::base::{self, *};
11 use rustc_parse_format as parse;
12 use rustc_span::symbol::{sym, Ident, Symbol};
13 use rustc_span::{MultiSpan, Span};
14
15 use std::borrow::Cow;
16 use std::collections::hash_map::Entry;
17
18 #[derive(PartialEq)]
19 enum ArgumentType {
20     Placeholder(&'static str),
21     Count,
22 }
23
24 enum Position {
25     Exact(usize),
26     Named(Symbol),
27 }
28
29 struct Context<'a, 'b> {
30     ecx: &'a mut ExtCtxt<'b>,
31     /// The macro's call site. References to unstable formatting internals must
32     /// use this span to pass the stability checker.
33     macsp: Span,
34     /// The span of the format string literal.
35     fmtsp: Span,
36
37     /// List of parsed argument expressions.
38     /// Named expressions are resolved early, and are appended to the end of
39     /// argument expressions.
40     ///
41     /// Example showing the various data structures in motion:
42     ///
43     /// * Original: `"{foo:o} {:o} {foo:x} {0:x} {1:o} {:x} {1:x} {0:o}"`
44     /// * Implicit argument resolution: `"{foo:o} {0:o} {foo:x} {0:x} {1:o} {1:x} {1:x} {0:o}"`
45     /// * Name resolution: `"{2:o} {0:o} {2:x} {0:x} {1:o} {1:x} {1:x} {0:o}"`
46     /// * `arg_types` (in JSON): `[[0, 1, 0], [0, 1, 1], [0, 1]]`
47     /// * `arg_unique_types` (in simplified JSON): `[["o", "x"], ["o", "x"], ["o", "x"]]`
48     /// * `names` (in JSON): `{"foo": 2}`
49     args: Vec<P<ast::Expr>>,
50     /// Placeholder slot numbers indexed by argument.
51     arg_types: Vec<Vec<usize>>,
52     /// Unique format specs seen for each argument.
53     arg_unique_types: Vec<Vec<ArgumentType>>,
54     /// Map from named arguments to their resolved indices.
55     names: FxHashMap<Symbol, usize>,
56
57     /// The latest consecutive literal strings, or empty if there weren't any.
58     literal: String,
59
60     /// Collection of the compiled `rt::Argument` structures
61     pieces: Vec<P<ast::Expr>>,
62     /// Collection of string literals
63     str_pieces: Vec<P<ast::Expr>>,
64     /// Stays `true` if all formatting parameters are default (as in "{}{}").
65     all_pieces_simple: bool,
66
67     /// Mapping between positional argument references and indices into the
68     /// final generated static argument array. We record the starting indices
69     /// corresponding to each positional argument, and number of references
70     /// consumed so far for each argument, to facilitate correct `Position`
71     /// mapping in `build_piece`. In effect this can be seen as a "flattened"
72     /// version of `arg_unique_types`.
73     ///
74     /// Again with the example described above in docstring for `args`:
75     ///
76     /// * `arg_index_map` (in JSON): `[[0, 1, 0], [2, 3, 3], [4, 5]]`
77     arg_index_map: Vec<Vec<usize>>,
78
79     /// Starting offset of count argument slots.
80     count_args_index_offset: usize,
81
82     /// Count argument slots and tracking data structures.
83     /// Count arguments are separately tracked for de-duplication in case
84     /// multiple references are made to one argument. For example, in this
85     /// format string:
86     ///
87     /// * Original: `"{:.*} {:.foo$} {1:.*} {:.0$}"`
88     /// * Implicit argument resolution: `"{1:.0$} {2:.foo$} {1:.3$} {4:.0$}"`
89     /// * Name resolution: `"{1:.0$} {2:.5$} {1:.3$} {4:.0$}"`
90     /// * `count_positions` (in JSON): `{0: 0, 5: 1, 3: 2}`
91     /// * `count_args`: `vec![Exact(0), Exact(5), Exact(3)]`
92     count_args: Vec<Position>,
93     /// Relative slot numbers for count arguments.
94     count_positions: FxHashMap<usize, usize>,
95     /// Number of count slots assigned.
96     count_positions_count: usize,
97
98     /// Current position of the implicit positional arg pointer, as if it
99     /// still existed in this phase of processing.
100     /// Used only for `all_pieces_simple` tracking in `build_piece`.
101     curarg: usize,
102     /// Current piece being evaluated, used for error reporting.
103     curpiece: usize,
104     /// Keep track of invalid references to positional arguments.
105     invalid_refs: Vec<(usize, usize)>,
106     /// Spans of all the formatting arguments, in order.
107     arg_spans: Vec<Span>,
108     /// All the formatting arguments that have formatting flags set, in order for diagnostics.
109     arg_with_formatting: Vec<parse::FormatSpec<'a>>,
110
111     /// Whether this format string came from a string literal, as opposed to a macro.
112     is_literal: bool,
113 }
114
115 /// Parses the arguments from the given list of tokens, returning the diagnostic
116 /// if there's a parse error so we can continue parsing other format!
117 /// expressions.
118 ///
119 /// If parsing succeeds, the return value is:
120 ///
121 /// ```text
122 /// Some((fmtstr, parsed arguments, index map for named arguments))
123 /// ```
124 fn parse_args<'a>(
125     ecx: &mut ExtCtxt<'a>,
126     sp: Span,
127     tts: TokenStream,
128 ) -> Result<(P<ast::Expr>, Vec<P<ast::Expr>>, FxHashMap<Symbol, usize>), DiagnosticBuilder<'a>> {
129     let mut args = Vec::<P<ast::Expr>>::new();
130     let mut names = FxHashMap::<Symbol, usize>::default();
131
132     let mut p = ecx.new_parser_from_tts(tts);
133
134     if p.token == token::Eof {
135         return Err(ecx.struct_span_err(sp, "requires at least a format string argument"));
136     }
137
138     let first_token = &p.token;
139     let fmtstr = match first_token.kind {
140         token::TokenKind::Literal(token::Lit {
141             kind: token::LitKind::Str | token::LitKind::StrRaw(_),
142             ..
143         }) => {
144             // If the first token is a string literal, then a format expression
145             // is constructed from it.
146             //
147             // This allows us to properly handle cases when the first comma
148             // after the format string is mistakenly replaced with any operator,
149             // which cause the expression parser to eat too much tokens.
150             p.parse_literal_maybe_minus()?
151         }
152         _ => {
153             // Otherwise, we fall back to the expression parser.
154             p.parse_expr()?
155         }
156     };
157
158     let mut first = true;
159     let mut named = false;
160
161     while p.token != token::Eof {
162         if !p.eat(&token::Comma) {
163             if first {
164                 p.clear_expected_tokens();
165             }
166
167             match p.expect(&token::Comma) {
168                 Err(mut err) => {
169                     match token::TokenKind::Comma.similar_tokens() {
170                         Some(tks) if tks.contains(&p.token.kind) => {
171                             // If a similar token is found, then it may be a typo. We
172                             // consider it as a comma, and continue parsing.
173                             err.emit();
174                             p.bump();
175                         }
176                         // Otherwise stop the parsing and return the error.
177                         _ => return Err(err),
178                     }
179                 }
180                 Ok(recovered) => {
181                     assert!(recovered);
182                 }
183             }
184         }
185         first = false;
186         if p.token == token::Eof {
187             break;
188         } // accept trailing commas
189         match p.token.ident() {
190             Some((ident, _)) if p.look_ahead(1, |t| *t == token::Eq) => {
191                 named = true;
192                 p.bump();
193                 p.expect(&token::Eq)?;
194                 let e = p.parse_expr()?;
195                 if let Some(prev) = names.get(&ident.name) {
196                     ecx.struct_span_err(e.span, &format!("duplicate argument named `{}`", ident))
197                         .span_label(args[*prev].span, "previously here")
198                         .span_label(e.span, "duplicate argument")
199                         .emit();
200                     continue;
201                 }
202
203                 // Resolve names into slots early.
204                 // Since all the positional args are already seen at this point
205                 // if the input is valid, we can simply append to the positional
206                 // args. And remember the names.
207                 let slot = args.len();
208                 names.insert(ident.name, slot);
209                 args.push(e);
210             }
211             _ => {
212                 let e = p.parse_expr()?;
213                 if named {
214                     let mut err = ecx.struct_span_err(
215                         e.span,
216                         "positional arguments cannot follow named arguments",
217                     );
218                     err.span_label(e.span, "positional arguments must be before named arguments");
219                     for pos in names.values() {
220                         err.span_label(args[*pos].span, "named argument");
221                     }
222                     err.emit();
223                 }
224                 args.push(e);
225             }
226         }
227     }
228     Ok((fmtstr, args, names))
229 }
230
231 impl<'a, 'b> Context<'a, 'b> {
232     fn resolve_name_inplace(&self, p: &mut parse::Piece<'_>) {
233         // NOTE: the `unwrap_or` branch is needed in case of invalid format
234         // arguments, e.g., `format_args!("{foo}")`.
235         let lookup = |s: Symbol| *self.names.get(&s).unwrap_or(&0);
236
237         match *p {
238             parse::String(_) => {}
239             parse::NextArgument(ref mut arg) => {
240                 if let parse::ArgumentNamed(s) = arg.position {
241                     arg.position = parse::ArgumentIs(lookup(s));
242                 }
243                 if let parse::CountIsName(s) = arg.format.width {
244                     arg.format.width = parse::CountIsParam(lookup(s));
245                 }
246                 if let parse::CountIsName(s) = arg.format.precision {
247                     arg.format.precision = parse::CountIsParam(lookup(s));
248                 }
249             }
250         }
251     }
252
253     /// Verifies one piece of a parse string, and remembers it if valid.
254     /// All errors are not emitted as fatal so we can continue giving errors
255     /// about this and possibly other format strings.
256     fn verify_piece(&mut self, p: &parse::Piece<'_>) {
257         match *p {
258             parse::String(..) => {}
259             parse::NextArgument(ref arg) => {
260                 // width/precision first, if they have implicit positional
261                 // parameters it makes more sense to consume them first.
262                 self.verify_count(arg.format.width);
263                 self.verify_count(arg.format.precision);
264
265                 // argument second, if it's an implicit positional parameter
266                 // it's written second, so it should come after width/precision.
267                 let pos = match arg.position {
268                     parse::ArgumentIs(i) | parse::ArgumentImplicitlyIs(i) => Exact(i),
269                     parse::ArgumentNamed(s) => Named(s),
270                 };
271
272                 let ty = Placeholder(match arg.format.ty {
273                     "" => "Display",
274                     "?" => "Debug",
275                     "e" => "LowerExp",
276                     "E" => "UpperExp",
277                     "o" => "Octal",
278                     "p" => "Pointer",
279                     "b" => "Binary",
280                     "x" => "LowerHex",
281                     "X" => "UpperHex",
282                     _ => {
283                         let fmtsp = self.fmtsp;
284                         let sp = arg.format.ty_span.map(|sp| fmtsp.from_inner(sp));
285                         let mut err = self.ecx.struct_span_err(
286                             sp.unwrap_or(fmtsp),
287                             &format!("unknown format trait `{}`", arg.format.ty),
288                         );
289                         err.note(
290                             "the only appropriate formatting traits are:\n\
291                                 - ``, which uses the `Display` trait\n\
292                                 - `?`, which uses the `Debug` trait\n\
293                                 - `e`, which uses the `LowerExp` trait\n\
294                                 - `E`, which uses the `UpperExp` trait\n\
295                                 - `o`, which uses the `Octal` trait\n\
296                                 - `p`, which uses the `Pointer` trait\n\
297                                 - `b`, which uses the `Binary` trait\n\
298                                 - `x`, which uses the `LowerHex` trait\n\
299                                 - `X`, which uses the `UpperHex` trait",
300                         );
301                         if let Some(sp) = sp {
302                             for (fmt, name) in &[
303                                 ("", "Display"),
304                                 ("?", "Debug"),
305                                 ("e", "LowerExp"),
306                                 ("E", "UpperExp"),
307                                 ("o", "Octal"),
308                                 ("p", "Pointer"),
309                                 ("b", "Binary"),
310                                 ("x", "LowerHex"),
311                                 ("X", "UpperHex"),
312                             ] {
313                                 // FIXME: rustfix (`run-rustfix`) fails to apply suggestions.
314                                 // > "Cannot replace slice of data that was already replaced"
315                                 err.tool_only_span_suggestion(
316                                     sp,
317                                     &format!("use the `{}` trait", name),
318                                     (*fmt).to_string(),
319                                     Applicability::MaybeIncorrect,
320                                 );
321                             }
322                         }
323                         err.emit();
324                         "<invalid>"
325                     }
326                 });
327                 self.verify_arg_type(pos, ty);
328                 self.curpiece += 1;
329             }
330         }
331     }
332
333     fn verify_count(&mut self, c: parse::Count) {
334         match c {
335             parse::CountImplied | parse::CountIs(..) => {}
336             parse::CountIsParam(i) => {
337                 self.verify_arg_type(Exact(i), Count);
338             }
339             parse::CountIsName(s) => {
340                 self.verify_arg_type(Named(s), Count);
341             }
342         }
343     }
344
345     fn describe_num_args(&self) -> Cow<'_, str> {
346         match self.args.len() {
347             0 => "no arguments were given".into(),
348             1 => "there is 1 argument".into(),
349             x => format!("there are {} arguments", x).into(),
350         }
351     }
352
353     /// Handle invalid references to positional arguments. Output different
354     /// errors for the case where all arguments are positional and for when
355     /// there are named arguments or numbered positional arguments in the
356     /// format string.
357     fn report_invalid_references(&self, numbered_position_args: bool) {
358         let mut e;
359         let sp = if !self.arg_spans.is_empty() {
360             // Point at the formatting arguments.
361             MultiSpan::from_spans(self.arg_spans.clone())
362         } else {
363             MultiSpan::from_span(self.fmtsp)
364         };
365         let refs =
366             self.invalid_refs.iter().map(|(r, pos)| (r.to_string(), self.arg_spans.get(*pos)));
367
368         let mut zero_based_note = false;
369
370         let count = self.pieces.len()
371             + self.arg_with_formatting.iter().filter(|fmt| fmt.precision_span.is_some()).count();
372         if self.names.is_empty() && !numbered_position_args && count != self.args.len() {
373             e = self.ecx.struct_span_err(
374                 sp,
375                 &format!(
376                     "{} positional argument{} in format string, but {}",
377                     count,
378                     pluralize!(count),
379                     self.describe_num_args(),
380                 ),
381             );
382             for arg in &self.args {
383                 // Point at the arguments that will be formatted.
384                 e.span_label(arg.span, "");
385             }
386         } else {
387             let (mut refs, spans): (Vec<_>, Vec<_>) = refs.unzip();
388             // Avoid `invalid reference to positional arguments 7 and 7 (there is 1 argument)`
389             // for `println!("{7:7$}", 1);`
390             refs.sort();
391             refs.dedup();
392             let spans: Vec<_> = spans.into_iter().filter_map(|sp| sp.copied()).collect();
393             let sp = if self.arg_spans.is_empty() || spans.is_empty() {
394                 MultiSpan::from_span(self.fmtsp)
395             } else {
396                 MultiSpan::from_spans(spans)
397             };
398             let arg_list = if refs.len() == 1 {
399                 format!("argument {}", refs[0])
400             } else {
401                 let reg = refs.pop().unwrap();
402                 format!("arguments {head} and {tail}", head = refs.join(", "), tail = reg)
403             };
404
405             e = self.ecx.struct_span_err(
406                 sp,
407                 &format!(
408                     "invalid reference to positional {} ({})",
409                     arg_list,
410                     self.describe_num_args()
411                 ),
412             );
413             zero_based_note = true;
414         };
415
416         for fmt in &self.arg_with_formatting {
417             if let Some(span) = fmt.precision_span {
418                 let span = self.fmtsp.from_inner(span);
419                 match fmt.precision {
420                     parse::CountIsParam(pos) if pos > self.args.len() => {
421                         e.span_label(
422                             span,
423                             &format!(
424                                 "this precision flag expects an `usize` argument at position {}, \
425                              but {}",
426                                 pos,
427                                 self.describe_num_args(),
428                             ),
429                         );
430                         zero_based_note = true;
431                     }
432                     parse::CountIsParam(pos) => {
433                         let count = self.pieces.len()
434                             + self
435                                 .arg_with_formatting
436                                 .iter()
437                                 .filter(|fmt| fmt.precision_span.is_some())
438                                 .count();
439                         e.span_label(span, &format!(
440                             "this precision flag adds an extra required argument at position {}, \
441                              which is why there {} expected",
442                             pos,
443                             if count == 1 {
444                                 "is 1 argument".to_string()
445                             } else {
446                                 format!("are {} arguments", count)
447                             },
448                         ));
449                         if let Some(arg) = self.args.get(pos) {
450                             e.span_label(
451                                 arg.span,
452                                 "this parameter corresponds to the precision flag",
453                             );
454                         }
455                         zero_based_note = true;
456                     }
457                     _ => {}
458                 }
459             }
460             if let Some(span) = fmt.width_span {
461                 let span = self.fmtsp.from_inner(span);
462                 match fmt.width {
463                     parse::CountIsParam(pos) if pos > self.args.len() => {
464                         e.span_label(
465                             span,
466                             &format!(
467                                 "this width flag expects an `usize` argument at position {}, \
468                              but {}",
469                                 pos,
470                                 self.describe_num_args(),
471                             ),
472                         );
473                         zero_based_note = true;
474                     }
475                     _ => {}
476                 }
477             }
478         }
479         if zero_based_note {
480             e.note("positional arguments are zero-based");
481         }
482         if !self.arg_with_formatting.is_empty() {
483             e.note(
484                 "for information about formatting flags, visit \
485                     https://doc.rust-lang.org/std/fmt/index.html",
486             );
487         }
488
489         e.emit();
490     }
491
492     /// Actually verifies and tracks a given format placeholder
493     /// (a.k.a. argument).
494     fn verify_arg_type(&mut self, arg: Position, ty: ArgumentType) {
495         match arg {
496             Exact(arg) => {
497                 if self.args.len() <= arg {
498                     self.invalid_refs.push((arg, self.curpiece));
499                     return;
500                 }
501                 match ty {
502                     Placeholder(_) => {
503                         // record every (position, type) combination only once
504                         let seen_ty = &mut self.arg_unique_types[arg];
505                         let i = seen_ty.iter().position(|x| *x == ty).unwrap_or_else(|| {
506                             let i = seen_ty.len();
507                             seen_ty.push(ty);
508                             i
509                         });
510                         self.arg_types[arg].push(i);
511                     }
512                     Count => {
513                         if let Entry::Vacant(e) = self.count_positions.entry(arg) {
514                             let i = self.count_positions_count;
515                             e.insert(i);
516                             self.count_args.push(Exact(arg));
517                             self.count_positions_count += 1;
518                         }
519                     }
520                 }
521             }
522
523             Named(name) => {
524                 match self.names.get(&name) {
525                     Some(&idx) => {
526                         // Treat as positional arg.
527                         self.verify_arg_type(Exact(idx), ty)
528                     }
529                     None => {
530                         let capture_feature_enabled = self
531                             .ecx
532                             .ecfg
533                             .features
534                             .map_or(false, |features| features.format_args_capture);
535
536                         // For the moment capturing variables from format strings expanded from macros is
537                         // disabled (see RFC #2795)
538                         let can_capture = capture_feature_enabled && self.is_literal;
539
540                         if can_capture {
541                             // Treat this name as a variable to capture from the surrounding scope
542                             let idx = self.args.len();
543                             self.arg_types.push(Vec::new());
544                             self.arg_unique_types.push(Vec::new());
545                             let span = if self.is_literal {
546                                 *self.arg_spans.get(self.curpiece).unwrap_or(&self.fmtsp)
547                             } else {
548                                 self.fmtsp
549                             };
550                             self.args.push(self.ecx.expr_ident(span, Ident::new(name, span)));
551                             self.names.insert(name, idx);
552                             self.verify_arg_type(Exact(idx), ty)
553                         } else {
554                             let msg = format!("there is no argument named `{}`", name);
555                             let sp = if self.is_literal {
556                                 *self.arg_spans.get(self.curpiece).unwrap_or(&self.fmtsp)
557                             } else {
558                                 self.fmtsp
559                             };
560                             let mut err = self.ecx.struct_span_err(sp, &msg[..]);
561
562                             if capture_feature_enabled && !self.is_literal {
563                                 err.note(&format!(
564                                     "did you intend to capture a variable `{}` from \
565                                      the surrounding scope?",
566                                     name
567                                 ));
568                                 err.note(
569                                     "to avoid ambiguity, `format_args!` cannot capture variables \
570                                      when the format string is expanded from a macro",
571                                 );
572                             } else if self.ecx.parse_sess().unstable_features.is_nightly_build() {
573                                 err.help(&format!(
574                                     "if you intended to capture `{}` from the surrounding scope, add \
575                                      `#![feature(format_args_capture)]` to the crate attributes",
576                                     name
577                                 ));
578                             }
579
580                             err.emit();
581                         }
582                     }
583                 }
584             }
585         }
586     }
587
588     /// Builds the mapping between format placeholders and argument objects.
589     fn build_index_map(&mut self) {
590         // NOTE: Keep the ordering the same as `into_expr`'s expansion would do!
591         let args_len = self.args.len();
592         self.arg_index_map.reserve(args_len);
593
594         let mut sofar = 0usize;
595
596         // Map the arguments
597         for i in 0..args_len {
598             let arg_types = &self.arg_types[i];
599             let arg_offsets = arg_types.iter().map(|offset| sofar + *offset).collect::<Vec<_>>();
600             self.arg_index_map.push(arg_offsets);
601             sofar += self.arg_unique_types[i].len();
602         }
603
604         // Record starting index for counts, which appear just after arguments
605         self.count_args_index_offset = sofar;
606     }
607
608     fn rtpath(ecx: &ExtCtxt<'_>, s: Symbol) -> Vec<Ident> {
609         ecx.std_path(&[sym::fmt, sym::rt, sym::v1, s])
610     }
611
612     fn build_count(&self, c: parse::Count) -> P<ast::Expr> {
613         let sp = self.macsp;
614         let count = |c, arg| {
615             let mut path = Context::rtpath(self.ecx, sym::Count);
616             path.push(Ident::new(c, sp));
617             match arg {
618                 Some(arg) => self.ecx.expr_call_global(sp, path, vec![arg]),
619                 None => self.ecx.expr_path(self.ecx.path_global(sp, path)),
620             }
621         };
622         match c {
623             parse::CountIs(i) => count(sym::Is, Some(self.ecx.expr_usize(sp, i))),
624             parse::CountIsParam(i) => {
625                 // This needs mapping too, as `i` is referring to a macro
626                 // argument. If `i` is not found in `count_positions` then
627                 // the error had already been emitted elsewhere.
628                 let i = self.count_positions.get(&i).cloned().unwrap_or(0)
629                     + self.count_args_index_offset;
630                 count(sym::Param, Some(self.ecx.expr_usize(sp, i)))
631             }
632             parse::CountImplied => count(sym::Implied, None),
633             // should never be the case, names are already resolved
634             parse::CountIsName(_) => panic!("should never happen"),
635         }
636     }
637
638     /// Build a literal expression from the accumulated string literals
639     fn build_literal_string(&mut self) -> P<ast::Expr> {
640         let sp = self.fmtsp;
641         let s = Symbol::intern(&self.literal);
642         self.literal.clear();
643         self.ecx.expr_str(sp, s)
644     }
645
646     /// Builds a static `rt::Argument` from a `parse::Piece` or append
647     /// to the `literal` string.
648     fn build_piece(
649         &mut self,
650         piece: &parse::Piece<'a>,
651         arg_index_consumed: &mut Vec<usize>,
652     ) -> Option<P<ast::Expr>> {
653         let sp = self.macsp;
654         match *piece {
655             parse::String(s) => {
656                 self.literal.push_str(s);
657                 None
658             }
659             parse::NextArgument(ref arg) => {
660                 // Build the position
661                 let pos = {
662                     match arg.position {
663                         parse::ArgumentIs(i) | parse::ArgumentImplicitlyIs(i) => {
664                             // Map to index in final generated argument array
665                             // in case of multiple types specified
666                             let arg_idx = match arg_index_consumed.get_mut(i) {
667                                 None => 0, // error already emitted elsewhere
668                                 Some(offset) => {
669                                     let idx_map = &self.arg_index_map[i];
670                                     // unwrap_or branch: error already emitted elsewhere
671                                     let arg_idx = *idx_map.get(*offset).unwrap_or(&0);
672                                     *offset += 1;
673                                     arg_idx
674                                 }
675                             };
676                             self.ecx.expr_usize(sp, arg_idx)
677                         }
678
679                         // should never be the case, because names are already
680                         // resolved.
681                         parse::ArgumentNamed(_) => panic!("should never happen"),
682                     }
683                 };
684
685                 let simple_arg = parse::Argument {
686                     position: {
687                         // We don't have ArgumentNext any more, so we have to
688                         // track the current argument ourselves.
689                         let i = self.curarg;
690                         self.curarg += 1;
691                         parse::ArgumentIs(i)
692                     },
693                     format: parse::FormatSpec {
694                         fill: arg.format.fill,
695                         align: parse::AlignUnknown,
696                         flags: 0,
697                         precision: parse::CountImplied,
698                         precision_span: None,
699                         width: parse::CountImplied,
700                         width_span: None,
701                         ty: arg.format.ty,
702                         ty_span: arg.format.ty_span,
703                     },
704                 };
705
706                 let fill = arg.format.fill.unwrap_or(' ');
707
708                 let pos_simple = arg.position.index() == simple_arg.position.index();
709
710                 if arg.format.precision_span.is_some() || arg.format.width_span.is_some() {
711                     self.arg_with_formatting.push(arg.format);
712                 }
713                 if !pos_simple || arg.format != simple_arg.format || fill != ' ' {
714                     self.all_pieces_simple = false;
715                 }
716
717                 // Build the format
718                 let fill = self.ecx.expr_lit(sp, ast::LitKind::Char(fill));
719                 let align = |name| {
720                     let mut p = Context::rtpath(self.ecx, sym::Alignment);
721                     p.push(Ident::new(name, sp));
722                     self.ecx.path_global(sp, p)
723                 };
724                 let align = match arg.format.align {
725                     parse::AlignLeft => align(sym::Left),
726                     parse::AlignRight => align(sym::Right),
727                     parse::AlignCenter => align(sym::Center),
728                     parse::AlignUnknown => align(sym::Unknown),
729                 };
730                 let align = self.ecx.expr_path(align);
731                 let flags = self.ecx.expr_u32(sp, arg.format.flags);
732                 let prec = self.build_count(arg.format.precision);
733                 let width = self.build_count(arg.format.width);
734                 let path = self.ecx.path_global(sp, Context::rtpath(self.ecx, sym::FormatSpec));
735                 let fmt = self.ecx.expr_struct(
736                     sp,
737                     path,
738                     vec![
739                         self.ecx.field_imm(sp, Ident::new(sym::fill, sp), fill),
740                         self.ecx.field_imm(sp, Ident::new(sym::align, sp), align),
741                         self.ecx.field_imm(sp, Ident::new(sym::flags, sp), flags),
742                         self.ecx.field_imm(sp, Ident::new(sym::precision, sp), prec),
743                         self.ecx.field_imm(sp, Ident::new(sym::width, sp), width),
744                     ],
745                 );
746
747                 let path = self.ecx.path_global(sp, Context::rtpath(self.ecx, sym::Argument));
748                 Some(self.ecx.expr_struct(
749                     sp,
750                     path,
751                     vec![
752                         self.ecx.field_imm(sp, Ident::new(sym::position, sp), pos),
753                         self.ecx.field_imm(sp, Ident::new(sym::format, sp), fmt),
754                     ],
755                 ))
756             }
757         }
758     }
759
760     /// Actually builds the expression which the format_args! block will be
761     /// expanded to.
762     fn into_expr(self) -> P<ast::Expr> {
763         let mut locals =
764             Vec::with_capacity((0..self.args.len()).map(|i| self.arg_unique_types[i].len()).sum());
765         let mut counts = Vec::with_capacity(self.count_args.len());
766         let mut pats = Vec::with_capacity(self.args.len());
767         let mut heads = Vec::with_capacity(self.args.len());
768
769         let names_pos: Vec<_> = (0..self.args.len())
770             .map(|i| Ident::from_str_and_span(&format!("arg{}", i), self.macsp))
771             .collect();
772
773         // First, build up the static array which will become our precompiled
774         // format "string"
775         let pieces = self.ecx.expr_vec_slice(self.fmtsp, self.str_pieces);
776
777         // Before consuming the expressions, we have to remember spans for
778         // count arguments as they are now generated separate from other
779         // arguments, hence have no access to the `P<ast::Expr>`'s.
780         let spans_pos: Vec<_> = self.args.iter().map(|e| e.span).collect();
781
782         // Right now there is a bug such that for the expression:
783         //      foo(bar(&1))
784         // the lifetime of `1` doesn't outlast the call to `bar`, so it's not
785         // valid for the call to `foo`. To work around this all arguments to the
786         // format! string are shoved into locals. Furthermore, we shove the address
787         // of each variable because we don't want to move out of the arguments
788         // passed to this function.
789         for (i, e) in self.args.into_iter().enumerate() {
790             let name = names_pos[i];
791             let span = self.ecx.with_def_site_ctxt(e.span);
792             pats.push(self.ecx.pat_ident(span, name));
793             for arg_ty in self.arg_unique_types[i].iter() {
794                 locals.push(Context::format_arg(self.ecx, self.macsp, e.span, arg_ty, name));
795             }
796             heads.push(self.ecx.expr_addr_of(e.span, e));
797         }
798         for pos in self.count_args {
799             let index = match pos {
800                 Exact(i) => i,
801                 _ => panic!("should never happen"),
802             };
803             let name = names_pos[index];
804             let span = spans_pos[index];
805             counts.push(Context::format_arg(self.ecx, self.macsp, span, &Count, name));
806         }
807
808         // Now create a vector containing all the arguments
809         let args = locals.into_iter().chain(counts.into_iter());
810
811         let args_array = self.ecx.expr_vec(self.macsp, args.collect());
812
813         // Constructs an AST equivalent to:
814         //
815         //      match (&arg0, &arg1) {
816         //          (tmp0, tmp1) => args_array
817         //      }
818         //
819         // It was:
820         //
821         //      let tmp0 = &arg0;
822         //      let tmp1 = &arg1;
823         //      args_array
824         //
825         // Because of #11585 the new temporary lifetime rule, the enclosing
826         // statements for these temporaries become the let's themselves.
827         // If one or more of them are RefCell's, RefCell borrow() will also
828         // end there; they don't last long enough for args_array to use them.
829         // The match expression solves the scope problem.
830         //
831         // Note, it may also very well be transformed to:
832         //
833         //      match arg0 {
834         //          ref tmp0 => {
835         //              match arg1 => {
836         //                  ref tmp1 => args_array } } }
837         //
838         // But the nested match expression is proved to perform not as well
839         // as series of let's; the first approach does.
840         let args_match = {
841             let pat = self.ecx.pat_tuple(self.macsp, pats);
842             let arm = self.ecx.arm(self.macsp, pat, args_array);
843             let head = self.ecx.expr(self.macsp, ast::ExprKind::Tup(heads));
844             self.ecx.expr_match(self.macsp, head, vec![arm])
845         };
846
847         let args_slice = self.ecx.expr_addr_of(self.macsp, args_match);
848
849         // Now create the fmt::Arguments struct with all our locals we created.
850         let (fn_name, fn_args) = if self.all_pieces_simple {
851             ("new_v1", vec![pieces, args_slice])
852         } else {
853             // Build up the static array which will store our precompiled
854             // nonstandard placeholders, if there are any.
855             let fmt = self.ecx.expr_vec_slice(self.macsp, self.pieces);
856
857             let path = self.ecx.std_path(&[sym::fmt, sym::UnsafeArg, sym::new]);
858             let unsafe_arg = self.ecx.expr_call_global(self.macsp, path, Vec::new());
859             let unsafe_expr = self.ecx.expr_block(P(ast::Block {
860                 stmts: vec![self.ecx.stmt_expr(unsafe_arg)],
861                 id: ast::DUMMY_NODE_ID,
862                 rules: BlockCheckMode::Unsafe(UnsafeSource::CompilerGenerated),
863                 span: self.macsp,
864                 tokens: None,
865                 could_be_bare_literal: false,
866             }));
867
868             ("new_v1_formatted", vec![pieces, args_slice, fmt, unsafe_expr])
869         };
870
871         let path = self.ecx.std_path(&[sym::fmt, sym::Arguments, Symbol::intern(fn_name)]);
872         self.ecx.expr_call_global(self.macsp, path, fn_args)
873     }
874
875     fn format_arg(
876         ecx: &ExtCtxt<'_>,
877         macsp: Span,
878         mut sp: Span,
879         ty: &ArgumentType,
880         arg: Ident,
881     ) -> P<ast::Expr> {
882         sp = ecx.with_def_site_ctxt(sp);
883         let arg = ecx.expr_ident(sp, arg);
884         let trait_ = match *ty {
885             Placeholder(trait_) if trait_ == "<invalid>" => return DummyResult::raw_expr(sp, true),
886             Placeholder(trait_) => trait_,
887             Count => {
888                 let path = ecx.std_path(&[sym::fmt, sym::ArgumentV1, sym::from_usize]);
889                 return ecx.expr_call_global(macsp, path, vec![arg]);
890             }
891         };
892
893         let path = ecx.std_path(&[sym::fmt, Symbol::intern(trait_), sym::fmt]);
894         let format_fn = ecx.path_global(sp, path);
895         let path = ecx.std_path(&[sym::fmt, sym::ArgumentV1, sym::new]);
896         ecx.expr_call_global(macsp, path, vec![arg, ecx.expr_path(format_fn)])
897     }
898 }
899
900 fn expand_format_args_impl<'cx>(
901     ecx: &'cx mut ExtCtxt<'_>,
902     mut sp: Span,
903     tts: TokenStream,
904     nl: bool,
905 ) -> Box<dyn base::MacResult + 'cx> {
906     sp = ecx.with_def_site_ctxt(sp);
907     match parse_args(ecx, sp, tts) {
908         Ok((efmt, args, names)) => {
909             MacEager::expr(expand_preparsed_format_args(ecx, sp, efmt, args, names, nl))
910         }
911         Err(mut err) => {
912             err.emit();
913             DummyResult::any(sp)
914         }
915     }
916 }
917
918 pub fn expand_format_args<'cx>(
919     ecx: &'cx mut ExtCtxt<'_>,
920     sp: Span,
921     tts: TokenStream,
922 ) -> Box<dyn base::MacResult + 'cx> {
923     expand_format_args_impl(ecx, sp, tts, false)
924 }
925
926 pub fn expand_format_args_nl<'cx>(
927     ecx: &'cx mut ExtCtxt<'_>,
928     sp: Span,
929     tts: TokenStream,
930 ) -> Box<dyn base::MacResult + 'cx> {
931     expand_format_args_impl(ecx, sp, tts, true)
932 }
933
934 /// Take the various parts of `format_args!(efmt, args..., name=names...)`
935 /// and construct the appropriate formatting expression.
936 pub fn expand_preparsed_format_args(
937     ecx: &mut ExtCtxt<'_>,
938     sp: Span,
939     efmt: P<ast::Expr>,
940     args: Vec<P<ast::Expr>>,
941     names: FxHashMap<Symbol, usize>,
942     append_newline: bool,
943 ) -> P<ast::Expr> {
944     // NOTE: this verbose way of initializing `Vec<Vec<ArgumentType>>` is because
945     // `ArgumentType` does not derive `Clone`.
946     let arg_types: Vec<_> = (0..args.len()).map(|_| Vec::new()).collect();
947     let arg_unique_types: Vec<_> = (0..args.len()).map(|_| Vec::new()).collect();
948
949     let mut macsp = ecx.call_site();
950     macsp = ecx.with_def_site_ctxt(macsp);
951
952     let msg = "format argument must be a string literal";
953     let fmt_sp = efmt.span;
954     let efmt_kind_is_lit: bool = matches!(efmt.kind, ast::ExprKind::Lit(_));
955     let (fmt_str, fmt_style, fmt_span) = match expr_to_spanned_string(ecx, efmt, msg) {
956         Ok(mut fmt) if append_newline => {
957             fmt.0 = Symbol::intern(&format!("{}\n", fmt.0));
958             fmt
959         }
960         Ok(fmt) => fmt,
961         Err(err) => {
962             if let Some((mut err, suggested)) = err {
963                 let sugg_fmt = match args.len() {
964                     0 => "{}".to_string(),
965                     _ => format!("{}{{}}", "{} ".repeat(args.len())),
966                 };
967                 if !suggested {
968                     err.span_suggestion(
969                         fmt_sp.shrink_to_lo(),
970                         "you might be missing a string literal to format with",
971                         format!("\"{}\", ", sugg_fmt),
972                         Applicability::MaybeIncorrect,
973                     );
974                 }
975                 err.emit();
976             }
977             return DummyResult::raw_expr(sp, true);
978         }
979     };
980
981     let str_style = match fmt_style {
982         ast::StrStyle::Cooked => None,
983         ast::StrStyle::Raw(raw) => Some(raw as usize),
984     };
985
986     let fmt_str = &fmt_str.as_str(); // for the suggestions below
987     let fmt_snippet = ecx.source_map().span_to_snippet(fmt_sp).ok();
988     let mut parser = parse::Parser::new(
989         fmt_str,
990         str_style,
991         fmt_snippet,
992         append_newline,
993         parse::ParseMode::Format,
994     );
995
996     let mut unverified_pieces = Vec::new();
997     while let Some(piece) = parser.next() {
998         if !parser.errors.is_empty() {
999             break;
1000         } else {
1001             unverified_pieces.push(piece);
1002         }
1003     }
1004
1005     if !parser.errors.is_empty() {
1006         let err = parser.errors.remove(0);
1007         let sp = if efmt_kind_is_lit {
1008             fmt_span.from_inner(err.span)
1009         } else {
1010             // The format string could be another macro invocation, e.g.:
1011             //     format!(concat!("abc", "{}"), 4);
1012             // However, `err.span` is an inner span relative to the *result* of
1013             // the macro invocation, which is why we would get a nonsensical
1014             // result calling `fmt_span.from_inner(err.span)` as above, and
1015             // might even end up inside a multibyte character (issue #86085).
1016             // Therefore, we conservatively report the error for the entire
1017             // argument span here.
1018             fmt_span
1019         };
1020         let mut e = ecx.struct_span_err(sp, &format!("invalid format string: {}", err.description));
1021         e.span_label(sp, err.label + " in format string");
1022         if let Some(note) = err.note {
1023             e.note(&note);
1024         }
1025         if let Some((label, span)) = err.secondary_label {
1026             let sp = fmt_span.from_inner(span);
1027             e.span_label(sp, label);
1028         }
1029         e.emit();
1030         return DummyResult::raw_expr(sp, true);
1031     }
1032
1033     let arg_spans = parser.arg_places.iter().map(|span| fmt_span.from_inner(*span)).collect();
1034
1035     let named_pos: FxHashSet<usize> = names.values().cloned().collect();
1036
1037     let mut cx = Context {
1038         ecx,
1039         args,
1040         arg_types,
1041         arg_unique_types,
1042         names,
1043         curarg: 0,
1044         curpiece: 0,
1045         arg_index_map: Vec::new(),
1046         count_args: Vec::new(),
1047         count_positions: FxHashMap::default(),
1048         count_positions_count: 0,
1049         count_args_index_offset: 0,
1050         literal: String::new(),
1051         pieces: Vec::with_capacity(unverified_pieces.len()),
1052         str_pieces: Vec::with_capacity(unverified_pieces.len()),
1053         all_pieces_simple: true,
1054         macsp,
1055         fmtsp: fmt_span,
1056         invalid_refs: Vec::new(),
1057         arg_spans,
1058         arg_with_formatting: Vec::new(),
1059         is_literal: parser.is_literal,
1060     };
1061
1062     // This needs to happen *after* the Parser has consumed all pieces to create all the spans
1063     let pieces = unverified_pieces
1064         .into_iter()
1065         .map(|mut piece| {
1066             cx.verify_piece(&piece);
1067             cx.resolve_name_inplace(&mut piece);
1068             piece
1069         })
1070         .collect::<Vec<_>>();
1071
1072     let numbered_position_args = pieces.iter().any(|arg: &parse::Piece<'_>| match *arg {
1073         parse::String(_) => false,
1074         parse::NextArgument(arg) => matches!(arg.position, parse::Position::ArgumentIs(_)),
1075     });
1076
1077     cx.build_index_map();
1078
1079     let mut arg_index_consumed = vec![0usize; cx.arg_index_map.len()];
1080
1081     for piece in pieces {
1082         if let Some(piece) = cx.build_piece(&piece, &mut arg_index_consumed) {
1083             let s = cx.build_literal_string();
1084             cx.str_pieces.push(s);
1085             cx.pieces.push(piece);
1086         }
1087     }
1088
1089     if !cx.literal.is_empty() {
1090         let s = cx.build_literal_string();
1091         cx.str_pieces.push(s);
1092     }
1093
1094     if !cx.invalid_refs.is_empty() {
1095         cx.report_invalid_references(numbered_position_args);
1096     }
1097
1098     // Make sure that all arguments were used and all arguments have types.
1099     let errs = cx
1100         .arg_types
1101         .iter()
1102         .enumerate()
1103         .filter(|(i, ty)| ty.is_empty() && !cx.count_positions.contains_key(&i))
1104         .map(|(i, _)| {
1105             let msg = if named_pos.contains(&i) {
1106                 // named argument
1107                 "named argument never used"
1108             } else {
1109                 // positional argument
1110                 "argument never used"
1111             };
1112             (cx.args[i].span, msg)
1113         })
1114         .collect::<Vec<_>>();
1115
1116     let errs_len = errs.len();
1117     if !errs.is_empty() {
1118         let args_used = cx.arg_types.len() - errs_len;
1119         let args_unused = errs_len;
1120
1121         let mut diag = {
1122             if let [(sp, msg)] = &errs[..] {
1123                 let mut diag = cx.ecx.struct_span_err(*sp, *msg);
1124                 diag.span_label(*sp, *msg);
1125                 diag
1126             } else {
1127                 let mut diag = cx.ecx.struct_span_err(
1128                     errs.iter().map(|&(sp, _)| sp).collect::<Vec<Span>>(),
1129                     "multiple unused formatting arguments",
1130                 );
1131                 diag.span_label(cx.fmtsp, "multiple missing formatting specifiers");
1132                 for (sp, msg) in errs {
1133                     diag.span_label(sp, msg);
1134                 }
1135                 diag
1136             }
1137         };
1138
1139         // Used to ensure we only report translations for *one* kind of foreign format.
1140         let mut found_foreign = false;
1141         // Decide if we want to look for foreign formatting directives.
1142         if args_used < args_unused {
1143             use super::format_foreign as foreign;
1144
1145             // The set of foreign substitutions we've explained.  This prevents spamming the user
1146             // with `%d should be written as {}` over and over again.
1147             let mut explained = FxHashSet::default();
1148
1149             macro_rules! check_foreign {
1150                 ($kind:ident) => {{
1151                     let mut show_doc_note = false;
1152
1153                     let mut suggestions = vec![];
1154                     // account for `"` and account for raw strings `r#`
1155                     let padding = str_style.map(|i| i + 2).unwrap_or(1);
1156                     for sub in foreign::$kind::iter_subs(fmt_str, padding) {
1157                         let trn = match sub.translate() {
1158                             Some(trn) => trn,
1159
1160                             // If it has no translation, don't call it out specifically.
1161                             None => continue,
1162                         };
1163
1164                         let pos = sub.position();
1165                         let sub = String::from(sub.as_str());
1166                         if explained.contains(&sub) {
1167                             continue;
1168                         }
1169                         explained.insert(sub.clone());
1170
1171                         if !found_foreign {
1172                             found_foreign = true;
1173                             show_doc_note = true;
1174                         }
1175
1176                         if let Some(inner_sp) = pos {
1177                             let sp = fmt_sp.from_inner(inner_sp);
1178                             suggestions.push((sp, trn));
1179                         } else {
1180                             diag.help(&format!("`{}` should be written as `{}`", sub, trn));
1181                         }
1182                     }
1183
1184                     if show_doc_note {
1185                         diag.note(concat!(
1186                             stringify!($kind),
1187                             " formatting not supported; see the documentation for `std::fmt`",
1188                         ));
1189                     }
1190                     if suggestions.len() > 0 {
1191                         diag.multipart_suggestion(
1192                             "format specifiers use curly braces",
1193                             suggestions,
1194                             Applicability::MachineApplicable,
1195                         );
1196                     }
1197                 }};
1198             }
1199
1200             check_foreign!(printf);
1201             if !found_foreign {
1202                 check_foreign!(shell);
1203             }
1204         }
1205         if !found_foreign && errs_len == 1 {
1206             diag.span_label(cx.fmtsp, "formatting specifier missing");
1207         }
1208
1209         diag.emit();
1210     }
1211
1212     cx.into_expr()
1213 }