]> git.lizzy.rs Git - rust.git/blob - src/formatting.rs
Merge pull request #3028 from scampi/issue2973
[rust.git] / src / formatting.rs
1 // High level formatting functions.
2
3 use std::collections::HashMap;
4 use std::io::{self, Write};
5 use std::panic::{catch_unwind, AssertUnwindSafe};
6 use std::rc::Rc;
7 use std::time::{Duration, Instant};
8
9 use syntax::ast;
10 use syntax::errors::emitter::{ColorConfig, EmitterWriter};
11 use syntax::errors::Handler;
12 use syntax::parse::{self, ParseSess};
13 use syntax::source_map::{FilePathMapping, SourceMap, Span};
14
15 use comment::{CharClasses, FullCodeCharKind};
16 use config::{Config, FileName, Verbosity};
17 use issues::BadIssueSeeker;
18 use visitor::{FmtVisitor, SnippetProvider};
19 use {modules, source_file, ErrorKind, FormatReport, Input, Session};
20
21 // A map of the files of a crate, with their new content
22 pub(crate) type SourceFile = Vec<FileRecord>;
23 pub(crate) type FileRecord = (FileName, String);
24
25 impl<'b, T: Write + 'b> Session<'b, T> {
26     pub(crate) fn format_input_inner(&mut self, input: Input) -> Result<FormatReport, ErrorKind> {
27         if !self.config.version_meets_requirement() {
28             return Err(ErrorKind::VersionMismatch);
29         }
30
31         syntax::with_globals(|| {
32             syntax_pos::hygiene::set_default_edition(
33                 self.config.edition().to_libsyntax_pos_edition(),
34             );
35
36             if self.config.disable_all_formatting() {
37                 // When the input is from stdin, echo back the input.
38                 if let Input::Text(ref buf) = input {
39                     if let Err(e) = io::stdout().write_all(buf.as_bytes()) {
40                         return Err(From::from(e));
41                     }
42                 }
43                 return Ok(FormatReport::new());
44             }
45
46             let config = &self.config.clone();
47             let format_result = format_project(input, config, self);
48
49             format_result.map(|report| {
50                 {
51                     let new_errors = &report.internal.borrow().1;
52
53                     self.errors.add(new_errors);
54                 }
55                 report
56             })
57         })
58     }
59 }
60
61 // Format an entire crate (or subset of the module tree).
62 fn format_project<T: FormatHandler>(
63     input: Input,
64     config: &Config,
65     handler: &mut T,
66 ) -> Result<FormatReport, ErrorKind> {
67     let mut timer = Timer::start();
68
69     let main_file = input.file_name();
70     let input_is_stdin = main_file == FileName::Stdin;
71
72     // Parse the crate.
73     let source_map = Rc::new(SourceMap::new(FilePathMapping::empty()));
74     let mut parse_session = make_parse_sess(source_map.clone(), config);
75     let mut report = FormatReport::new();
76     let krate = parse_crate(input, &parse_session, config, &mut report)?;
77     timer = timer.done_parsing();
78
79     // Suppress error output if we have to do any further parsing.
80     let silent_emitter = silent_emitter(source_map);
81     parse_session.span_diagnostic = Handler::with_emitter(true, false, silent_emitter);
82
83     let mut context = FormatContext::new(&krate, report, parse_session, config, handler);
84
85     let files = modules::list_files(&krate, context.parse_session.source_map())?;
86     for (path, module) in files {
87         if (config.skip_children() && path != main_file) || config.ignore().skip_file(&path) {
88             continue;
89         }
90         should_emit_verbose(input_is_stdin, config, || println!("Formatting {}", path));
91         let is_root = path == main_file;
92         context.format_file(path, module, is_root)?;
93     }
94     timer = timer.done_formatting();
95
96     should_emit_verbose(input_is_stdin, config, || {
97         println!(
98             "Spent {0:.3} secs in the parsing phase, and {1:.3} secs in the formatting phase",
99             timer.get_parse_time(),
100             timer.get_format_time(),
101         )
102     });
103
104     Ok(context.report)
105 }
106
107 // Used for formatting files.
108 #[derive(new)]
109 struct FormatContext<'a, T: FormatHandler + 'a> {
110     krate: &'a ast::Crate,
111     report: FormatReport,
112     parse_session: ParseSess,
113     config: &'a Config,
114     handler: &'a mut T,
115 }
116
117 impl<'a, T: FormatHandler + 'a> FormatContext<'a, T> {
118     // Formats a single file/module.
119     fn format_file(
120         &mut self,
121         path: FileName,
122         module: &ast::Mod,
123         is_root: bool,
124     ) -> Result<(), ErrorKind> {
125         let source_file = self
126             .parse_session
127             .source_map()
128             .lookup_char_pos(module.inner.lo())
129             .file;
130         let big_snippet = source_file.src.as_ref().unwrap();
131         let snippet_provider = SnippetProvider::new(source_file.start_pos, big_snippet);
132         let mut visitor = FmtVisitor::from_source_map(
133             &self.parse_session,
134             &self.config,
135             &snippet_provider,
136             self.report.clone(),
137         );
138
139         // Format inner attributes if available.
140         if !self.krate.attrs.is_empty() && is_root {
141             visitor.skip_empty_lines(source_file.end_pos);
142             if visitor.visit_attrs(&self.krate.attrs, ast::AttrStyle::Inner) {
143                 visitor.push_rewrite(module.inner, None);
144             } else {
145                 visitor.format_separate_mod(module, &*source_file);
146             }
147         } else {
148             visitor.last_pos = source_file.start_pos;
149             visitor.skip_empty_lines(source_file.end_pos);
150             visitor.format_separate_mod(module, &*source_file);
151         };
152
153         debug_assert_eq!(
154             visitor.line_number,
155             ::utils::count_newlines(&visitor.buffer)
156         );
157
158         // For some reason, the source_map does not include terminating
159         // newlines so we must add one on for each file. This is sad.
160         source_file::append_newline(&mut visitor.buffer);
161
162         format_lines(
163             &mut visitor.buffer,
164             &path,
165             &visitor.skipped_range,
166             &self.config,
167             &self.report,
168         );
169         self.config
170             .newline_style()
171             .apply(&mut visitor.buffer, &big_snippet);
172
173         if visitor.macro_rewrite_failure {
174             self.report.add_macro_format_failure();
175         }
176
177         self.handler
178             .handle_formatted_file(path, visitor.buffer.to_owned(), &mut self.report)
179     }
180 }
181
182 // Handle the results of formatting.
183 trait FormatHandler {
184     fn handle_formatted_file(
185         &mut self,
186         path: FileName,
187         result: String,
188         report: &mut FormatReport,
189     ) -> Result<(), ErrorKind>;
190 }
191
192 impl<'b, T: Write + 'b> FormatHandler for Session<'b, T> {
193     // Called for each formatted file.
194     fn handle_formatted_file(
195         &mut self,
196         path: FileName,
197         result: String,
198         report: &mut FormatReport,
199     ) -> Result<(), ErrorKind> {
200         if let Some(ref mut out) = self.out {
201             match source_file::write_file(&result, &path, out, &self.config) {
202                 Ok(b) if b => report.add_diff(),
203                 Err(e) => {
204                     // Create a new error with path_str to help users see which files failed
205                     let err_msg = format!("{}: {}", path, e);
206                     return Err(io::Error::new(e.kind(), err_msg).into());
207                 }
208                 _ => {}
209             }
210         }
211
212         self.source_file.push((path, result));
213         Ok(())
214     }
215 }
216
217 pub(crate) struct FormattingError {
218     pub(crate) line: usize,
219     pub(crate) kind: ErrorKind,
220     is_comment: bool,
221     is_string: bool,
222     pub(crate) line_buffer: String,
223 }
224
225 impl FormattingError {
226     pub(crate) fn from_span(
227         span: Span,
228         source_map: &SourceMap,
229         kind: ErrorKind,
230     ) -> FormattingError {
231         FormattingError {
232             line: source_map.lookup_char_pos(span.lo()).line,
233             is_comment: kind.is_comment(),
234             kind,
235             is_string: false,
236             line_buffer: source_map
237                 .span_to_lines(span)
238                 .ok()
239                 .and_then(|fl| {
240                     fl.file
241                         .get_line(fl.lines[0].line_index)
242                         .map(|l| l.into_owned())
243                 }).unwrap_or_else(String::new),
244         }
245     }
246
247     pub(crate) fn msg_prefix(&self) -> &str {
248         match self.kind {
249             ErrorKind::LineOverflow(..)
250             | ErrorKind::TrailingWhitespace
251             | ErrorKind::IoError(_)
252             | ErrorKind::ParseError
253             | ErrorKind::LostComment => "internal error:",
254             ErrorKind::LicenseCheck | ErrorKind::BadAttr | ErrorKind::VersionMismatch => "error:",
255             ErrorKind::BadIssue(_) | ErrorKind::DeprecatedAttr => "warning:",
256         }
257     }
258
259     pub(crate) fn msg_suffix(&self) -> &str {
260         if self.is_comment || self.is_string {
261             "set `error_on_unformatted = false` to suppress \
262              the warning against comments or string literals\n"
263         } else {
264             ""
265         }
266     }
267
268     // (space, target)
269     pub(crate) fn format_len(&self) -> (usize, usize) {
270         match self.kind {
271             ErrorKind::LineOverflow(found, max) => (max, found - max),
272             ErrorKind::TrailingWhitespace
273             | ErrorKind::DeprecatedAttr
274             | ErrorKind::BadIssue(_)
275             | ErrorKind::BadAttr
276             | ErrorKind::LostComment => {
277                 let trailing_ws_start = self
278                     .line_buffer
279                     .rfind(|c: char| !c.is_whitespace())
280                     .map(|pos| pos + 1)
281                     .unwrap_or(0);
282                 (
283                     trailing_ws_start,
284                     self.line_buffer.len() - trailing_ws_start,
285                 )
286             }
287             _ => unreachable!(),
288         }
289     }
290 }
291
292 pub(crate) type FormatErrorMap = HashMap<FileName, Vec<FormattingError>>;
293
294 #[derive(Default, Debug)]
295 pub(crate) struct ReportedErrors {
296     // Encountered e.g. an IO error.
297     pub(crate) has_operational_errors: bool,
298
299     // Failed to reformat code because of parsing errors.
300     pub(crate) has_parsing_errors: bool,
301
302     // Code is valid, but it is impossible to format it properly.
303     pub(crate) has_formatting_errors: bool,
304
305     // Code contains macro call that was unable to format.
306     pub(crate) has_macro_format_failure: bool,
307
308     // Failed a check, such as the license check or other opt-in checking.
309     pub(crate) has_check_errors: bool,
310
311     /// Formatted code differs from existing code (--check only).
312     pub(crate) has_diff: bool,
313 }
314
315 impl ReportedErrors {
316     /// Combine two summaries together.
317     pub fn add(&mut self, other: &ReportedErrors) {
318         self.has_operational_errors |= other.has_operational_errors;
319         self.has_parsing_errors |= other.has_parsing_errors;
320         self.has_formatting_errors |= other.has_formatting_errors;
321         self.has_macro_format_failure |= other.has_macro_format_failure;
322         self.has_check_errors |= other.has_check_errors;
323         self.has_diff |= other.has_diff;
324     }
325 }
326
327 /// A single span of changed lines, with 0 or more removed lines
328 /// and a vector of 0 or more inserted lines.
329 #[derive(Debug, PartialEq, Eq)]
330 pub(crate) struct ModifiedChunk {
331     /// The first to be removed from the original text
332     pub line_number_orig: u32,
333     /// The number of lines which have been replaced
334     pub lines_removed: u32,
335     /// The new lines
336     pub lines: Vec<String>,
337 }
338
339 /// Set of changed sections of a file.
340 #[derive(Debug, PartialEq, Eq)]
341 pub(crate) struct ModifiedLines {
342     /// The set of changed chunks.
343     pub chunks: Vec<ModifiedChunk>,
344 }
345
346 #[derive(Clone, Copy, Debug)]
347 enum Timer {
348     Disabled,
349     Initialized(Instant),
350     DoneParsing(Instant, Instant),
351     DoneFormatting(Instant, Instant, Instant),
352 }
353
354 impl Timer {
355     fn start() -> Timer {
356         if cfg!(target_arch = "wasm32") {
357             Timer::Disabled
358         } else {
359             Timer::Initialized(Instant::now())
360         }
361     }
362     fn done_parsing(self) -> Self {
363         match self {
364             Timer::Disabled => Timer::Disabled,
365             Timer::Initialized(init_time) => Timer::DoneParsing(init_time, Instant::now()),
366             _ => panic!("Timer can only transition to DoneParsing from Initialized state"),
367         }
368     }
369
370     fn done_formatting(self) -> Self {
371         match self {
372             Timer::Disabled => Timer::Disabled,
373             Timer::DoneParsing(init_time, parse_time) => {
374                 Timer::DoneFormatting(init_time, parse_time, Instant::now())
375             }
376             _ => panic!("Timer can only transition to DoneFormatting from DoneParsing state"),
377         }
378     }
379
380     /// Returns the time it took to parse the source files in seconds.
381     fn get_parse_time(&self) -> f32 {
382         match *self {
383             Timer::Disabled => panic!("this platform cannot time execution"),
384             Timer::DoneParsing(init, parse_time) | Timer::DoneFormatting(init, parse_time, _) => {
385                 // This should never underflow since `Instant::now()` guarantees monotonicity.
386                 Self::duration_to_f32(parse_time.duration_since(init))
387             }
388             Timer::Initialized(..) => unreachable!(),
389         }
390     }
391
392     /// Returns the time it took to go from the parsed AST to the formatted output. Parsing time is
393     /// not included.
394     fn get_format_time(&self) -> f32 {
395         match *self {
396             Timer::Disabled => panic!("this platform cannot time execution"),
397             Timer::DoneFormatting(_init, parse_time, format_time) => {
398                 Self::duration_to_f32(format_time.duration_since(parse_time))
399             }
400             Timer::DoneParsing(..) | Timer::Initialized(..) => unreachable!(),
401         }
402     }
403
404     fn duration_to_f32(d: Duration) -> f32 {
405         d.as_secs() as f32 + d.subsec_nanos() as f32 / 1_000_000_000f32
406     }
407 }
408
409 // Formatting done on a char by char or line by line basis.
410 // FIXME(#20) other stuff for parity with make tidy
411 fn format_lines(
412     text: &mut String,
413     name: &FileName,
414     skipped_range: &[(usize, usize)],
415     config: &Config,
416     report: &FormatReport,
417 ) {
418     let mut formatter = FormatLines::new(name, skipped_range, config);
419     formatter.check_license(text);
420     formatter.iterate(text);
421
422     if formatter.newline_count > 1 {
423         debug!("track truncate: {} {}", text.len(), formatter.newline_count);
424         let line = text.len() - formatter.newline_count + 1;
425         text.truncate(line);
426     }
427
428     report.append(name.clone(), formatter.errors);
429 }
430
431 struct FormatLines<'a> {
432     name: &'a FileName,
433     skipped_range: &'a [(usize, usize)],
434     last_was_space: bool,
435     line_len: usize,
436     cur_line: usize,
437     newline_count: usize,
438     errors: Vec<FormattingError>,
439     issue_seeker: BadIssueSeeker,
440     line_buffer: String,
441     // true if the current line contains a string literal.
442     is_string: bool,
443     format_line: bool,
444     allow_issue_seek: bool,
445     config: &'a Config,
446 }
447
448 impl<'a> FormatLines<'a> {
449     fn new(
450         name: &'a FileName,
451         skipped_range: &'a [(usize, usize)],
452         config: &'a Config,
453     ) -> FormatLines<'a> {
454         let issue_seeker = BadIssueSeeker::new(config.report_todo(), config.report_fixme());
455         FormatLines {
456             name,
457             skipped_range,
458             last_was_space: false,
459             line_len: 0,
460             cur_line: 1,
461             newline_count: 0,
462             errors: vec![],
463             allow_issue_seek: !issue_seeker.is_disabled(),
464             issue_seeker,
465             line_buffer: String::with_capacity(config.max_width() * 2),
466             is_string: false,
467             format_line: config.file_lines().contains_line(name, 1),
468             config,
469         }
470     }
471
472     fn check_license(&mut self, text: &mut String) {
473         if let Some(ref license_template) = self.config.license_template {
474             if !license_template.is_match(text) {
475                 self.errors.push(FormattingError {
476                     line: self.cur_line,
477                     kind: ErrorKind::LicenseCheck,
478                     is_comment: false,
479                     is_string: false,
480                     line_buffer: String::new(),
481                 });
482             }
483         }
484     }
485
486     // Iterate over the chars in the file map.
487     fn iterate(&mut self, text: &mut String) {
488         for (kind, c) in CharClasses::new(text.chars()) {
489             if c == '\r' {
490                 continue;
491             }
492
493             if self.allow_issue_seek && self.format_line {
494                 // Add warnings for bad todos/ fixmes
495                 if let Some(issue) = self.issue_seeker.inspect(c) {
496                     self.push_err(ErrorKind::BadIssue(issue), false, false);
497                 }
498             }
499
500             if c == '\n' {
501                 self.new_line(kind);
502             } else {
503                 self.char(c, kind);
504             }
505         }
506     }
507
508     fn new_line(&mut self, kind: FullCodeCharKind) {
509         if self.format_line {
510             // Check for (and record) trailing whitespace.
511             if self.last_was_space {
512                 if self.should_report_error(kind, &ErrorKind::TrailingWhitespace)
513                     && !self.is_skipped_line()
514                 {
515                     self.push_err(
516                         ErrorKind::TrailingWhitespace,
517                         kind.is_comment(),
518                         kind.is_string(),
519                     );
520                 }
521                 self.line_len -= 1;
522             }
523
524             // Check for any line width errors we couldn't correct.
525             let error_kind = ErrorKind::LineOverflow(self.line_len, self.config.max_width());
526             if self.line_len > self.config.max_width()
527                 && !self.is_skipped_line()
528                 && self.should_report_error(kind, &error_kind)
529             {
530                 self.push_err(error_kind, kind.is_comment(), self.is_string);
531             }
532         }
533
534         self.line_len = 0;
535         self.cur_line += 1;
536         self.format_line = self
537             .config
538             .file_lines()
539             .contains_line(self.name, self.cur_line);
540         self.newline_count += 1;
541         self.last_was_space = false;
542         self.line_buffer.clear();
543         self.is_string = false;
544     }
545
546     fn char(&mut self, c: char, kind: FullCodeCharKind) {
547         self.newline_count = 0;
548         self.line_len += if c == '\t' {
549             self.config.tab_spaces()
550         } else {
551             1
552         };
553         self.last_was_space = c.is_whitespace();
554         self.line_buffer.push(c);
555         if kind.is_string() {
556             self.is_string = true;
557         }
558     }
559
560     fn push_err(&mut self, kind: ErrorKind, is_comment: bool, is_string: bool) {
561         self.errors.push(FormattingError {
562             line: self.cur_line,
563             kind,
564             is_comment,
565             is_string,
566             line_buffer: self.line_buffer.clone(),
567         });
568     }
569
570     fn should_report_error(&self, char_kind: FullCodeCharKind, error_kind: &ErrorKind) -> bool {
571         let allow_error_report =
572             if char_kind.is_comment() || self.is_string || error_kind.is_comment() {
573                 self.config.error_on_unformatted()
574             } else {
575                 true
576             };
577
578         match error_kind {
579             ErrorKind::LineOverflow(..) => {
580                 self.config.error_on_line_overflow() && allow_error_report
581             }
582             ErrorKind::TrailingWhitespace | ErrorKind::LostComment => allow_error_report,
583             _ => true,
584         }
585     }
586
587     /// Returns true if the line with the given line number was skipped by `#[rustfmt::skip]`.
588     fn is_skipped_line(&self) -> bool {
589         self.skipped_range
590             .iter()
591             .any(|&(lo, hi)| lo <= self.cur_line && self.cur_line <= hi)
592     }
593 }
594
595 fn parse_crate(
596     input: Input,
597     parse_session: &ParseSess,
598     config: &Config,
599     report: &mut FormatReport,
600 ) -> Result<ast::Crate, ErrorKind> {
601     let input_is_stdin = input.is_text();
602
603     let mut parser = match input {
604         Input::File(file) => parse::new_parser_from_file(parse_session, &file),
605         Input::Text(text) => parse::new_parser_from_source_str(
606             parse_session,
607             syntax::source_map::FileName::Custom("stdin".to_owned()),
608             text,
609         ),
610     };
611
612     parser.cfg_mods = false;
613     if config.skip_children() {
614         parser.recurse_into_file_modules = false;
615     }
616
617     let mut parser = AssertUnwindSafe(parser);
618     let result = catch_unwind(move || parser.0.parse_crate_mod());
619
620     match result {
621         Ok(Ok(c)) => {
622             if !parse_session.span_diagnostic.has_errors() {
623                 return Ok(c);
624             }
625         }
626         Ok(Err(mut e)) => e.emit(),
627         Err(_) => {
628             // Note that if you see this message and want more information,
629             // then run the `parse_crate_mod` function above without
630             // `catch_unwind` so rustfmt panics and you can get a backtrace.
631             should_emit_verbose(input_is_stdin, config, || {
632                 println!("The Rust parser panicked")
633             });
634         }
635     }
636
637     report.add_parsing_error();
638     Err(ErrorKind::ParseError)
639 }
640
641 fn silent_emitter(source_map: Rc<SourceMap>) -> Box<EmitterWriter> {
642     Box::new(EmitterWriter::new(
643         Box::new(Vec::new()),
644         Some(source_map),
645         false,
646         false,
647     ))
648 }
649
650 fn make_parse_sess(source_map: Rc<SourceMap>, config: &Config) -> ParseSess {
651     let tty_handler = if config.hide_parse_errors() {
652         let silent_emitter = silent_emitter(source_map.clone());
653         Handler::with_emitter(true, false, silent_emitter)
654     } else {
655         let supports_color = term::stderr().map_or(false, |term| term.supports_color());
656         let color_cfg = if supports_color {
657             ColorConfig::Auto
658         } else {
659             ColorConfig::Never
660         };
661         Handler::with_tty_emitter(color_cfg, true, false, Some(source_map.clone()))
662     };
663
664     ParseSess::with_span_handler(tty_handler, source_map)
665 }
666
667 fn should_emit_verbose<F>(is_stdin: bool, config: &Config, f: F)
668 where
669     F: Fn(),
670 {
671     if config.verbose() == Verbosity::Verbose && !is_stdin {
672         f();
673     }
674 }