]> git.lizzy.rs Git - rust.git/blob - src/formatting.rs
Refactoring: return a summary from `format_project`
[rust.git] / src / formatting.rs
1 // High level formatting functions.
2
3 use std::collections::HashMap;
4 use std::io::{self, Write};
5 use std::panic::{catch_unwind, AssertUnwindSafe};
6 use std::rc::Rc;
7 use std::time::{Duration, Instant};
8
9 use syntax::ast;
10 use syntax::codemap::{CodeMap, FilePathMapping, Span};
11 use syntax::errors::emitter::{ColorConfig, EmitterWriter};
12 use syntax::errors::{DiagnosticBuilder, Handler};
13 use syntax::parse::{self, ParseSess};
14
15 use comment::{CharClasses, FullCodeCharKind};
16 use config::{Config, FileName, NewlineStyle, Verbosity};
17 use issues::BadIssueSeeker;
18 use visitor::{FmtVisitor, SnippetProvider};
19 use {filemap, modules, ErrorKind, FormatReport, Input, Session};
20
21 // A map of the files of a crate, with their new content
22 pub(crate) type FileMap = Vec<FileRecord>;
23
24 pub(crate) type FileRecord = (FileName, String);
25
26 pub(crate) struct FormattingError {
27     pub(crate) line: usize,
28     pub(crate) kind: ErrorKind,
29     is_comment: bool,
30     is_string: bool,
31     pub(crate) line_buffer: String,
32 }
33
34 impl FormattingError {
35     pub(crate) fn from_span(span: &Span, codemap: &CodeMap, kind: ErrorKind) -> FormattingError {
36         FormattingError {
37             line: codemap.lookup_char_pos(span.lo()).line,
38             is_comment: kind.is_comment(),
39             kind,
40             is_string: false,
41             line_buffer: codemap
42                 .span_to_lines(*span)
43                 .ok()
44                 .and_then(|fl| {
45                     fl.file
46                         .get_line(fl.lines[0].line_index)
47                         .map(|l| l.into_owned())
48                 })
49                 .unwrap_or_else(|| String::new()),
50         }
51     }
52
53     pub(crate) fn msg_prefix(&self) -> &str {
54         match self.kind {
55             ErrorKind::LineOverflow(..)
56             | ErrorKind::TrailingWhitespace
57             | ErrorKind::IoError(_)
58             | ErrorKind::ParseError
59             | ErrorKind::LostComment => "internal error:",
60             ErrorKind::LicenseCheck | ErrorKind::BadAttr | ErrorKind::VersionMismatch => "error:",
61             ErrorKind::BadIssue(_) | ErrorKind::DeprecatedAttr => "warning:",
62         }
63     }
64
65     pub(crate) fn msg_suffix(&self) -> &str {
66         if self.is_comment || self.is_string {
67             "set `error_on_unformatted = false` to suppress \
68              the warning against comments or string literals\n"
69         } else {
70             ""
71         }
72     }
73
74     // (space, target)
75     pub(crate) fn format_len(&self) -> (usize, usize) {
76         match self.kind {
77             ErrorKind::LineOverflow(found, max) => (max, found - max),
78             ErrorKind::TrailingWhitespace
79             | ErrorKind::DeprecatedAttr
80             | ErrorKind::BadAttr
81             | ErrorKind::LostComment => {
82                 let trailing_ws_start = self
83                     .line_buffer
84                     .rfind(|c: char| !c.is_whitespace())
85                     .map(|pos| pos + 1)
86                     .unwrap_or(0);
87                 (
88                     trailing_ws_start,
89                     self.line_buffer.len() - trailing_ws_start,
90                 )
91             }
92             _ => unreachable!(),
93         }
94     }
95 }
96
97 pub(crate) type FormatErrorMap = HashMap<FileName, Vec<FormattingError>>;
98
99 #[derive(Default, Debug)]
100 pub(crate) struct ReportedErrors {
101     pub(crate) has_operational_errors: bool,
102     pub(crate) has_check_errors: bool,
103 }
104
105 fn should_emit_verbose<F>(is_stdin: bool, config: &Config, f: F)
106 where
107     F: Fn(),
108 {
109     if config.verbose() == Verbosity::Verbose && !is_stdin {
110         f();
111     }
112 }
113
114 /// Returns true if the line with the given line number was skipped by `#[rustfmt::skip]`.
115 fn is_skipped_line(line_number: usize, skipped_range: &[(usize, usize)]) -> bool {
116     skipped_range
117         .iter()
118         .any(|&(lo, hi)| lo <= line_number && line_number <= hi)
119 }
120
121 fn should_report_error(
122     config: &Config,
123     char_kind: FullCodeCharKind,
124     is_string: bool,
125     error_kind: &ErrorKind,
126 ) -> bool {
127     let allow_error_report = if char_kind.is_comment() || is_string || error_kind.is_comment() {
128         config.error_on_unformatted()
129     } else {
130         true
131     };
132
133     match error_kind {
134         ErrorKind::LineOverflow(..) => config.error_on_line_overflow() && allow_error_report,
135         ErrorKind::TrailingWhitespace | ErrorKind::LostComment => allow_error_report,
136         _ => true,
137     }
138 }
139
140 // Formatting done on a char by char or line by line basis.
141 // FIXME(#20) other stuff for parity with make tidy
142 fn format_lines(
143     text: &mut String,
144     name: &FileName,
145     skipped_range: &[(usize, usize)],
146     config: &Config,
147     report: &FormatReport,
148 ) {
149     let mut last_was_space = false;
150     let mut line_len = 0;
151     let mut cur_line = 1;
152     let mut newline_count = 0;
153     let mut errors = vec![];
154     let mut issue_seeker = BadIssueSeeker::new(config.report_todo(), config.report_fixme());
155     let mut line_buffer = String::with_capacity(config.max_width() * 2);
156     let mut is_string = false; // true if the current line contains a string literal.
157     let mut format_line = config.file_lines().contains_line(name, cur_line);
158     let allow_issue_seek = !issue_seeker.is_disabled();
159
160     // Check license.
161     if let Some(ref license_template) = config.license_template {
162         if !license_template.is_match(text) {
163             errors.push(FormattingError {
164                 line: cur_line,
165                 kind: ErrorKind::LicenseCheck,
166                 is_comment: false,
167                 is_string: false,
168                 line_buffer: String::new(),
169             });
170         }
171     }
172
173     // Iterate over the chars in the file map.
174     for (kind, c) in CharClasses::new(text.chars()) {
175         if c == '\r' {
176             continue;
177         }
178
179         if allow_issue_seek && format_line {
180             // Add warnings for bad todos/ fixmes
181             if let Some(issue) = issue_seeker.inspect(c) {
182                 errors.push(FormattingError {
183                     line: cur_line,
184                     kind: ErrorKind::BadIssue(issue),
185                     is_comment: false,
186                     is_string: false,
187                     line_buffer: String::new(),
188                 });
189             }
190         }
191
192         if c == '\n' {
193             if format_line {
194                 // Check for (and record) trailing whitespace.
195                 if last_was_space {
196                     if should_report_error(config, kind, is_string, &ErrorKind::TrailingWhitespace)
197                         && !is_skipped_line(cur_line, skipped_range)
198                     {
199                         errors.push(FormattingError {
200                             line: cur_line,
201                             kind: ErrorKind::TrailingWhitespace,
202                             is_comment: kind.is_comment(),
203                             is_string: kind.is_string(),
204                             line_buffer: line_buffer.clone(),
205                         });
206                     }
207                     line_len -= 1;
208                 }
209
210                 // Check for any line width errors we couldn't correct.
211                 let error_kind = ErrorKind::LineOverflow(line_len, config.max_width());
212                 if line_len > config.max_width()
213                     && !is_skipped_line(cur_line, skipped_range)
214                     && should_report_error(config, kind, is_string, &error_kind)
215                 {
216                     errors.push(FormattingError {
217                         line: cur_line,
218                         kind: error_kind,
219                         is_comment: kind.is_comment(),
220                         is_string,
221                         line_buffer: line_buffer.clone(),
222                     });
223                 }
224             }
225
226             line_len = 0;
227             cur_line += 1;
228             format_line = config.file_lines().contains_line(name, cur_line);
229             newline_count += 1;
230             last_was_space = false;
231             line_buffer.clear();
232             is_string = false;
233         } else {
234             newline_count = 0;
235             line_len += if c == '\t' { config.tab_spaces() } else { 1 };
236             last_was_space = c.is_whitespace();
237             line_buffer.push(c);
238             if kind.is_string() {
239                 is_string = true;
240             }
241         }
242     }
243
244     if newline_count > 1 {
245         debug!("track truncate: {} {}", text.len(), newline_count);
246         let line = text.len() - newline_count + 1;
247         text.truncate(line);
248     }
249
250     report.append(name.clone(), errors);
251 }
252
253 fn parse_input<'sess>(
254     input: Input,
255     parse_session: &'sess ParseSess,
256     config: &Config,
257 ) -> Result<ast::Crate, ParseError<'sess>> {
258     let mut parser = match input {
259         Input::File(file) => parse::new_parser_from_file(parse_session, &file),
260         Input::Text(text) => parse::new_parser_from_source_str(
261             parse_session,
262             syntax::codemap::FileName::Custom("stdin".to_owned()),
263             text,
264         ),
265     };
266
267     parser.cfg_mods = false;
268     if config.skip_children() {
269         parser.recurse_into_file_modules = false;
270     }
271
272     let mut parser = AssertUnwindSafe(parser);
273     let result = catch_unwind(move || parser.0.parse_crate_mod());
274
275     match result {
276         Ok(Ok(c)) => {
277             if parse_session.span_diagnostic.has_errors() {
278                 // Bail out if the parser recovered from an error.
279                 Err(ParseError::Recovered)
280             } else {
281                 Ok(c)
282             }
283         }
284         Ok(Err(e)) => Err(ParseError::Error(e)),
285         Err(_) => Err(ParseError::Panic),
286     }
287 }
288
289 /// All the ways that parsing can fail.
290 enum ParseError<'sess> {
291     /// There was an error, but the parser recovered.
292     Recovered,
293     /// There was an error (supplied) and parsing failed.
294     Error(DiagnosticBuilder<'sess>),
295     /// The parser panicked.
296     Panic,
297 }
298
299 impl<'b, T: Write + 'b> Session<'b, T> {
300     pub(crate) fn format_input_inner(
301         &mut self,
302         input: Input,
303     ) -> Result<(FileMap, FormatReport), ErrorKind> {
304         syntax_pos::hygiene::set_default_edition(self.config.edition().to_libsyntax_pos_edition());
305
306         if self.config.disable_all_formatting() {
307             // When the input is from stdin, echo back the input.
308             if let Input::Text(ref buf) = input {
309                 if let Err(e) = io::stdout().write_all(buf.as_bytes()) {
310                     return Err(From::from(e));
311                 }
312             }
313             return Ok((FileMap::new(), FormatReport::new()));
314         }
315
316         let input_is_stdin = input.is_text();
317         let mut filemap = FileMap::new();
318         // TODO split Session? out vs config?
319         let format_result = self.format_project(input, |this, path, mut result| {
320             if let Some(ref mut out) = this.out {
321                 match filemap::write_file(&mut result, &path, out, &this.config) {
322                     Ok(b) if b => this.summary.add_diff(),
323                     Err(e) => {
324                         // Create a new error with path_str to help users see which files failed
325                         let err_msg = format!("{}: {}", path, e);
326                         return Err(io::Error::new(e.kind(), err_msg).into());
327                     }
328                     _ => {}
329                 }
330             }
331
332             filemap.push((path, result));
333             Ok(())
334         });
335
336         should_emit_verbose(input_is_stdin, &self.config, || {
337             fn duration_to_f32(d: Duration) -> f32 {
338                 d.as_secs() as f32 + d.subsec_nanos() as f32 / 1_000_000_000f32
339             }
340
341             println!(
342                 "Spent {0:.3} secs in the parsing phase, and {1:.3} secs in the formatting phase",
343                 duration_to_f32(self.timer.get_parse_time().unwrap()),
344                 duration_to_f32(self.timer.get_format_time().unwrap()),
345             )
346         });
347
348         format_result.map(|(result, summary)| {
349             self.summary.add(summary);
350             (filemap, result)
351         })
352     }
353
354     // TODO only uses config and timer
355     fn format_project<F>(
356         &mut self,
357         input: Input,
358         mut formatted_file: F,
359     ) -> Result<(FormatReport, Summary), ErrorKind>
360     where
361         F: FnMut(&mut Session<T>, FileName, String) -> Result<(), ErrorKind>,
362     {
363         let mut summary = Summary::default();
364         let main_file = match input {
365             Input::File(ref file) => FileName::Real(file.clone()),
366             Input::Text(..) => FileName::Stdin,
367         };
368
369         // Parse the crate.
370         let codemap = Rc::new(CodeMap::new(FilePathMapping::empty()));
371         let mut parse_session = self.make_parse_sess(codemap.clone());
372         let krate = match parse_input(input, &parse_session, &self.config) {
373             Ok(krate) => krate,
374             Err(err) => {
375                 match err {
376                     ParseError::Error(mut diagnostic) => diagnostic.emit(),
377                     ParseError::Panic => {
378                         // Note that if you see this message and want more information,
379                         // then go to `parse_input` and run the parse function without
380                         // `catch_unwind` so rustfmt panics and you can get a backtrace.
381                         should_emit_verbose(main_file != FileName::Stdin, &self.config, || {
382                             println!("The Rust parser panicked")
383                         });
384                     }
385                     ParseError::Recovered => {}
386                 }
387                 summary.add_parsing_error();
388                 return Err(ErrorKind::ParseError);
389             }
390         };
391         self.timer = self.timer.done_parsing();
392
393         // Suppress error output if we have to do any further parsing.
394         let silent_emitter = Box::new(EmitterWriter::new(
395             Box::new(Vec::new()),
396             Some(codemap.clone()),
397             false,
398             false,
399         ));
400         parse_session.span_diagnostic = Handler::with_emitter(true, false, silent_emitter);
401
402         let report = FormatReport::new();
403
404         let skip_children = self.config.skip_children();
405         for (path, module) in modules::list_files(&krate, parse_session.codemap())? {
406             if (skip_children && path != main_file) || self.config.ignore().skip_file(&path) {
407                 continue;
408             }
409             should_emit_verbose(main_file != FileName::Stdin, &self.config, || {
410                 println!("Formatting {}", path)
411             });
412             let filemap = parse_session
413                 .codemap()
414                 .lookup_char_pos(module.inner.lo())
415                 .file;
416             let big_snippet = filemap.src.as_ref().unwrap();
417             let snippet_provider = SnippetProvider::new(filemap.start_pos, big_snippet);
418             let mut visitor = FmtVisitor::from_codemap(
419                 &parse_session,
420                 &self.config,
421                 &snippet_provider,
422                 report.clone(),
423             );
424             // Format inner attributes if available.
425             if !krate.attrs.is_empty() && path == main_file {
426                 visitor.skip_empty_lines(filemap.end_pos);
427                 if visitor.visit_attrs(&krate.attrs, ast::AttrStyle::Inner) {
428                     visitor.push_rewrite(module.inner, None);
429                 } else {
430                     visitor.format_separate_mod(module, &*filemap);
431                 }
432             } else {
433                 visitor.last_pos = filemap.start_pos;
434                 visitor.skip_empty_lines(filemap.end_pos);
435                 visitor.format_separate_mod(module, &*filemap);
436             };
437
438             debug_assert_eq!(
439                 visitor.line_number,
440                 ::utils::count_newlines(&visitor.buffer)
441             );
442
443             // For some reason, the codemap does not include terminating
444             // newlines so we must add one on for each file. This is sad.
445             filemap::append_newline(&mut visitor.buffer);
446
447             format_lines(
448                 &mut visitor.buffer,
449                 &path,
450                 &visitor.skipped_range,
451                 &self.config,
452                 &report,
453             );
454             self.replace_with_system_newlines(&mut visitor.buffer);
455
456             if visitor.macro_rewrite_failure {
457                 summary.add_macro_format_failure();
458             }
459
460             formatted_file(self, path, visitor.buffer)?;
461         }
462         self.timer = self.timer.done_formatting();
463
464         if report.has_warnings() {
465             summary.add_formatting_error();
466         }
467         {
468             let report_errs = &report.internal.borrow().1;
469             if report_errs.has_check_errors {
470                 summary.add_check_error();
471             }
472             if report_errs.has_operational_errors {
473                 summary.add_operational_error();
474             }
475         }
476
477         Ok((report, summary))
478     }
479
480     fn make_parse_sess(&self, codemap: Rc<CodeMap>) -> ParseSess {
481         let tty_handler = if self.config.hide_parse_errors() {
482             let silent_emitter = Box::new(EmitterWriter::new(
483                 Box::new(Vec::new()),
484                 Some(codemap.clone()),
485                 false,
486                 false,
487             ));
488             Handler::with_emitter(true, false, silent_emitter)
489         } else {
490             let supports_color = term::stderr().map_or(false, |term| term.supports_color());
491             let color_cfg = if supports_color {
492                 ColorConfig::Auto
493             } else {
494                 ColorConfig::Never
495             };
496             Handler::with_tty_emitter(color_cfg, true, false, Some(codemap.clone()))
497         };
498
499         ParseSess::with_span_handler(tty_handler, codemap)
500     }
501
502     fn replace_with_system_newlines(&self, text: &mut String) -> () {
503         let style = if self.config.newline_style() == NewlineStyle::Native {
504             if cfg!(windows) {
505                 NewlineStyle::Windows
506             } else {
507                 NewlineStyle::Unix
508             }
509         } else {
510             self.config.newline_style()
511         };
512
513         match style {
514             NewlineStyle::Unix => return,
515             NewlineStyle::Windows => {
516                 let mut transformed = String::with_capacity(text.capacity());
517                 for c in text.chars() {
518                     match c {
519                         '\n' => transformed.push_str("\r\n"),
520                         '\r' => continue,
521                         c => transformed.push(c),
522                     }
523                 }
524                 *text = transformed;
525             }
526             NewlineStyle::Native => unreachable!(),
527         }
528     }
529 }
530
531 /// A single span of changed lines, with 0 or more removed lines
532 /// and a vector of 0 or more inserted lines.
533 #[derive(Debug, PartialEq, Eq)]
534 pub(crate) struct ModifiedChunk {
535     /// The first to be removed from the original text
536     pub line_number_orig: u32,
537     /// The number of lines which have been replaced
538     pub lines_removed: u32,
539     /// The new lines
540     pub lines: Vec<String>,
541 }
542
543 /// Set of changed sections of a file.
544 #[derive(Debug, PartialEq, Eq)]
545 pub(crate) struct ModifiedLines {
546     /// The set of changed chunks.
547     pub chunks: Vec<ModifiedChunk>,
548 }
549
550 #[derive(Clone, Copy, Debug)]
551 pub(crate) enum Timer {
552     Initialized(Instant),
553     DoneParsing(Instant, Instant),
554     DoneFormatting(Instant, Instant, Instant),
555 }
556
557 impl Timer {
558     fn done_parsing(self) -> Self {
559         match self {
560             Timer::Initialized(init_time) => Timer::DoneParsing(init_time, Instant::now()),
561             _ => panic!("Timer can only transition to DoneParsing from Initialized state"),
562         }
563     }
564
565     fn done_formatting(self) -> Self {
566         match self {
567             Timer::DoneParsing(init_time, parse_time) => {
568                 Timer::DoneFormatting(init_time, parse_time, Instant::now())
569             }
570             _ => panic!("Timer can only transition to DoneFormatting from DoneParsing state"),
571         }
572     }
573
574     /// Returns the time it took to parse the source files in nanoseconds.
575     fn get_parse_time(&self) -> Option<Duration> {
576         match *self {
577             Timer::DoneParsing(init, parse_time) | Timer::DoneFormatting(init, parse_time, _) => {
578                 // This should never underflow since `Instant::now()` guarantees monotonicity.
579                 Some(parse_time.duration_since(init))
580             }
581             Timer::Initialized(..) => None,
582         }
583     }
584
585     /// Returns the time it took to go from the parsed AST to the formatted output. Parsing time is
586     /// not included.
587     fn get_format_time(&self) -> Option<Duration> {
588         match *self {
589             Timer::DoneFormatting(_init, parse_time, format_time) => {
590                 Some(format_time.duration_since(parse_time))
591             }
592             Timer::DoneParsing(..) | Timer::Initialized(..) => None,
593         }
594     }
595 }
596
597 /// A summary of a Rustfmt run.
598 #[derive(Debug, Default, Clone, Copy)]
599 pub struct Summary {
600     // Encountered e.g. an IO error.
601     has_operational_errors: bool,
602
603     // Failed to reformat code because of parsing errors.
604     has_parsing_errors: bool,
605
606     // Code is valid, but it is impossible to format it properly.
607     has_formatting_errors: bool,
608
609     // Code contains macro call that was unable to format.
610     pub(crate) has_macro_format_failure: bool,
611
612     // Failed a check, such as the license check or other opt-in checking.
613     has_check_errors: bool,
614
615     /// Formatted code differs from existing code (--check only).
616     pub has_diff: bool,
617 }
618
619 impl Summary {
620     pub fn has_operational_errors(&self) -> bool {
621         self.has_operational_errors
622     }
623
624     pub fn has_parsing_errors(&self) -> bool {
625         self.has_parsing_errors
626     }
627
628     pub fn has_formatting_errors(&self) -> bool {
629         self.has_formatting_errors
630     }
631
632     pub fn has_check_errors(&self) -> bool {
633         self.has_check_errors
634     }
635
636     pub(crate) fn has_macro_formatting_failure(&self) -> bool {
637         self.has_macro_format_failure
638     }
639
640     pub fn add_operational_error(&mut self) {
641         self.has_operational_errors = true;
642     }
643
644     pub(crate) fn add_parsing_error(&mut self) {
645         self.has_parsing_errors = true;
646     }
647
648     pub(crate) fn add_formatting_error(&mut self) {
649         self.has_formatting_errors = true;
650     }
651
652     pub(crate) fn add_check_error(&mut self) {
653         self.has_check_errors = true;
654     }
655
656     pub(crate) fn add_diff(&mut self) {
657         self.has_diff = true;
658     }
659
660     pub(crate) fn add_macro_format_failure(&mut self) {
661         self.has_macro_format_failure = true;
662     }
663
664     pub fn has_no_errors(&self) -> bool {
665         !(self.has_operational_errors
666             || self.has_parsing_errors
667             || self.has_formatting_errors
668             || self.has_diff)
669     }
670
671     /// Combine two summaries together.
672     pub fn add(&mut self, other: Summary) {
673         self.has_operational_errors |= other.has_operational_errors;
674         self.has_formatting_errors |= other.has_formatting_errors;
675         self.has_macro_format_failure |= other.has_macro_format_failure;
676         self.has_parsing_errors |= other.has_parsing_errors;
677         self.has_check_errors |= other.has_check_errors;
678         self.has_diff |= other.has_diff;
679     }
680 }