]> git.lizzy.rs Git - rust.git/blob - src/formatting.rs
Refactoring: summary
[rust.git] / src / formatting.rs
1 // High level formatting functions.
2
3 use std::collections::HashMap;
4 use std::io::{self, Write};
5 use std::panic::{catch_unwind, AssertUnwindSafe};
6 use std::rc::Rc;
7 use std::time::{Duration, Instant};
8
9 use syntax::ast;
10 use syntax::codemap::{CodeMap, FilePathMapping, Span};
11 use syntax::errors::emitter::{ColorConfig, EmitterWriter};
12 use syntax::errors::{DiagnosticBuilder, Handler};
13 use syntax::parse::{self, ParseSess};
14
15 use comment::{CharClasses, FullCodeCharKind};
16 use config::{Config, FileName, NewlineStyle, Verbosity};
17 use issues::BadIssueSeeker;
18 use visitor::{FmtVisitor, SnippetProvider};
19 use {filemap, modules, ErrorKind, FormatReport, Input, Session};
20
21 // A map of the files of a crate, with their new content
22 pub(crate) type FileMap = Vec<FileRecord>;
23
24 pub(crate) type FileRecord = (FileName, String);
25
26 pub(crate) struct FormattingError {
27     pub(crate) line: usize,
28     pub(crate) kind: ErrorKind,
29     is_comment: bool,
30     is_string: bool,
31     pub(crate) line_buffer: String,
32 }
33
34 impl FormattingError {
35     pub(crate) fn from_span(span: &Span, codemap: &CodeMap, kind: ErrorKind) -> FormattingError {
36         FormattingError {
37             line: codemap.lookup_char_pos(span.lo()).line,
38             is_comment: kind.is_comment(),
39             kind,
40             is_string: false,
41             line_buffer: codemap
42                 .span_to_lines(*span)
43                 .ok()
44                 .and_then(|fl| {
45                     fl.file
46                         .get_line(fl.lines[0].line_index)
47                         .map(|l| l.into_owned())
48                 })
49                 .unwrap_or_else(|| String::new()),
50         }
51     }
52
53     pub(crate) fn msg_prefix(&self) -> &str {
54         match self.kind {
55             ErrorKind::LineOverflow(..)
56             | ErrorKind::TrailingWhitespace
57             | ErrorKind::IoError(_)
58             | ErrorKind::ParseError
59             | ErrorKind::LostComment => "internal error:",
60             ErrorKind::LicenseCheck | ErrorKind::BadAttr | ErrorKind::VersionMismatch => "error:",
61             ErrorKind::BadIssue(_) | ErrorKind::DeprecatedAttr => "warning:",
62         }
63     }
64
65     pub(crate) fn msg_suffix(&self) -> &str {
66         if self.is_comment || self.is_string {
67             "set `error_on_unformatted = false` to suppress \
68              the warning against comments or string literals\n"
69         } else {
70             ""
71         }
72     }
73
74     // (space, target)
75     pub(crate) fn format_len(&self) -> (usize, usize) {
76         match self.kind {
77             ErrorKind::LineOverflow(found, max) => (max, found - max),
78             ErrorKind::TrailingWhitespace
79             | ErrorKind::DeprecatedAttr
80             | ErrorKind::BadAttr
81             | ErrorKind::LostComment => {
82                 let trailing_ws_start = self
83                     .line_buffer
84                     .rfind(|c: char| !c.is_whitespace())
85                     .map(|pos| pos + 1)
86                     .unwrap_or(0);
87                 (
88                     trailing_ws_start,
89                     self.line_buffer.len() - trailing_ws_start,
90                 )
91             }
92             _ => unreachable!(),
93         }
94     }
95 }
96
97 pub(crate) type FormatErrorMap = HashMap<FileName, Vec<FormattingError>>;
98
99 #[derive(Default, Debug)]
100 pub(crate) struct ReportedErrors {
101     pub(crate) has_operational_errors: bool,
102     pub(crate) has_check_errors: bool,
103 }
104
105 fn should_emit_verbose<F>(is_stdin: bool, config: &Config, f: F)
106 where
107     F: Fn(),
108 {
109     if config.verbose() == Verbosity::Verbose && !is_stdin {
110         f();
111     }
112 }
113
114 /// Returns true if the line with the given line number was skipped by `#[rustfmt::skip]`.
115 fn is_skipped_line(line_number: usize, skipped_range: &[(usize, usize)]) -> bool {
116     skipped_range
117         .iter()
118         .any(|&(lo, hi)| lo <= line_number && line_number <= hi)
119 }
120
121 fn should_report_error(
122     config: &Config,
123     char_kind: FullCodeCharKind,
124     is_string: bool,
125     error_kind: &ErrorKind,
126 ) -> bool {
127     let allow_error_report = if char_kind.is_comment() || is_string || error_kind.is_comment() {
128         config.error_on_unformatted()
129     } else {
130         true
131     };
132
133     match error_kind {
134         ErrorKind::LineOverflow(..) => config.error_on_line_overflow() && allow_error_report,
135         ErrorKind::TrailingWhitespace | ErrorKind::LostComment => allow_error_report,
136         _ => true,
137     }
138 }
139
140 // Formatting done on a char by char or line by line basis.
141 // FIXME(#20) other stuff for parity with make tidy
142 fn format_lines(
143     text: &mut String,
144     name: &FileName,
145     skipped_range: &[(usize, usize)],
146     config: &Config,
147     report: &FormatReport,
148 ) {
149     let mut last_was_space = false;
150     let mut line_len = 0;
151     let mut cur_line = 1;
152     let mut newline_count = 0;
153     let mut errors = vec![];
154     let mut issue_seeker = BadIssueSeeker::new(config.report_todo(), config.report_fixme());
155     let mut line_buffer = String::with_capacity(config.max_width() * 2);
156     let mut is_string = false; // true if the current line contains a string literal.
157     let mut format_line = config.file_lines().contains_line(name, cur_line);
158     let allow_issue_seek = !issue_seeker.is_disabled();
159
160     // Check license.
161     if let Some(ref license_template) = config.license_template {
162         if !license_template.is_match(text) {
163             errors.push(FormattingError {
164                 line: cur_line,
165                 kind: ErrorKind::LicenseCheck,
166                 is_comment: false,
167                 is_string: false,
168                 line_buffer: String::new(),
169             });
170         }
171     }
172
173     // Iterate over the chars in the file map.
174     for (kind, c) in CharClasses::new(text.chars()) {
175         if c == '\r' {
176             continue;
177         }
178
179         if allow_issue_seek && format_line {
180             // Add warnings for bad todos/ fixmes
181             if let Some(issue) = issue_seeker.inspect(c) {
182                 errors.push(FormattingError {
183                     line: cur_line,
184                     kind: ErrorKind::BadIssue(issue),
185                     is_comment: false,
186                     is_string: false,
187                     line_buffer: String::new(),
188                 });
189             }
190         }
191
192         if c == '\n' {
193             if format_line {
194                 // Check for (and record) trailing whitespace.
195                 if last_was_space {
196                     if should_report_error(config, kind, is_string, &ErrorKind::TrailingWhitespace)
197                         && !is_skipped_line(cur_line, skipped_range)
198                     {
199                         errors.push(FormattingError {
200                             line: cur_line,
201                             kind: ErrorKind::TrailingWhitespace,
202                             is_comment: kind.is_comment(),
203                             is_string: kind.is_string(),
204                             line_buffer: line_buffer.clone(),
205                         });
206                     }
207                     line_len -= 1;
208                 }
209
210                 // Check for any line width errors we couldn't correct.
211                 let error_kind = ErrorKind::LineOverflow(line_len, config.max_width());
212                 if line_len > config.max_width()
213                     && !is_skipped_line(cur_line, skipped_range)
214                     && should_report_error(config, kind, is_string, &error_kind)
215                 {
216                     errors.push(FormattingError {
217                         line: cur_line,
218                         kind: error_kind,
219                         is_comment: kind.is_comment(),
220                         is_string,
221                         line_buffer: line_buffer.clone(),
222                     });
223                 }
224             }
225
226             line_len = 0;
227             cur_line += 1;
228             format_line = config.file_lines().contains_line(name, cur_line);
229             newline_count += 1;
230             last_was_space = false;
231             line_buffer.clear();
232             is_string = false;
233         } else {
234             newline_count = 0;
235             line_len += if c == '\t' { config.tab_spaces() } else { 1 };
236             last_was_space = c.is_whitespace();
237             line_buffer.push(c);
238             if kind.is_string() {
239                 is_string = true;
240             }
241         }
242     }
243
244     if newline_count > 1 {
245         debug!("track truncate: {} {}", text.len(), newline_count);
246         let line = text.len() - newline_count + 1;
247         text.truncate(line);
248     }
249
250     report.append(name.clone(), errors);
251 }
252
253 fn parse_input<'sess>(
254     input: Input,
255     parse_session: &'sess ParseSess,
256     config: &Config,
257 ) -> Result<ast::Crate, ParseError<'sess>> {
258     let mut parser = match input {
259         Input::File(file) => parse::new_parser_from_file(parse_session, &file),
260         Input::Text(text) => parse::new_parser_from_source_str(
261             parse_session,
262             syntax::codemap::FileName::Custom("stdin".to_owned()),
263             text,
264         ),
265     };
266
267     parser.cfg_mods = false;
268     if config.skip_children() {
269         parser.recurse_into_file_modules = false;
270     }
271
272     let mut parser = AssertUnwindSafe(parser);
273     let result = catch_unwind(move || parser.0.parse_crate_mod());
274
275     match result {
276         Ok(Ok(c)) => {
277             if parse_session.span_diagnostic.has_errors() {
278                 // Bail out if the parser recovered from an error.
279                 Err(ParseError::Recovered)
280             } else {
281                 Ok(c)
282             }
283         }
284         Ok(Err(e)) => Err(ParseError::Error(e)),
285         Err(_) => Err(ParseError::Panic),
286     }
287 }
288
289 /// All the ways that parsing can fail.
290 enum ParseError<'sess> {
291     /// There was an error, but the parser recovered.
292     Recovered,
293     /// There was an error (supplied) and parsing failed.
294     Error(DiagnosticBuilder<'sess>),
295     /// The parser panicked.
296     Panic,
297 }
298
299 impl<'b, T: Write + 'b> Session<'b, T> {
300     pub(crate) fn format_input_inner(
301         &mut self,
302         input: Input,
303     ) -> Result<(FileMap, FormatReport), ErrorKind> {
304         syntax_pos::hygiene::set_default_edition(self.config.edition().to_libsyntax_pos_edition());
305
306         if self.config.disable_all_formatting() {
307             // When the input is from stdin, echo back the input.
308             if let Input::Text(ref buf) = input {
309                 if let Err(e) = io::stdout().write_all(buf.as_bytes()) {
310                     return Err(From::from(e));
311                 }
312             }
313             return Ok((FileMap::new(), FormatReport::new()));
314         }
315
316         let input_is_stdin = input.is_text();
317         let mut filemap = FileMap::new();
318         // TODO split Session? out vs config - but what about summary?
319         //  - look at error handling
320         let format_result = self.format_ast(input, |this, path, mut result| {
321             if let Some(ref mut out) = this.out {
322                 // TODO pull out the has_diff return value
323                 match filemap::write_file(&mut result, &path, out, &this.config) {
324                     Ok(b) if b => this.summary.add_diff(),
325                     Err(e) => {
326                         // Create a new error with path_str to help users see which files failed
327                         let err_msg = format!("{}: {}", path, e);
328                         return Err(io::Error::new(e.kind(), err_msg).into());
329                     }
330                     _ => {}
331                 }
332             }
333
334             filemap.push((path, result));
335             Ok(())
336         });
337
338         should_emit_verbose(input_is_stdin, &self.config, || {
339             fn duration_to_f32(d: Duration) -> f32 {
340                 d.as_secs() as f32 + d.subsec_nanos() as f32 / 1_000_000_000f32
341             }
342
343             println!(
344                 "Spent {0:.3} secs in the parsing phase, and {1:.3} secs in the formatting phase",
345                 duration_to_f32(self.get_parse_time().unwrap()),
346                 duration_to_f32(self.get_format_time().unwrap()),
347             )
348         });
349
350         format_result.map(|r| (filemap, r))
351     }
352
353     // TODO name, only uses config and summary
354     // Formatting which depends on the AST.
355     fn format_ast<F>(
356         &mut self,
357         input: Input,
358         mut formatted_file: F,
359     ) -> Result<FormatReport, ErrorKind>
360     where
361         F: FnMut(&mut Session<T>, FileName, String) -> Result<(), ErrorKind>,
362     {
363         let main_file = match input {
364             Input::File(ref file) => FileName::Real(file.clone()),
365             Input::Text(..) => FileName::Stdin,
366         };
367
368         // Parse the crate.
369         let codemap = Rc::new(CodeMap::new(FilePathMapping::empty()));
370         let mut parse_session = self.make_parse_sess(codemap.clone());
371         let krate = match parse_input(input, &parse_session, &self.config) {
372             Ok(krate) => krate,
373             Err(err) => {
374                 match err {
375                     ParseError::Error(mut diagnostic) => diagnostic.emit(),
376                     ParseError::Panic => {
377                         // Note that if you see this message and want more information,
378                         // then go to `parse_input` and run the parse function without
379                         // `catch_unwind` so rustfmt panics and you can get a backtrace.
380                         should_emit_verbose(main_file != FileName::Stdin, &self.config, || {
381                             println!("The Rust parser panicked")
382                         });
383                     }
384                     ParseError::Recovered => {}
385                 }
386                 self.summary.add_parsing_error();
387                 return Err(ErrorKind::ParseError);
388             }
389         };
390         self.timer = self.timer.done_parsing();
391
392         // Suppress error output if we have to do any further parsing.
393         let silent_emitter = Box::new(EmitterWriter::new(
394             Box::new(Vec::new()),
395             Some(codemap.clone()),
396             false,
397             false,
398         ));
399         parse_session.span_diagnostic = Handler::with_emitter(true, false, silent_emitter);
400
401         let report = FormatReport::new();
402
403         let skip_children = self.config.skip_children();
404         for (path, module) in modules::list_files(&krate, parse_session.codemap())? {
405             if (skip_children && path != main_file) || self.config.ignore().skip_file(&path) {
406                 continue;
407             }
408             should_emit_verbose(main_file != FileName::Stdin, &self.config, || {
409                 println!("Formatting {}", path)
410             });
411             let filemap = parse_session
412                 .codemap()
413                 .lookup_char_pos(module.inner.lo())
414                 .file;
415             let big_snippet = filemap.src.as_ref().unwrap();
416             let snippet_provider = SnippetProvider::new(filemap.start_pos, big_snippet);
417             let mut visitor = FmtVisitor::from_codemap(
418                 &parse_session,
419                 &self.config,
420                 &snippet_provider,
421                 report.clone(),
422             );
423             // Format inner attributes if available.
424             if !krate.attrs.is_empty() && path == main_file {
425                 visitor.skip_empty_lines(filemap.end_pos);
426                 if visitor.visit_attrs(&krate.attrs, ast::AttrStyle::Inner) {
427                     visitor.push_rewrite(module.inner, None);
428                 } else {
429                     visitor.format_separate_mod(module, &*filemap);
430                 }
431             } else {
432                 visitor.last_pos = filemap.start_pos;
433                 visitor.skip_empty_lines(filemap.end_pos);
434                 visitor.format_separate_mod(module, &*filemap);
435             };
436
437             debug_assert_eq!(
438                 visitor.line_number,
439                 ::utils::count_newlines(&visitor.buffer)
440             );
441
442             // For some reason, the codemap does not include terminating
443             // newlines so we must add one on for each file. This is sad.
444             filemap::append_newline(&mut visitor.buffer);
445
446             format_lines(
447                 &mut visitor.buffer,
448                 &path,
449                 &visitor.skipped_range,
450                 &self.config,
451                 &report,
452             );
453             self.replace_with_system_newlines(&mut visitor.buffer);
454
455             if visitor.macro_rewrite_failure {
456                 self.summary.add_macro_foramt_failure();
457             }
458
459             formatted_file(self, path, visitor.buffer)?;
460         }
461         self.timer = self.timer.done_formatting();
462
463         if report.has_warnings() {
464             self.summary.add_formatting_error();
465         }
466         {
467             let report_errs = &report.internal.borrow().1;
468             if report_errs.has_check_errors {
469                 self.summary.add_check_error();
470             }
471             if report_errs.has_operational_errors {
472                 self.summary.add_operational_error();
473             }
474         }
475
476         Ok(report)
477     }
478
479     fn make_parse_sess(&self, codemap: Rc<CodeMap>) -> ParseSess {
480         let tty_handler = if self.config.hide_parse_errors() {
481             let silent_emitter = Box::new(EmitterWriter::new(
482                 Box::new(Vec::new()),
483                 Some(codemap.clone()),
484                 false,
485                 false,
486             ));
487             Handler::with_emitter(true, false, silent_emitter)
488         } else {
489             let supports_color = term::stderr().map_or(false, |term| term.supports_color());
490             let color_cfg = if supports_color {
491                 ColorConfig::Auto
492             } else {
493                 ColorConfig::Never
494             };
495             Handler::with_tty_emitter(color_cfg, true, false, Some(codemap.clone()))
496         };
497
498         ParseSess::with_span_handler(tty_handler, codemap)
499     }
500
501     fn replace_with_system_newlines(&self, text: &mut String) -> () {
502         let style = if self.config.newline_style() == NewlineStyle::Native {
503             if cfg!(windows) {
504                 NewlineStyle::Windows
505             } else {
506                 NewlineStyle::Unix
507             }
508         } else {
509             self.config.newline_style()
510         };
511
512         match style {
513             NewlineStyle::Unix => return,
514             NewlineStyle::Windows => {
515                 let mut transformed = String::with_capacity(text.capacity());
516                 for c in text.chars() {
517                     match c {
518                         '\n' => transformed.push_str("\r\n"),
519                         '\r' => continue,
520                         c => transformed.push(c),
521                     }
522                 }
523                 *text = transformed;
524             }
525             NewlineStyle::Native => unreachable!(),
526         }
527     }
528
529     /// Returns the time it took to parse the source files in nanoseconds.
530     fn get_parse_time(&self) -> Option<Duration> {
531         match self.timer {
532             Timer::DoneParsing(init, parse_time) | Timer::DoneFormatting(init, parse_time, _) => {
533                 // This should never underflow since `Instant::now()` guarantees monotonicity.
534                 Some(parse_time.duration_since(init))
535             }
536             Timer::Initialized(..) => None,
537         }
538     }
539
540     /// Returns the time it took to go from the parsed AST to the formatted output. Parsing time is
541     /// not included.
542     fn get_format_time(&self) -> Option<Duration> {
543         match self.timer {
544             Timer::DoneFormatting(_init, parse_time, format_time) => {
545                 Some(format_time.duration_since(parse_time))
546             }
547             Timer::DoneParsing(..) | Timer::Initialized(..) => None,
548         }
549     }
550 }
551
552 /// A single span of changed lines, with 0 or more removed lines
553 /// and a vector of 0 or more inserted lines.
554 #[derive(Debug, PartialEq, Eq)]
555 pub(crate) struct ModifiedChunk {
556     /// The first to be removed from the original text
557     pub line_number_orig: u32,
558     /// The number of lines which have been replaced
559     pub lines_removed: u32,
560     /// The new lines
561     pub lines: Vec<String>,
562 }
563
564 /// Set of changed sections of a file.
565 #[derive(Debug, PartialEq, Eq)]
566 pub(crate) struct ModifiedLines {
567     /// The set of changed chunks.
568     pub chunks: Vec<ModifiedChunk>,
569 }
570
571 #[derive(Clone, Copy, Debug)]
572 pub(crate) enum Timer {
573     Initialized(Instant),
574     DoneParsing(Instant, Instant),
575     DoneFormatting(Instant, Instant, Instant),
576 }
577
578 impl Timer {
579     fn done_parsing(self) -> Self {
580         match self {
581             Timer::Initialized(init_time) => Timer::DoneParsing(init_time, Instant::now()),
582             _ => panic!("Timer can only transition to DoneParsing from Initialized state"),
583         }
584     }
585
586     fn done_formatting(self) -> Self {
587         match self {
588             Timer::DoneParsing(init_time, parse_time) => {
589                 Timer::DoneFormatting(init_time, parse_time, Instant::now())
590             }
591             _ => panic!("Timer can only transition to DoneFormatting from DoneParsing state"),
592         }
593     }
594 }
595
596 /// A summary of a Rustfmt run.
597 #[derive(Debug, Default, Clone, Copy)]
598 pub struct Summary {
599     // Encountered e.g. an IO error.
600     has_operational_errors: bool,
601
602     // Failed to reformat code because of parsing errors.
603     has_parsing_errors: bool,
604
605     // Code is valid, but it is impossible to format it properly.
606     has_formatting_errors: bool,
607
608     // Code contains macro call that was unable to format.
609     pub(crate) has_macro_format_failure: bool,
610
611     // Failed a check, such as the license check or other opt-in checking.
612     has_check_errors: bool,
613
614     /// Formatted code differs from existing code (--check only).
615     pub has_diff: bool,
616 }
617
618 impl Summary {
619     pub fn has_operational_errors(&self) -> bool {
620         self.has_operational_errors
621     }
622
623     pub fn has_parsing_errors(&self) -> bool {
624         self.has_parsing_errors
625     }
626
627     pub fn has_formatting_errors(&self) -> bool {
628         self.has_formatting_errors
629     }
630
631     pub fn has_check_errors(&self) -> bool {
632         self.has_check_errors
633     }
634
635     pub(crate) fn has_macro_formatting_failure(&self) -> bool {
636         self.has_macro_format_failure
637     }
638
639     pub fn add_operational_error(&mut self) {
640         self.has_operational_errors = true;
641     }
642
643     pub(crate) fn add_parsing_error(&mut self) {
644         self.has_parsing_errors = true;
645     }
646
647     pub(crate) fn add_formatting_error(&mut self) {
648         self.has_formatting_errors = true;
649     }
650
651     pub(crate) fn add_check_error(&mut self) {
652         self.has_check_errors = true;
653     }
654
655     pub(crate) fn add_diff(&mut self) {
656         self.has_diff = true;
657     }
658
659     pub(crate) fn add_macro_foramt_failure(&mut self) {
660         self.has_macro_format_failure = true;
661     }
662
663     pub fn has_no_errors(&self) -> bool {
664         !(self.has_operational_errors
665             || self.has_parsing_errors
666             || self.has_formatting_errors
667             || self.has_diff)
668     }
669
670     /// Combine two summaries together.
671     pub fn add(&mut self, other: Summary) {
672         self.has_operational_errors |= other.has_operational_errors;
673         self.has_formatting_errors |= other.has_formatting_errors;
674         self.has_parsing_errors |= other.has_parsing_errors;
675         self.has_check_errors |= other.has_check_errors;
676         self.has_diff |= other.has_diff;
677     }
678 }