]> git.lizzy.rs Git - rust.git/blob - clippy_lints/src/strings.rs
Rollup merge of #97798 - WaffleLapkin:allow_for_suggestions_that_are_quite_far_away_f...
[rust.git] / clippy_lints / src / strings.rs
1 use clippy_utils::diagnostics::{span_lint, span_lint_and_help, span_lint_and_sugg};
2 use clippy_utils::source::{snippet, snippet_with_applicability};
3 use clippy_utils::ty::is_type_diagnostic_item;
4 use clippy_utils::{get_parent_expr, is_lint_allowed, match_function_call, method_calls, paths};
5 use clippy_utils::{peel_blocks, SpanlessEq};
6 use if_chain::if_chain;
7 use rustc_errors::Applicability;
8 use rustc_hir::def_id::DefId;
9 use rustc_hir::{BinOpKind, BorrowKind, Expr, ExprKind, LangItem, QPath};
10 use rustc_lint::{LateContext, LateLintPass, LintContext};
11 use rustc_middle::lint::in_external_macro;
12 use rustc_middle::ty;
13 use rustc_session::{declare_lint_pass, declare_tool_lint};
14 use rustc_span::source_map::Spanned;
15 use rustc_span::sym;
16
17 declare_clippy_lint! {
18     /// ### What it does
19     /// Checks for string appends of the form `x = x + y` (without
20     /// `let`!).
21     ///
22     /// ### Why is this bad?
23     /// It's not really bad, but some people think that the
24     /// `.push_str(_)` method is more readable.
25     ///
26     /// ### Example
27     /// ```rust
28     /// let mut x = "Hello".to_owned();
29     /// x = x + ", World";
30     ///
31     /// // More readable
32     /// x += ", World";
33     /// x.push_str(", World");
34     /// ```
35     #[clippy::version = "pre 1.29.0"]
36     pub STRING_ADD_ASSIGN,
37     pedantic,
38     "using `x = x + ..` where x is a `String` instead of `push_str()`"
39 }
40
41 declare_clippy_lint! {
42     /// ### What it does
43     /// Checks for all instances of `x + _` where `x` is of type
44     /// `String`, but only if [`string_add_assign`](#string_add_assign) does *not*
45     /// match.
46     ///
47     /// ### Why is this bad?
48     /// It's not bad in and of itself. However, this particular
49     /// `Add` implementation is asymmetric (the other operand need not be `String`,
50     /// but `x` does), while addition as mathematically defined is symmetric, also
51     /// the `String::push_str(_)` function is a perfectly good replacement.
52     /// Therefore, some dislike it and wish not to have it in their code.
53     ///
54     /// That said, other people think that string addition, having a long tradition
55     /// in other languages is actually fine, which is why we decided to make this
56     /// particular lint `allow` by default.
57     ///
58     /// ### Example
59     /// ```rust
60     /// let x = "Hello".to_owned();
61     /// x + ", World";
62     /// ```
63     #[clippy::version = "pre 1.29.0"]
64     pub STRING_ADD,
65     restriction,
66     "using `x + ..` where x is a `String` instead of `push_str()`"
67 }
68
69 declare_clippy_lint! {
70     /// ### What it does
71     /// Checks for the `as_bytes` method called on string literals
72     /// that contain only ASCII characters.
73     ///
74     /// ### Why is this bad?
75     /// Byte string literals (e.g., `b"foo"`) can be used
76     /// instead. They are shorter but less discoverable than `as_bytes()`.
77     ///
78     /// ### Known problems
79     /// `"str".as_bytes()` and the suggested replacement of `b"str"` are not
80     /// equivalent because they have different types. The former is `&[u8]`
81     /// while the latter is `&[u8; 3]`. That means in general they will have a
82     /// different set of methods and different trait implementations.
83     ///
84     /// ```compile_fail
85     /// fn f(v: Vec<u8>) {}
86     ///
87     /// f("...".as_bytes().to_owned()); // works
88     /// f(b"...".to_owned()); // does not work, because arg is [u8; 3] not Vec<u8>
89     ///
90     /// fn g(r: impl std::io::Read) {}
91     ///
92     /// g("...".as_bytes()); // works
93     /// g(b"..."); // does not work
94     /// ```
95     ///
96     /// The actual equivalent of `"str".as_bytes()` with the same type is not
97     /// `b"str"` but `&b"str"[..]`, which is a great deal of punctuation and not
98     /// more readable than a function call.
99     ///
100     /// ### Example
101     /// ```rust
102     /// let bstr = "a byte string".as_bytes();
103     /// ```
104     ///
105     /// Use instead:
106     /// ```rust
107     /// let bstr = b"a byte string";
108     /// ```
109     #[clippy::version = "pre 1.29.0"]
110     pub STRING_LIT_AS_BYTES,
111     nursery,
112     "calling `as_bytes` on a string literal instead of using a byte string literal"
113 }
114
115 declare_clippy_lint! {
116     /// ### What it does
117     /// Checks for slice operations on strings
118     ///
119     /// ### Why is this bad?
120     /// UTF-8 characters span multiple bytes, and it is easy to inadvertently confuse character
121     /// counts and string indices. This may lead to panics, and should warrant some test cases
122     /// containing wide UTF-8 characters. This lint is most useful in code that should avoid
123     /// panics at all costs.
124     ///
125     /// ### Known problems
126     /// Probably lots of false positives. If an index comes from a known valid position (e.g.
127     /// obtained via `char_indices` over the same string), it is totally OK.
128     ///
129     /// # Example
130     /// ```rust,should_panic
131     /// &"Ölkanne"[1..];
132     /// ```
133     #[clippy::version = "1.58.0"]
134     pub STRING_SLICE,
135     restriction,
136     "slicing a string"
137 }
138
139 declare_lint_pass!(StringAdd => [STRING_ADD, STRING_ADD_ASSIGN, STRING_SLICE]);
140
141 impl<'tcx> LateLintPass<'tcx> for StringAdd {
142     fn check_expr(&mut self, cx: &LateContext<'tcx>, e: &'tcx Expr<'_>) {
143         if in_external_macro(cx.sess(), e.span) {
144             return;
145         }
146         match e.kind {
147             ExprKind::Binary(
148                 Spanned {
149                     node: BinOpKind::Add, ..
150                 },
151                 left,
152                 _,
153             ) => {
154                 if is_string(cx, left) {
155                     if !is_lint_allowed(cx, STRING_ADD_ASSIGN, e.hir_id) {
156                         let parent = get_parent_expr(cx, e);
157                         if let Some(p) = parent {
158                             if let ExprKind::Assign(target, _, _) = p.kind {
159                                 // avoid duplicate matches
160                                 if SpanlessEq::new(cx).eq_expr(target, left) {
161                                     return;
162                                 }
163                             }
164                         }
165                     }
166                     span_lint(
167                         cx,
168                         STRING_ADD,
169                         e.span,
170                         "you added something to a string. Consider using `String::push_str()` instead",
171                     );
172                 }
173             },
174             ExprKind::Assign(target, src, _) => {
175                 if is_string(cx, target) && is_add(cx, src, target) {
176                     span_lint(
177                         cx,
178                         STRING_ADD_ASSIGN,
179                         e.span,
180                         "you assigned the result of adding something to this string. Consider using \
181                          `String::push_str()` instead",
182                     );
183                 }
184             },
185             ExprKind::Index(target, _idx) => {
186                 let e_ty = cx.typeck_results().expr_ty(target).peel_refs();
187                 if matches!(e_ty.kind(), ty::Str) || is_type_diagnostic_item(cx, e_ty, sym::String) {
188                     span_lint(
189                         cx,
190                         STRING_SLICE,
191                         e.span,
192                         "indexing into a string may panic if the index is within a UTF-8 character",
193                     );
194                 }
195             },
196             _ => {},
197         }
198     }
199 }
200
201 fn is_string(cx: &LateContext<'_>, e: &Expr<'_>) -> bool {
202     is_type_diagnostic_item(cx, cx.typeck_results().expr_ty(e).peel_refs(), sym::String)
203 }
204
205 fn is_add(cx: &LateContext<'_>, src: &Expr<'_>, target: &Expr<'_>) -> bool {
206     match peel_blocks(src).kind {
207         ExprKind::Binary(
208             Spanned {
209                 node: BinOpKind::Add, ..
210             },
211             left,
212             _,
213         ) => SpanlessEq::new(cx).eq_expr(target, left),
214         _ => false,
215     }
216 }
217
218 declare_clippy_lint! {
219     /// ### What it does
220     /// Check if the string is transformed to byte array and casted back to string.
221     ///
222     /// ### Why is this bad?
223     /// It's unnecessary, the string can be used directly.
224     ///
225     /// ### Example
226     /// ```rust
227     /// std::str::from_utf8(&"Hello World!".as_bytes()[6..11]).unwrap();
228     /// ```
229     ///
230     /// Use instead:
231     /// ```rust
232     /// &"Hello World!"[6..11];
233     /// ```
234     #[clippy::version = "1.50.0"]
235     pub STRING_FROM_UTF8_AS_BYTES,
236     complexity,
237     "casting string slices to byte slices and back"
238 }
239
240 // Max length a b"foo" string can take
241 const MAX_LENGTH_BYTE_STRING_LIT: usize = 32;
242
243 declare_lint_pass!(StringLitAsBytes => [STRING_LIT_AS_BYTES, STRING_FROM_UTF8_AS_BYTES]);
244
245 impl<'tcx> LateLintPass<'tcx> for StringLitAsBytes {
246     fn check_expr(&mut self, cx: &LateContext<'tcx>, e: &'tcx Expr<'_>) {
247         use rustc_ast::LitKind;
248
249         if_chain! {
250             // Find std::str::converts::from_utf8
251             if let Some(args) = match_function_call(cx, e, &paths::STR_FROM_UTF8);
252
253             // Find string::as_bytes
254             if let ExprKind::AddrOf(BorrowKind::Ref, _, args) = args[0].kind;
255             if let ExprKind::Index(left, right) = args.kind;
256             let (method_names, expressions, _) = method_calls(left, 1);
257             if method_names.len() == 1;
258             if expressions.len() == 1;
259             if expressions[0].len() == 1;
260             if method_names[0] == sym!(as_bytes);
261
262             // Check for slicer
263             if let ExprKind::Struct(QPath::LangItem(LangItem::Range, ..), _, _) = right.kind;
264
265             then {
266                 let mut applicability = Applicability::MachineApplicable;
267                 let string_expression = &expressions[0][0];
268
269                 let snippet_app = snippet_with_applicability(
270                     cx,
271                     string_expression.span, "..",
272                     &mut applicability,
273                 );
274
275                 span_lint_and_sugg(
276                     cx,
277                     STRING_FROM_UTF8_AS_BYTES,
278                     e.span,
279                     "calling a slice of `as_bytes()` with `from_utf8` should be not necessary",
280                     "try",
281                     format!("Some(&{}[{}])", snippet_app, snippet(cx, right.span, "..")),
282                     applicability
283                 )
284             }
285         }
286
287         if_chain! {
288             if let ExprKind::MethodCall(path, args, _) = &e.kind;
289             if path.ident.name == sym!(as_bytes);
290             if let ExprKind::Lit(lit) = &args[0].kind;
291             if let LitKind::Str(lit_content, _) = &lit.node;
292             then {
293                 let callsite = snippet(cx, args[0].span.source_callsite(), r#""foo""#);
294                 let mut applicability = Applicability::MachineApplicable;
295                 if callsite.starts_with("include_str!") {
296                     span_lint_and_sugg(
297                         cx,
298                         STRING_LIT_AS_BYTES,
299                         e.span,
300                         "calling `as_bytes()` on `include_str!(..)`",
301                         "consider using `include_bytes!(..)` instead",
302                         snippet_with_applicability(cx, args[0].span, r#""foo""#, &mut applicability).replacen(
303                             "include_str",
304                             "include_bytes",
305                             1,
306                         ),
307                         applicability,
308                     );
309                 } else if lit_content.as_str().is_ascii()
310                     && lit_content.as_str().len() <= MAX_LENGTH_BYTE_STRING_LIT
311                     && !args[0].span.from_expansion()
312                 {
313                     span_lint_and_sugg(
314                         cx,
315                         STRING_LIT_AS_BYTES,
316                         e.span,
317                         "calling `as_bytes()` on a string literal",
318                         "consider using a byte string literal instead",
319                         format!(
320                             "b{}",
321                             snippet_with_applicability(cx, args[0].span, r#""foo""#, &mut applicability)
322                         ),
323                         applicability,
324                     );
325                 }
326             }
327         }
328
329         if_chain! {
330             if let ExprKind::MethodCall(path, [recv], _) = &e.kind;
331             if path.ident.name == sym!(into_bytes);
332             if let ExprKind::MethodCall(path, [recv], _) = &recv.kind;
333             if matches!(path.ident.name.as_str(), "to_owned" | "to_string");
334             if let ExprKind::Lit(lit) = &recv.kind;
335             if let LitKind::Str(lit_content, _) = &lit.node;
336
337             if lit_content.as_str().is_ascii();
338             if lit_content.as_str().len() <= MAX_LENGTH_BYTE_STRING_LIT;
339             if !recv.span.from_expansion();
340             then {
341                 let mut applicability = Applicability::MachineApplicable;
342
343                 span_lint_and_sugg(
344                     cx,
345                     STRING_LIT_AS_BYTES,
346                     e.span,
347                     "calling `into_bytes()` on a string literal",
348                     "consider using a byte string literal instead",
349                     format!(
350                         "b{}.to_vec()",
351                         snippet_with_applicability(cx, recv.span, r#""..""#, &mut applicability)
352                     ),
353                     applicability,
354                 );
355             }
356         }
357     }
358 }
359
360 declare_clippy_lint! {
361     /// ### What it does
362     /// This lint checks for `.to_string()` method calls on values of type `&str`.
363     ///
364     /// ### Why is this bad?
365     /// The `to_string` method is also used on other types to convert them to a string.
366     /// When called on a `&str` it turns the `&str` into the owned variant `String`, which can be better
367     /// expressed with `.to_owned()`.
368     ///
369     /// ### Example
370     /// ```rust
371     /// // example code where clippy issues a warning
372     /// let _ = "str".to_string();
373     /// ```
374     /// Use instead:
375     /// ```rust
376     /// // example code which does not raise clippy warning
377     /// let _ = "str".to_owned();
378     /// ```
379     #[clippy::version = "pre 1.29.0"]
380     pub STR_TO_STRING,
381     restriction,
382     "using `to_string()` on a `&str`, which should be `to_owned()`"
383 }
384
385 declare_lint_pass!(StrToString => [STR_TO_STRING]);
386
387 impl<'tcx> LateLintPass<'tcx> for StrToString {
388     fn check_expr(&mut self, cx: &LateContext<'tcx>, expr: &Expr<'_>) {
389         if_chain! {
390             if let ExprKind::MethodCall(path, [self_arg, ..], _) = &expr.kind;
391             if path.ident.name == sym!(to_string);
392             let ty = cx.typeck_results().expr_ty(self_arg);
393             if let ty::Ref(_, ty, ..) = ty.kind();
394             if *ty.kind() == ty::Str;
395             then {
396                 span_lint_and_help(
397                     cx,
398                     STR_TO_STRING,
399                     expr.span,
400                     "`to_string()` called on a `&str`",
401                     None,
402                     "consider using `.to_owned()`",
403                 );
404             }
405         }
406     }
407 }
408
409 declare_clippy_lint! {
410     /// ### What it does
411     /// This lint checks for `.to_string()` method calls on values of type `String`.
412     ///
413     /// ### Why is this bad?
414     /// The `to_string` method is also used on other types to convert them to a string.
415     /// When called on a `String` it only clones the `String`, which can be better expressed with `.clone()`.
416     ///
417     /// ### Example
418     /// ```rust
419     /// // example code where clippy issues a warning
420     /// let msg = String::from("Hello World");
421     /// let _ = msg.to_string();
422     /// ```
423     /// Use instead:
424     /// ```rust
425     /// // example code which does not raise clippy warning
426     /// let msg = String::from("Hello World");
427     /// let _ = msg.clone();
428     /// ```
429     #[clippy::version = "pre 1.29.0"]
430     pub STRING_TO_STRING,
431     restriction,
432     "using `to_string()` on a `String`, which should be `clone()`"
433 }
434
435 declare_lint_pass!(StringToString => [STRING_TO_STRING]);
436
437 impl<'tcx> LateLintPass<'tcx> for StringToString {
438     fn check_expr(&mut self, cx: &LateContext<'tcx>, expr: &Expr<'_>) {
439         if_chain! {
440             if let ExprKind::MethodCall(path, [self_arg, ..], _) = &expr.kind;
441             if path.ident.name == sym!(to_string);
442             let ty = cx.typeck_results().expr_ty(self_arg);
443             if is_type_diagnostic_item(cx, ty, sym::String);
444             then {
445                 span_lint_and_help(
446                     cx,
447                     STRING_TO_STRING,
448                     expr.span,
449                     "`to_string()` called on a `String`",
450                     None,
451                     "consider using `.clone()`",
452                 );
453             }
454         }
455     }
456 }
457
458 declare_clippy_lint! {
459     /// ### What it does
460     /// Warns about calling `str::trim` (or variants) before `str::split_whitespace`.
461     ///
462     /// ### Why is this bad?
463     /// `split_whitespace` already ignores leading and trailing whitespace.
464     ///
465     /// ### Example
466     /// ```rust
467     /// " A B C ".trim().split_whitespace();
468     /// ```
469     /// Use instead:
470     /// ```rust
471     /// " A B C ".split_whitespace();
472     /// ```
473     #[clippy::version = "1.62.0"]
474     pub TRIM_SPLIT_WHITESPACE,
475     style,
476     "using `str::trim()` or alike before `str::split_whitespace`"
477 }
478 declare_lint_pass!(TrimSplitWhitespace => [TRIM_SPLIT_WHITESPACE]);
479
480 impl<'tcx> LateLintPass<'tcx> for TrimSplitWhitespace {
481     fn check_expr(&mut self, cx: &LateContext<'tcx>, expr: &Expr<'_>) {
482         let tyckres = cx.typeck_results();
483         if_chain! {
484             if let ExprKind::MethodCall(path, [split_recv], split_ws_span) = expr.kind;
485             if path.ident.name == sym!(split_whitespace);
486             if let Some(split_ws_def_id) = tyckres.type_dependent_def_id(expr.hir_id);
487             if cx.tcx.is_diagnostic_item(sym::str_split_whitespace, split_ws_def_id);
488             if let ExprKind::MethodCall(path, [_trim_recv], trim_span) = split_recv.kind;
489             if let trim_fn_name @ ("trim" | "trim_start" | "trim_end") = path.ident.name.as_str();
490             if let Some(trim_def_id) = tyckres.type_dependent_def_id(split_recv.hir_id);
491             if is_one_of_trim_diagnostic_items(cx, trim_def_id);
492             then {
493                 span_lint_and_sugg(
494                     cx,
495                     TRIM_SPLIT_WHITESPACE,
496                     trim_span.with_hi(split_ws_span.lo()),
497                     &format!("found call to `str::{}` before `str::split_whitespace`", trim_fn_name),
498                     &format!("remove `{}()`", trim_fn_name),
499                     String::new(),
500                     Applicability::MachineApplicable,
501                 );
502             }
503         }
504     }
505 }
506
507 fn is_one_of_trim_diagnostic_items(cx: &LateContext<'_>, trim_def_id: DefId) -> bool {
508     cx.tcx.is_diagnostic_item(sym::str_trim, trim_def_id)
509         || cx.tcx.is_diagnostic_item(sym::str_trim_start, trim_def_id)
510         || cx.tcx.is_diagnostic_item(sym::str_trim_end, trim_def_id)
511 }