]> git.lizzy.rs Git - rust.git/blob - library/core/src/str/mod.rs
ba495a1a9fbe4b6421315e526543efee6ae35702
[rust.git] / library / core / src / str / mod.rs
1 //! String manipulation.
2 //!
3 //! For more details, see the [`std::str`] module.
4 //!
5 //! [`std::str`]: ../../std/str/index.html
6
7 #![stable(feature = "rust1", since = "1.0.0")]
8
9 mod converts;
10 mod error;
11 mod iter;
12 mod traits;
13 mod validations;
14
15 use self::pattern::Pattern;
16 use self::pattern::{DoubleEndedSearcher, ReverseSearcher, Searcher};
17
18 use crate::char;
19 use crate::mem;
20 use crate::slice::{self, SliceIndex};
21
22 pub mod pattern;
23
24 #[unstable(feature = "str_internals", issue = "none")]
25 #[allow(missing_docs)]
26 pub mod lossy;
27
28 #[stable(feature = "rust1", since = "1.0.0")]
29 pub use converts::{from_utf8, from_utf8_unchecked};
30
31 #[stable(feature = "str_mut_extras", since = "1.20.0")]
32 pub use converts::{from_utf8_mut, from_utf8_unchecked_mut};
33
34 #[stable(feature = "rust1", since = "1.0.0")]
35 pub use error::{ParseBoolError, Utf8Error};
36
37 #[stable(feature = "rust1", since = "1.0.0")]
38 pub use traits::FromStr;
39
40 #[stable(feature = "rust1", since = "1.0.0")]
41 pub use iter::{Bytes, CharIndices, Chars, Lines, SplitWhitespace};
42
43 #[stable(feature = "rust1", since = "1.0.0")]
44 #[allow(deprecated)]
45 pub use iter::LinesAny;
46
47 #[stable(feature = "rust1", since = "1.0.0")]
48 pub use iter::{RSplit, RSplitTerminator, Split, SplitTerminator};
49
50 #[stable(feature = "rust1", since = "1.0.0")]
51 pub use iter::{RSplitN, SplitN};
52
53 #[stable(feature = "str_matches", since = "1.2.0")]
54 pub use iter::{Matches, RMatches};
55
56 #[stable(feature = "str_match_indices", since = "1.5.0")]
57 pub use iter::{MatchIndices, RMatchIndices};
58
59 #[stable(feature = "encode_utf16", since = "1.8.0")]
60 pub use iter::EncodeUtf16;
61
62 #[stable(feature = "str_escape", since = "1.34.0")]
63 pub use iter::{EscapeDebug, EscapeDefault, EscapeUnicode};
64
65 #[stable(feature = "split_ascii_whitespace", since = "1.34.0")]
66 pub use iter::SplitAsciiWhitespace;
67
68 #[unstable(feature = "split_inclusive", issue = "72360")]
69 use iter::SplitInclusive;
70
71 #[unstable(feature = "str_internals", issue = "none")]
72 pub use validations::next_code_point;
73
74 use iter::MatchIndicesInternal;
75 use iter::SplitInternal;
76 use iter::{MatchesInternal, SplitNInternal};
77
78 use validations::truncate_to_char_boundary;
79
80 #[inline(never)]
81 #[cold]
82 #[track_caller]
83 fn slice_error_fail(s: &str, begin: usize, end: usize) -> ! {
84     const MAX_DISPLAY_LENGTH: usize = 256;
85     let (truncated, s_trunc) = truncate_to_char_boundary(s, MAX_DISPLAY_LENGTH);
86     let ellipsis = if truncated { "[...]" } else { "" };
87
88     // 1. out of bounds
89     if begin > s.len() || end > s.len() {
90         let oob_index = if begin > s.len() { begin } else { end };
91         panic!("byte index {} is out of bounds of `{}`{}", oob_index, s_trunc, ellipsis);
92     }
93
94     // 2. begin <= end
95     assert!(
96         begin <= end,
97         "begin <= end ({} <= {}) when slicing `{}`{}",
98         begin,
99         end,
100         s_trunc,
101         ellipsis
102     );
103
104     // 3. character boundary
105     let index = if !s.is_char_boundary(begin) { begin } else { end };
106     // find the character
107     let mut char_start = index;
108     while !s.is_char_boundary(char_start) {
109         char_start -= 1;
110     }
111     // `char_start` must be less than len and a char boundary
112     let ch = s[char_start..].chars().next().unwrap();
113     let char_range = char_start..char_start + ch.len_utf8();
114     panic!(
115         "byte index {} is not a char boundary; it is inside {:?} (bytes {:?}) of `{}`{}",
116         index, ch, char_range, s_trunc, ellipsis
117     );
118 }
119
120 #[lang = "str"]
121 #[cfg(not(test))]
122 impl str {
123     /// Returns the length of `self`.
124     ///
125     /// This length is in bytes, not [`char`]s or graphemes. In other words,
126     /// it may not be what a human considers the length of the string.
127     ///
128     /// [`char`]: prim@char
129     ///
130     /// # Examples
131     ///
132     /// Basic usage:
133     ///
134     /// ```
135     /// let len = "foo".len();
136     /// assert_eq!(3, len);
137     ///
138     /// assert_eq!("ƒoo".len(), 4); // fancy f!
139     /// assert_eq!("ƒoo".chars().count(), 3);
140     /// ```
141     #[doc(alias = "length")]
142     #[stable(feature = "rust1", since = "1.0.0")]
143     #[rustc_const_stable(feature = "const_str_len", since = "1.32.0")]
144     #[inline]
145     pub const fn len(&self) -> usize {
146         self.as_bytes().len()
147     }
148
149     /// Returns `true` if `self` has a length of zero bytes.
150     ///
151     /// # Examples
152     ///
153     /// Basic usage:
154     ///
155     /// ```
156     /// let s = "";
157     /// assert!(s.is_empty());
158     ///
159     /// let s = "not empty";
160     /// assert!(!s.is_empty());
161     /// ```
162     #[inline]
163     #[stable(feature = "rust1", since = "1.0.0")]
164     #[rustc_const_stable(feature = "const_str_is_empty", since = "1.32.0")]
165     pub const fn is_empty(&self) -> bool {
166         self.len() == 0
167     }
168
169     /// Checks that `index`-th byte is the first byte in a UTF-8 code point
170     /// sequence or the end of the string.
171     ///
172     /// The start and end of the string (when `index == self.len()`) are
173     /// considered to be boundaries.
174     ///
175     /// Returns `false` if `index` is greater than `self.len()`.
176     ///
177     /// # Examples
178     ///
179     /// ```
180     /// let s = "Löwe 老虎 Léopard";
181     /// assert!(s.is_char_boundary(0));
182     /// // start of `老`
183     /// assert!(s.is_char_boundary(6));
184     /// assert!(s.is_char_boundary(s.len()));
185     ///
186     /// // second byte of `ö`
187     /// assert!(!s.is_char_boundary(2));
188     ///
189     /// // third byte of `老`
190     /// assert!(!s.is_char_boundary(8));
191     /// ```
192     #[stable(feature = "is_char_boundary", since = "1.9.0")]
193     #[inline]
194     pub fn is_char_boundary(&self, index: usize) -> bool {
195         // 0 and len are always ok.
196         // Test for 0 explicitly so that it can optimize out the check
197         // easily and skip reading string data for that case.
198         if index == 0 || index == self.len() {
199             return true;
200         }
201         match self.as_bytes().get(index) {
202             None => false,
203             // This is bit magic equivalent to: b < 128 || b >= 192
204             Some(&b) => (b as i8) >= -0x40,
205         }
206     }
207
208     /// Converts a string slice to a byte slice. To convert the byte slice back
209     /// into a string slice, use the [`from_utf8`] function.
210     ///
211     /// # Examples
212     ///
213     /// Basic usage:
214     ///
215     /// ```
216     /// let bytes = "bors".as_bytes();
217     /// assert_eq!(b"bors", bytes);
218     /// ```
219     #[stable(feature = "rust1", since = "1.0.0")]
220     #[rustc_const_stable(feature = "str_as_bytes", since = "1.32.0")]
221     #[inline(always)]
222     #[allow(unused_attributes)]
223     #[rustc_allow_const_fn_unstable(const_fn_transmute)]
224     pub const fn as_bytes(&self) -> &[u8] {
225         // SAFETY: const sound because we transmute two types with the same layout
226         unsafe { mem::transmute(self) }
227     }
228
229     /// Converts a mutable string slice to a mutable byte slice.
230     ///
231     /// # Safety
232     ///
233     /// The caller must ensure that the content of the slice is valid UTF-8
234     /// before the borrow ends and the underlying `str` is used.
235     ///
236     /// Use of a `str` whose contents are not valid UTF-8 is undefined behavior.
237     ///
238     /// # Examples
239     ///
240     /// Basic usage:
241     ///
242     /// ```
243     /// let mut s = String::from("Hello");
244     /// let bytes = unsafe { s.as_bytes_mut() };
245     ///
246     /// assert_eq!(b"Hello", bytes);
247     /// ```
248     ///
249     /// Mutability:
250     ///
251     /// ```
252     /// let mut s = String::from("🗻∈🌏");
253     ///
254     /// unsafe {
255     ///     let bytes = s.as_bytes_mut();
256     ///
257     ///     bytes[0] = 0xF0;
258     ///     bytes[1] = 0x9F;
259     ///     bytes[2] = 0x8D;
260     ///     bytes[3] = 0x94;
261     /// }
262     ///
263     /// assert_eq!("🍔∈🌏", s);
264     /// ```
265     #[stable(feature = "str_mut_extras", since = "1.20.0")]
266     #[inline(always)]
267     pub unsafe fn as_bytes_mut(&mut self) -> &mut [u8] {
268         // SAFETY: the cast from `&str` to `&[u8]` is safe since `str`
269         // has the same layout as `&[u8]` (only libstd can make this guarantee).
270         // The pointer dereference is safe since it comes from a mutable reference which
271         // is guaranteed to be valid for writes.
272         unsafe { &mut *(self as *mut str as *mut [u8]) }
273     }
274
275     /// Converts a string slice to a raw pointer.
276     ///
277     /// As string slices are a slice of bytes, the raw pointer points to a
278     /// [`u8`]. This pointer will be pointing to the first byte of the string
279     /// slice.
280     ///
281     /// The caller must ensure that the returned pointer is never written to.
282     /// If you need to mutate the contents of the string slice, use [`as_mut_ptr`].
283     ///
284     /// [`as_mut_ptr`]: str::as_mut_ptr
285     ///
286     /// # Examples
287     ///
288     /// Basic usage:
289     ///
290     /// ```
291     /// let s = "Hello";
292     /// let ptr = s.as_ptr();
293     /// ```
294     #[stable(feature = "rust1", since = "1.0.0")]
295     #[rustc_const_stable(feature = "rustc_str_as_ptr", since = "1.32.0")]
296     #[inline]
297     pub const fn as_ptr(&self) -> *const u8 {
298         self as *const str as *const u8
299     }
300
301     /// Converts a mutable string slice to a raw pointer.
302     ///
303     /// As string slices are a slice of bytes, the raw pointer points to a
304     /// [`u8`]. This pointer will be pointing to the first byte of the string
305     /// slice.
306     ///
307     /// It is your responsibility to make sure that the string slice only gets
308     /// modified in a way that it remains valid UTF-8.
309     #[stable(feature = "str_as_mut_ptr", since = "1.36.0")]
310     #[inline]
311     pub fn as_mut_ptr(&mut self) -> *mut u8 {
312         self as *mut str as *mut u8
313     }
314
315     /// Returns a subslice of `str`.
316     ///
317     /// This is the non-panicking alternative to indexing the `str`. Returns
318     /// [`None`] whenever equivalent indexing operation would panic.
319     ///
320     /// # Examples
321     ///
322     /// ```
323     /// let v = String::from("🗻∈🌏");
324     ///
325     /// assert_eq!(Some("🗻"), v.get(0..4));
326     ///
327     /// // indices not on UTF-8 sequence boundaries
328     /// assert!(v.get(1..).is_none());
329     /// assert!(v.get(..8).is_none());
330     ///
331     /// // out of bounds
332     /// assert!(v.get(..42).is_none());
333     /// ```
334     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
335     #[inline]
336     pub fn get<I: SliceIndex<str>>(&self, i: I) -> Option<&I::Output> {
337         i.get(self)
338     }
339
340     /// Returns a mutable subslice of `str`.
341     ///
342     /// This is the non-panicking alternative to indexing the `str`. Returns
343     /// [`None`] whenever equivalent indexing operation would panic.
344     ///
345     /// # Examples
346     ///
347     /// ```
348     /// let mut v = String::from("hello");
349     /// // correct length
350     /// assert!(v.get_mut(0..5).is_some());
351     /// // out of bounds
352     /// assert!(v.get_mut(..42).is_none());
353     /// assert_eq!(Some("he"), v.get_mut(0..2).map(|v| &*v));
354     ///
355     /// assert_eq!("hello", v);
356     /// {
357     ///     let s = v.get_mut(0..2);
358     ///     let s = s.map(|s| {
359     ///         s.make_ascii_uppercase();
360     ///         &*s
361     ///     });
362     ///     assert_eq!(Some("HE"), s);
363     /// }
364     /// assert_eq!("HEllo", v);
365     /// ```
366     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
367     #[inline]
368     pub fn get_mut<I: SliceIndex<str>>(&mut self, i: I) -> Option<&mut I::Output> {
369         i.get_mut(self)
370     }
371
372     /// Returns an unchecked subslice of `str`.
373     ///
374     /// This is the unchecked alternative to indexing the `str`.
375     ///
376     /// # Safety
377     ///
378     /// Callers of this function are responsible that these preconditions are
379     /// satisfied:
380     ///
381     /// * The starting index must not exceed the ending index;
382     /// * Indexes must be within bounds of the original slice;
383     /// * Indexes must lie on UTF-8 sequence boundaries.
384     ///
385     /// Failing that, the returned string slice may reference invalid memory or
386     /// violate the invariants communicated by the `str` type.
387     ///
388     /// # Examples
389     ///
390     /// ```
391     /// let v = "🗻∈🌏";
392     /// unsafe {
393     ///     assert_eq!("🗻", v.get_unchecked(0..4));
394     ///     assert_eq!("∈", v.get_unchecked(4..7));
395     ///     assert_eq!("🌏", v.get_unchecked(7..11));
396     /// }
397     /// ```
398     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
399     #[inline]
400     pub unsafe fn get_unchecked<I: SliceIndex<str>>(&self, i: I) -> &I::Output {
401         // SAFETY: the caller must uphold the safety contract for `get_unchecked`;
402         // the slice is dereferencable because `self` is a safe reference.
403         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
404         unsafe { &*i.get_unchecked(self) }
405     }
406
407     /// Returns a mutable, unchecked subslice of `str`.
408     ///
409     /// This is the unchecked alternative to indexing the `str`.
410     ///
411     /// # Safety
412     ///
413     /// Callers of this function are responsible that these preconditions are
414     /// satisfied:
415     ///
416     /// * The starting index must not exceed the ending index;
417     /// * Indexes must be within bounds of the original slice;
418     /// * Indexes must lie on UTF-8 sequence boundaries.
419     ///
420     /// Failing that, the returned string slice may reference invalid memory or
421     /// violate the invariants communicated by the `str` type.
422     ///
423     /// # Examples
424     ///
425     /// ```
426     /// let mut v = String::from("🗻∈🌏");
427     /// unsafe {
428     ///     assert_eq!("🗻", v.get_unchecked_mut(0..4));
429     ///     assert_eq!("∈", v.get_unchecked_mut(4..7));
430     ///     assert_eq!("🌏", v.get_unchecked_mut(7..11));
431     /// }
432     /// ```
433     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
434     #[inline]
435     pub unsafe fn get_unchecked_mut<I: SliceIndex<str>>(&mut self, i: I) -> &mut I::Output {
436         // SAFETY: the caller must uphold the safety contract for `get_unchecked_mut`;
437         // the slice is dereferencable because `self` is a safe reference.
438         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
439         unsafe { &mut *i.get_unchecked_mut(self) }
440     }
441
442     /// Creates a string slice from another string slice, bypassing safety
443     /// checks.
444     ///
445     /// This is generally not recommended, use with caution! For a safe
446     /// alternative see [`str`] and [`Index`].
447     ///
448     /// [`Index`]: crate::ops::Index
449     ///
450     /// This new slice goes from `begin` to `end`, including `begin` but
451     /// excluding `end`.
452     ///
453     /// To get a mutable string slice instead, see the
454     /// [`slice_mut_unchecked`] method.
455     ///
456     /// [`slice_mut_unchecked`]: str::slice_mut_unchecked
457     ///
458     /// # Safety
459     ///
460     /// Callers of this function are responsible that three preconditions are
461     /// satisfied:
462     ///
463     /// * `begin` must not exceed `end`.
464     /// * `begin` and `end` must be byte positions within the string slice.
465     /// * `begin` and `end` must lie on UTF-8 sequence boundaries.
466     ///
467     /// # Examples
468     ///
469     /// Basic usage:
470     ///
471     /// ```
472     /// let s = "Löwe 老虎 Léopard";
473     ///
474     /// unsafe {
475     ///     assert_eq!("Löwe 老虎 Léopard", s.slice_unchecked(0, 21));
476     /// }
477     ///
478     /// let s = "Hello, world!";
479     ///
480     /// unsafe {
481     ///     assert_eq!("world", s.slice_unchecked(7, 12));
482     /// }
483     /// ```
484     #[stable(feature = "rust1", since = "1.0.0")]
485     #[rustc_deprecated(since = "1.29.0", reason = "use `get_unchecked(begin..end)` instead")]
486     #[inline]
487     pub unsafe fn slice_unchecked(&self, begin: usize, end: usize) -> &str {
488         // SAFETY: the caller must uphold the safety contract for `get_unchecked`;
489         // the slice is dereferencable because `self` is a safe reference.
490         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
491         unsafe { &*(begin..end).get_unchecked(self) }
492     }
493
494     /// Creates a string slice from another string slice, bypassing safety
495     /// checks.
496     /// This is generally not recommended, use with caution! For a safe
497     /// alternative see [`str`] and [`IndexMut`].
498     ///
499     /// [`IndexMut`]: crate::ops::IndexMut
500     ///
501     /// This new slice goes from `begin` to `end`, including `begin` but
502     /// excluding `end`.
503     ///
504     /// To get an immutable string slice instead, see the
505     /// [`slice_unchecked`] method.
506     ///
507     /// [`slice_unchecked`]: str::slice_unchecked
508     ///
509     /// # Safety
510     ///
511     /// Callers of this function are responsible that three preconditions are
512     /// satisfied:
513     ///
514     /// * `begin` must not exceed `end`.
515     /// * `begin` and `end` must be byte positions within the string slice.
516     /// * `begin` and `end` must lie on UTF-8 sequence boundaries.
517     #[stable(feature = "str_slice_mut", since = "1.5.0")]
518     #[rustc_deprecated(since = "1.29.0", reason = "use `get_unchecked_mut(begin..end)` instead")]
519     #[inline]
520     pub unsafe fn slice_mut_unchecked(&mut self, begin: usize, end: usize) -> &mut str {
521         // SAFETY: the caller must uphold the safety contract for `get_unchecked_mut`;
522         // the slice is dereferencable because `self` is a safe reference.
523         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
524         unsafe { &mut *(begin..end).get_unchecked_mut(self) }
525     }
526
527     /// Divide one string slice into two at an index.
528     ///
529     /// The argument, `mid`, should be a byte offset from the start of the
530     /// string. It must also be on the boundary of a UTF-8 code point.
531     ///
532     /// The two slices returned go from the start of the string slice to `mid`,
533     /// and from `mid` to the end of the string slice.
534     ///
535     /// To get mutable string slices instead, see the [`split_at_mut`]
536     /// method.
537     ///
538     /// [`split_at_mut`]: str::split_at_mut
539     ///
540     /// # Panics
541     ///
542     /// Panics if `mid` is not on a UTF-8 code point boundary, or if it is
543     /// past the end of the last code point of the string slice.
544     ///
545     /// # Examples
546     ///
547     /// Basic usage:
548     ///
549     /// ```
550     /// let s = "Per Martin-Löf";
551     ///
552     /// let (first, last) = s.split_at(3);
553     ///
554     /// assert_eq!("Per", first);
555     /// assert_eq!(" Martin-Löf", last);
556     /// ```
557     #[inline]
558     #[stable(feature = "str_split_at", since = "1.4.0")]
559     pub fn split_at(&self, mid: usize) -> (&str, &str) {
560         // is_char_boundary checks that the index is in [0, .len()]
561         if self.is_char_boundary(mid) {
562             // SAFETY: just checked that `mid` is on a char boundary.
563             unsafe { (self.get_unchecked(0..mid), self.get_unchecked(mid..self.len())) }
564         } else {
565             slice_error_fail(self, 0, mid)
566         }
567     }
568
569     /// Divide one mutable string slice into two at an index.
570     ///
571     /// The argument, `mid`, should be a byte offset from the start of the
572     /// string. It must also be on the boundary of a UTF-8 code point.
573     ///
574     /// The two slices returned go from the start of the string slice to `mid`,
575     /// and from `mid` to the end of the string slice.
576     ///
577     /// To get immutable string slices instead, see the [`split_at`] method.
578     ///
579     /// [`split_at`]: str::split_at
580     ///
581     /// # Panics
582     ///
583     /// Panics if `mid` is not on a UTF-8 code point boundary, or if it is
584     /// past the end of the last code point of the string slice.
585     ///
586     /// # Examples
587     ///
588     /// Basic usage:
589     ///
590     /// ```
591     /// let mut s = "Per Martin-Löf".to_string();
592     /// {
593     ///     let (first, last) = s.split_at_mut(3);
594     ///     first.make_ascii_uppercase();
595     ///     assert_eq!("PER", first);
596     ///     assert_eq!(" Martin-Löf", last);
597     /// }
598     /// assert_eq!("PER Martin-Löf", s);
599     /// ```
600     #[inline]
601     #[stable(feature = "str_split_at", since = "1.4.0")]
602     pub fn split_at_mut(&mut self, mid: usize) -> (&mut str, &mut str) {
603         // is_char_boundary checks that the index is in [0, .len()]
604         if self.is_char_boundary(mid) {
605             let len = self.len();
606             let ptr = self.as_mut_ptr();
607             // SAFETY: just checked that `mid` is on a char boundary.
608             unsafe {
609                 (
610                     from_utf8_unchecked_mut(slice::from_raw_parts_mut(ptr, mid)),
611                     from_utf8_unchecked_mut(slice::from_raw_parts_mut(ptr.add(mid), len - mid)),
612                 )
613             }
614         } else {
615             slice_error_fail(self, 0, mid)
616         }
617     }
618
619     /// Returns an iterator over the [`char`]s of a string slice.
620     ///
621     /// As a string slice consists of valid UTF-8, we can iterate through a
622     /// string slice by [`char`]. This method returns such an iterator.
623     ///
624     /// It's important to remember that [`char`] represents a Unicode Scalar
625     /// Value, and may not match your idea of what a 'character' is. Iteration
626     /// over grapheme clusters may be what you actually want. This functionality
627     /// is not provided by Rust's standard library, check crates.io instead.
628     ///
629     /// # Examples
630     ///
631     /// Basic usage:
632     ///
633     /// ```
634     /// let word = "goodbye";
635     ///
636     /// let count = word.chars().count();
637     /// assert_eq!(7, count);
638     ///
639     /// let mut chars = word.chars();
640     ///
641     /// assert_eq!(Some('g'), chars.next());
642     /// assert_eq!(Some('o'), chars.next());
643     /// assert_eq!(Some('o'), chars.next());
644     /// assert_eq!(Some('d'), chars.next());
645     /// assert_eq!(Some('b'), chars.next());
646     /// assert_eq!(Some('y'), chars.next());
647     /// assert_eq!(Some('e'), chars.next());
648     ///
649     /// assert_eq!(None, chars.next());
650     /// ```
651     ///
652     /// Remember, [`char`]s may not match your intuition about characters:
653     ///
654     /// [`char`]: prim@char
655     ///
656     /// ```
657     /// let y = "y̆";
658     ///
659     /// let mut chars = y.chars();
660     ///
661     /// assert_eq!(Some('y'), chars.next()); // not 'y̆'
662     /// assert_eq!(Some('\u{0306}'), chars.next());
663     ///
664     /// assert_eq!(None, chars.next());
665     /// ```
666     #[stable(feature = "rust1", since = "1.0.0")]
667     #[inline]
668     pub fn chars(&self) -> Chars<'_> {
669         Chars { iter: self.as_bytes().iter() }
670     }
671
672     /// Returns an iterator over the [`char`]s of a string slice, and their
673     /// positions.
674     ///
675     /// As a string slice consists of valid UTF-8, we can iterate through a
676     /// string slice by [`char`]. This method returns an iterator of both
677     /// these [`char`]s, as well as their byte positions.
678     ///
679     /// The iterator yields tuples. The position is first, the [`char`] is
680     /// second.
681     ///
682     /// # Examples
683     ///
684     /// Basic usage:
685     ///
686     /// ```
687     /// let word = "goodbye";
688     ///
689     /// let count = word.char_indices().count();
690     /// assert_eq!(7, count);
691     ///
692     /// let mut char_indices = word.char_indices();
693     ///
694     /// assert_eq!(Some((0, 'g')), char_indices.next());
695     /// assert_eq!(Some((1, 'o')), char_indices.next());
696     /// assert_eq!(Some((2, 'o')), char_indices.next());
697     /// assert_eq!(Some((3, 'd')), char_indices.next());
698     /// assert_eq!(Some((4, 'b')), char_indices.next());
699     /// assert_eq!(Some((5, 'y')), char_indices.next());
700     /// assert_eq!(Some((6, 'e')), char_indices.next());
701     ///
702     /// assert_eq!(None, char_indices.next());
703     /// ```
704     ///
705     /// Remember, [`char`]s may not match your intuition about characters:
706     ///
707     /// [`char`]: prim@char
708     ///
709     /// ```
710     /// let yes = "y̆es";
711     ///
712     /// let mut char_indices = yes.char_indices();
713     ///
714     /// assert_eq!(Some((0, 'y')), char_indices.next()); // not (0, 'y̆')
715     /// assert_eq!(Some((1, '\u{0306}')), char_indices.next());
716     ///
717     /// // note the 3 here - the last character took up two bytes
718     /// assert_eq!(Some((3, 'e')), char_indices.next());
719     /// assert_eq!(Some((4, 's')), char_indices.next());
720     ///
721     /// assert_eq!(None, char_indices.next());
722     /// ```
723     #[stable(feature = "rust1", since = "1.0.0")]
724     #[inline]
725     pub fn char_indices(&self) -> CharIndices<'_> {
726         CharIndices { front_offset: 0, iter: self.chars() }
727     }
728
729     /// An iterator over the bytes of a string slice.
730     ///
731     /// As a string slice consists of a sequence of bytes, we can iterate
732     /// through a string slice by byte. This method returns such an iterator.
733     ///
734     /// # Examples
735     ///
736     /// Basic usage:
737     ///
738     /// ```
739     /// let mut bytes = "bors".bytes();
740     ///
741     /// assert_eq!(Some(b'b'), bytes.next());
742     /// assert_eq!(Some(b'o'), bytes.next());
743     /// assert_eq!(Some(b'r'), bytes.next());
744     /// assert_eq!(Some(b's'), bytes.next());
745     ///
746     /// assert_eq!(None, bytes.next());
747     /// ```
748     #[stable(feature = "rust1", since = "1.0.0")]
749     #[inline]
750     pub fn bytes(&self) -> Bytes<'_> {
751         Bytes(self.as_bytes().iter().copied())
752     }
753
754     /// Splits a string slice by whitespace.
755     ///
756     /// The iterator returned will return string slices that are sub-slices of
757     /// the original string slice, separated by any amount of whitespace.
758     ///
759     /// 'Whitespace' is defined according to the terms of the Unicode Derived
760     /// Core Property `White_Space`. If you only want to split on ASCII whitespace
761     /// instead, use [`split_ascii_whitespace`].
762     ///
763     /// [`split_ascii_whitespace`]: str::split_ascii_whitespace
764     ///
765     /// # Examples
766     ///
767     /// Basic usage:
768     ///
769     /// ```
770     /// let mut iter = "A few words".split_whitespace();
771     ///
772     /// assert_eq!(Some("A"), iter.next());
773     /// assert_eq!(Some("few"), iter.next());
774     /// assert_eq!(Some("words"), iter.next());
775     ///
776     /// assert_eq!(None, iter.next());
777     /// ```
778     ///
779     /// All kinds of whitespace are considered:
780     ///
781     /// ```
782     /// let mut iter = " Mary   had\ta\u{2009}little  \n\t lamb".split_whitespace();
783     /// assert_eq!(Some("Mary"), iter.next());
784     /// assert_eq!(Some("had"), iter.next());
785     /// assert_eq!(Some("a"), iter.next());
786     /// assert_eq!(Some("little"), iter.next());
787     /// assert_eq!(Some("lamb"), iter.next());
788     ///
789     /// assert_eq!(None, iter.next());
790     /// ```
791     #[stable(feature = "split_whitespace", since = "1.1.0")]
792     #[inline]
793     pub fn split_whitespace(&self) -> SplitWhitespace<'_> {
794         SplitWhitespace { inner: self.split(IsWhitespace).filter(IsNotEmpty) }
795     }
796
797     /// Splits a string slice by ASCII whitespace.
798     ///
799     /// The iterator returned will return string slices that are sub-slices of
800     /// the original string slice, separated by any amount of ASCII whitespace.
801     ///
802     /// To split by Unicode `Whitespace` instead, use [`split_whitespace`].
803     ///
804     /// [`split_whitespace`]: str::split_whitespace
805     ///
806     /// # Examples
807     ///
808     /// Basic usage:
809     ///
810     /// ```
811     /// let mut iter = "A few words".split_ascii_whitespace();
812     ///
813     /// assert_eq!(Some("A"), iter.next());
814     /// assert_eq!(Some("few"), iter.next());
815     /// assert_eq!(Some("words"), iter.next());
816     ///
817     /// assert_eq!(None, iter.next());
818     /// ```
819     ///
820     /// All kinds of ASCII whitespace are considered:
821     ///
822     /// ```
823     /// let mut iter = " Mary   had\ta little  \n\t lamb".split_ascii_whitespace();
824     /// assert_eq!(Some("Mary"), iter.next());
825     /// assert_eq!(Some("had"), iter.next());
826     /// assert_eq!(Some("a"), iter.next());
827     /// assert_eq!(Some("little"), iter.next());
828     /// assert_eq!(Some("lamb"), iter.next());
829     ///
830     /// assert_eq!(None, iter.next());
831     /// ```
832     #[stable(feature = "split_ascii_whitespace", since = "1.34.0")]
833     #[inline]
834     pub fn split_ascii_whitespace(&self) -> SplitAsciiWhitespace<'_> {
835         let inner =
836             self.as_bytes().split(IsAsciiWhitespace).filter(BytesIsNotEmpty).map(UnsafeBytesToStr);
837         SplitAsciiWhitespace { inner }
838     }
839
840     /// An iterator over the lines of a string, as string slices.
841     ///
842     /// Lines are ended with either a newline (`\n`) or a carriage return with
843     /// a line feed (`\r\n`).
844     ///
845     /// The final line ending is optional. A string that ends with a final line
846     /// ending will return the same lines as an otherwise identical string
847     /// without a final line ending.
848     ///
849     /// # Examples
850     ///
851     /// Basic usage:
852     ///
853     /// ```
854     /// let text = "foo\r\nbar\n\nbaz\n";
855     /// let mut lines = text.lines();
856     ///
857     /// assert_eq!(Some("foo"), lines.next());
858     /// assert_eq!(Some("bar"), lines.next());
859     /// assert_eq!(Some(""), lines.next());
860     /// assert_eq!(Some("baz"), lines.next());
861     ///
862     /// assert_eq!(None, lines.next());
863     /// ```
864     ///
865     /// The final line ending isn't required:
866     ///
867     /// ```
868     /// let text = "foo\nbar\n\r\nbaz";
869     /// let mut lines = text.lines();
870     ///
871     /// assert_eq!(Some("foo"), lines.next());
872     /// assert_eq!(Some("bar"), lines.next());
873     /// assert_eq!(Some(""), lines.next());
874     /// assert_eq!(Some("baz"), lines.next());
875     ///
876     /// assert_eq!(None, lines.next());
877     /// ```
878     #[stable(feature = "rust1", since = "1.0.0")]
879     #[inline]
880     pub fn lines(&self) -> Lines<'_> {
881         Lines(self.split_terminator('\n').map(LinesAnyMap))
882     }
883
884     /// An iterator over the lines of a string.
885     #[stable(feature = "rust1", since = "1.0.0")]
886     #[rustc_deprecated(since = "1.4.0", reason = "use lines() instead now")]
887     #[inline]
888     #[allow(deprecated)]
889     pub fn lines_any(&self) -> LinesAny<'_> {
890         LinesAny(self.lines())
891     }
892
893     /// Returns an iterator of `u16` over the string encoded as UTF-16.
894     ///
895     /// # Examples
896     ///
897     /// Basic usage:
898     ///
899     /// ```
900     /// let text = "Zażółć gęślą jaźń";
901     ///
902     /// let utf8_len = text.len();
903     /// let utf16_len = text.encode_utf16().count();
904     ///
905     /// assert!(utf16_len <= utf8_len);
906     /// ```
907     #[stable(feature = "encode_utf16", since = "1.8.0")]
908     pub fn encode_utf16(&self) -> EncodeUtf16<'_> {
909         EncodeUtf16 { chars: self.chars(), extra: 0 }
910     }
911
912     /// Returns `true` if the given pattern matches a sub-slice of
913     /// this string slice.
914     ///
915     /// Returns `false` if it does not.
916     ///
917     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
918     /// function or closure that determines if a character matches.
919     ///
920     /// [`char`]: prim@char
921     /// [pattern]: self::pattern
922     ///
923     /// # Examples
924     ///
925     /// Basic usage:
926     ///
927     /// ```
928     /// let bananas = "bananas";
929     ///
930     /// assert!(bananas.contains("nana"));
931     /// assert!(!bananas.contains("apples"));
932     /// ```
933     #[stable(feature = "rust1", since = "1.0.0")]
934     #[inline]
935     pub fn contains<'a, P: Pattern<'a>>(&'a self, pat: P) -> bool {
936         pat.is_contained_in(self)
937     }
938
939     /// Returns `true` if the given pattern matches a prefix of this
940     /// string slice.
941     ///
942     /// Returns `false` if it does not.
943     ///
944     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
945     /// function or closure that determines if a character matches.
946     ///
947     /// [`char`]: prim@char
948     /// [pattern]: self::pattern
949     ///
950     /// # Examples
951     ///
952     /// Basic usage:
953     ///
954     /// ```
955     /// let bananas = "bananas";
956     ///
957     /// assert!(bananas.starts_with("bana"));
958     /// assert!(!bananas.starts_with("nana"));
959     /// ```
960     #[stable(feature = "rust1", since = "1.0.0")]
961     pub fn starts_with<'a, P: Pattern<'a>>(&'a self, pat: P) -> bool {
962         pat.is_prefix_of(self)
963     }
964
965     /// Returns `true` if the given pattern matches a suffix of this
966     /// string slice.
967     ///
968     /// Returns `false` if it does not.
969     ///
970     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
971     /// function or closure that determines if a character matches.
972     ///
973     /// [`char`]: prim@char
974     /// [pattern]: self::pattern
975     ///
976     /// # Examples
977     ///
978     /// Basic usage:
979     ///
980     /// ```
981     /// let bananas = "bananas";
982     ///
983     /// assert!(bananas.ends_with("anas"));
984     /// assert!(!bananas.ends_with("nana"));
985     /// ```
986     #[stable(feature = "rust1", since = "1.0.0")]
987     pub fn ends_with<'a, P>(&'a self, pat: P) -> bool
988     where
989         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
990     {
991         pat.is_suffix_of(self)
992     }
993
994     /// Returns the byte index of the first character of this string slice that
995     /// matches the pattern.
996     ///
997     /// Returns [`None`] if the pattern doesn't match.
998     ///
999     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1000     /// function or closure that determines if a character matches.
1001     ///
1002     /// [`char`]: prim@char
1003     /// [pattern]: self::pattern
1004     ///
1005     /// # Examples
1006     ///
1007     /// Simple patterns:
1008     ///
1009     /// ```
1010     /// let s = "Löwe 老虎 Léopard Gepardi";
1011     ///
1012     /// assert_eq!(s.find('L'), Some(0));
1013     /// assert_eq!(s.find('é'), Some(14));
1014     /// assert_eq!(s.find("pard"), Some(17));
1015     /// ```
1016     ///
1017     /// More complex patterns using point-free style and closures:
1018     ///
1019     /// ```
1020     /// let s = "Löwe 老虎 Léopard";
1021     ///
1022     /// assert_eq!(s.find(char::is_whitespace), Some(5));
1023     /// assert_eq!(s.find(char::is_lowercase), Some(1));
1024     /// assert_eq!(s.find(|c: char| c.is_whitespace() || c.is_lowercase()), Some(1));
1025     /// assert_eq!(s.find(|c: char| (c < 'o') && (c > 'a')), Some(4));
1026     /// ```
1027     ///
1028     /// Not finding the pattern:
1029     ///
1030     /// ```
1031     /// let s = "Löwe 老虎 Léopard";
1032     /// let x: &[_] = &['1', '2'];
1033     ///
1034     /// assert_eq!(s.find(x), None);
1035     /// ```
1036     #[stable(feature = "rust1", since = "1.0.0")]
1037     #[inline]
1038     pub fn find<'a, P: Pattern<'a>>(&'a self, pat: P) -> Option<usize> {
1039         pat.into_searcher(self).next_match().map(|(i, _)| i)
1040     }
1041
1042     /// Returns the byte index for the first character of the rightmost match of the pattern in
1043     /// this string slice.
1044     ///
1045     /// Returns [`None`] if the pattern doesn't match.
1046     ///
1047     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1048     /// function or closure that determines if a character matches.
1049     ///
1050     /// [`char`]: prim@char
1051     /// [pattern]: self::pattern
1052     ///
1053     /// # Examples
1054     ///
1055     /// Simple patterns:
1056     ///
1057     /// ```
1058     /// let s = "Löwe 老虎 Léopard Gepardi";
1059     ///
1060     /// assert_eq!(s.rfind('L'), Some(13));
1061     /// assert_eq!(s.rfind('é'), Some(14));
1062     /// assert_eq!(s.rfind("pard"), Some(24));
1063     /// ```
1064     ///
1065     /// More complex patterns with closures:
1066     ///
1067     /// ```
1068     /// let s = "Löwe 老虎 Léopard";
1069     ///
1070     /// assert_eq!(s.rfind(char::is_whitespace), Some(12));
1071     /// assert_eq!(s.rfind(char::is_lowercase), Some(20));
1072     /// ```
1073     ///
1074     /// Not finding the pattern:
1075     ///
1076     /// ```
1077     /// let s = "Löwe 老虎 Léopard";
1078     /// let x: &[_] = &['1', '2'];
1079     ///
1080     /// assert_eq!(s.rfind(x), None);
1081     /// ```
1082     #[stable(feature = "rust1", since = "1.0.0")]
1083     #[inline]
1084     pub fn rfind<'a, P>(&'a self, pat: P) -> Option<usize>
1085     where
1086         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1087     {
1088         pat.into_searcher(self).next_match_back().map(|(i, _)| i)
1089     }
1090
1091     /// An iterator over substrings of this string slice, separated by
1092     /// characters matched by a pattern.
1093     ///
1094     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1095     /// function or closure that determines if a character matches.
1096     ///
1097     /// [`char`]: prim@char
1098     /// [pattern]: self::pattern
1099     ///
1100     /// # Iterator behavior
1101     ///
1102     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1103     /// allows a reverse search and forward/reverse search yields the same
1104     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1105     ///
1106     /// If the pattern allows a reverse search but its results might differ
1107     /// from a forward search, the [`rsplit`] method can be used.
1108     ///
1109     /// [`rsplit`]: str::rsplit
1110     ///
1111     /// # Examples
1112     ///
1113     /// Simple patterns:
1114     ///
1115     /// ```
1116     /// let v: Vec<&str> = "Mary had a little lamb".split(' ').collect();
1117     /// assert_eq!(v, ["Mary", "had", "a", "little", "lamb"]);
1118     ///
1119     /// let v: Vec<&str> = "".split('X').collect();
1120     /// assert_eq!(v, [""]);
1121     ///
1122     /// let v: Vec<&str> = "lionXXtigerXleopard".split('X').collect();
1123     /// assert_eq!(v, ["lion", "", "tiger", "leopard"]);
1124     ///
1125     /// let v: Vec<&str> = "lion::tiger::leopard".split("::").collect();
1126     /// assert_eq!(v, ["lion", "tiger", "leopard"]);
1127     ///
1128     /// let v: Vec<&str> = "abc1def2ghi".split(char::is_numeric).collect();
1129     /// assert_eq!(v, ["abc", "def", "ghi"]);
1130     ///
1131     /// let v: Vec<&str> = "lionXtigerXleopard".split(char::is_uppercase).collect();
1132     /// assert_eq!(v, ["lion", "tiger", "leopard"]);
1133     /// ```
1134     ///
1135     /// If the pattern is a slice of chars, split on each occurrence of any of the characters:
1136     ///
1137     /// ```
1138     /// let v: Vec<&str> = "2020-11-03 23:59".split(&['-', ' ', ':', '@'][..]).collect();
1139     /// assert_eq!(v, ["2020", "11", "03", "23", "59"]);
1140     /// ```
1141     ///
1142     /// A more complex pattern, using a closure:
1143     ///
1144     /// ```
1145     /// let v: Vec<&str> = "abc1defXghi".split(|c| c == '1' || c == 'X').collect();
1146     /// assert_eq!(v, ["abc", "def", "ghi"]);
1147     /// ```
1148     ///
1149     /// If a string contains multiple contiguous separators, you will end up
1150     /// with empty strings in the output:
1151     ///
1152     /// ```
1153     /// let x = "||||a||b|c".to_string();
1154     /// let d: Vec<_> = x.split('|').collect();
1155     ///
1156     /// assert_eq!(d, &["", "", "", "", "a", "", "b", "c"]);
1157     /// ```
1158     ///
1159     /// Contiguous separators are separated by the empty string.
1160     ///
1161     /// ```
1162     /// let x = "(///)".to_string();
1163     /// let d: Vec<_> = x.split('/').collect();
1164     ///
1165     /// assert_eq!(d, &["(", "", "", ")"]);
1166     /// ```
1167     ///
1168     /// Separators at the start or end of a string are neighbored
1169     /// by empty strings.
1170     ///
1171     /// ```
1172     /// let d: Vec<_> = "010".split("0").collect();
1173     /// assert_eq!(d, &["", "1", ""]);
1174     /// ```
1175     ///
1176     /// When the empty string is used as a separator, it separates
1177     /// every character in the string, along with the beginning
1178     /// and end of the string.
1179     ///
1180     /// ```
1181     /// let f: Vec<_> = "rust".split("").collect();
1182     /// assert_eq!(f, &["", "r", "u", "s", "t", ""]);
1183     /// ```
1184     ///
1185     /// Contiguous separators can lead to possibly surprising behavior
1186     /// when whitespace is used as the separator. This code is correct:
1187     ///
1188     /// ```
1189     /// let x = "    a  b c".to_string();
1190     /// let d: Vec<_> = x.split(' ').collect();
1191     ///
1192     /// assert_eq!(d, &["", "", "", "", "a", "", "b", "c"]);
1193     /// ```
1194     ///
1195     /// It does _not_ give you:
1196     ///
1197     /// ```,ignore
1198     /// assert_eq!(d, &["a", "b", "c"]);
1199     /// ```
1200     ///
1201     /// Use [`split_whitespace`] for this behavior.
1202     ///
1203     /// [`split_whitespace`]: str::split_whitespace
1204     #[stable(feature = "rust1", since = "1.0.0")]
1205     #[inline]
1206     pub fn split<'a, P: Pattern<'a>>(&'a self, pat: P) -> Split<'a, P> {
1207         Split(SplitInternal {
1208             start: 0,
1209             end: self.len(),
1210             matcher: pat.into_searcher(self),
1211             allow_trailing_empty: true,
1212             finished: false,
1213         })
1214     }
1215
1216     /// An iterator over substrings of this string slice, separated by
1217     /// characters matched by a pattern. Differs from the iterator produced by
1218     /// `split` in that `split_inclusive` leaves the matched part as the
1219     /// terminator of the substring.
1220     ///
1221     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1222     /// function or closure that determines if a character matches.
1223     ///
1224     /// [`char`]: prim@char
1225     /// [pattern]: self::pattern
1226     ///
1227     /// # Examples
1228     ///
1229     /// ```
1230     /// #![feature(split_inclusive)]
1231     /// let v: Vec<&str> = "Mary had a little lamb\nlittle lamb\nlittle lamb."
1232     ///     .split_inclusive('\n').collect();
1233     /// assert_eq!(v, ["Mary had a little lamb\n", "little lamb\n", "little lamb."]);
1234     /// ```
1235     ///
1236     /// If the last element of the string is matched,
1237     /// that element will be considered the terminator of the preceding substring.
1238     /// That substring will be the last item returned by the iterator.
1239     ///
1240     /// ```
1241     /// #![feature(split_inclusive)]
1242     /// let v: Vec<&str> = "Mary had a little lamb\nlittle lamb\nlittle lamb.\n"
1243     ///     .split_inclusive('\n').collect();
1244     /// assert_eq!(v, ["Mary had a little lamb\n", "little lamb\n", "little lamb.\n"]);
1245     /// ```
1246     #[unstable(feature = "split_inclusive", issue = "72360")]
1247     #[inline]
1248     pub fn split_inclusive<'a, P: Pattern<'a>>(&'a self, pat: P) -> SplitInclusive<'a, P> {
1249         SplitInclusive(SplitInternal {
1250             start: 0,
1251             end: self.len(),
1252             matcher: pat.into_searcher(self),
1253             allow_trailing_empty: false,
1254             finished: false,
1255         })
1256     }
1257
1258     /// An iterator over substrings of the given string slice, separated by
1259     /// characters matched by a pattern and yielded in reverse order.
1260     ///
1261     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1262     /// function or closure that determines if a character matches.
1263     ///
1264     /// [`char`]: prim@char
1265     /// [pattern]: self::pattern
1266     ///
1267     /// # Iterator behavior
1268     ///
1269     /// The returned iterator requires that the pattern supports a reverse
1270     /// search, and it will be a [`DoubleEndedIterator`] if a forward/reverse
1271     /// search yields the same elements.
1272     ///
1273     /// For iterating from the front, the [`split`] method can be used.
1274     ///
1275     /// [`split`]: str::split
1276     ///
1277     /// # Examples
1278     ///
1279     /// Simple patterns:
1280     ///
1281     /// ```
1282     /// let v: Vec<&str> = "Mary had a little lamb".rsplit(' ').collect();
1283     /// assert_eq!(v, ["lamb", "little", "a", "had", "Mary"]);
1284     ///
1285     /// let v: Vec<&str> = "".rsplit('X').collect();
1286     /// assert_eq!(v, [""]);
1287     ///
1288     /// let v: Vec<&str> = "lionXXtigerXleopard".rsplit('X').collect();
1289     /// assert_eq!(v, ["leopard", "tiger", "", "lion"]);
1290     ///
1291     /// let v: Vec<&str> = "lion::tiger::leopard".rsplit("::").collect();
1292     /// assert_eq!(v, ["leopard", "tiger", "lion"]);
1293     /// ```
1294     ///
1295     /// A more complex pattern, using a closure:
1296     ///
1297     /// ```
1298     /// let v: Vec<&str> = "abc1defXghi".rsplit(|c| c == '1' || c == 'X').collect();
1299     /// assert_eq!(v, ["ghi", "def", "abc"]);
1300     /// ```
1301     #[stable(feature = "rust1", since = "1.0.0")]
1302     #[inline]
1303     pub fn rsplit<'a, P>(&'a self, pat: P) -> RSplit<'a, P>
1304     where
1305         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1306     {
1307         RSplit(self.split(pat).0)
1308     }
1309
1310     /// An iterator over substrings of the given string slice, separated by
1311     /// characters matched by a pattern.
1312     ///
1313     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1314     /// function or closure that determines if a character matches.
1315     ///
1316     /// [`char`]: prim@char
1317     /// [pattern]: self::pattern
1318     ///
1319     /// Equivalent to [`split`], except that the trailing substring
1320     /// is skipped if empty.
1321     ///
1322     /// [`split`]: str::split
1323     ///
1324     /// This method can be used for string data that is _terminated_,
1325     /// rather than _separated_ by a pattern.
1326     ///
1327     /// # Iterator behavior
1328     ///
1329     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1330     /// allows a reverse search and forward/reverse search yields the same
1331     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1332     ///
1333     /// If the pattern allows a reverse search but its results might differ
1334     /// from a forward search, the [`rsplit_terminator`] method can be used.
1335     ///
1336     /// [`rsplit_terminator`]: str::rsplit_terminator
1337     ///
1338     /// # Examples
1339     ///
1340     /// Basic usage:
1341     ///
1342     /// ```
1343     /// let v: Vec<&str> = "A.B.".split_terminator('.').collect();
1344     /// assert_eq!(v, ["A", "B"]);
1345     ///
1346     /// let v: Vec<&str> = "A..B..".split_terminator(".").collect();
1347     /// assert_eq!(v, ["A", "", "B", ""]);
1348     /// ```
1349     #[stable(feature = "rust1", since = "1.0.0")]
1350     #[inline]
1351     pub fn split_terminator<'a, P: Pattern<'a>>(&'a self, pat: P) -> SplitTerminator<'a, P> {
1352         SplitTerminator(SplitInternal { allow_trailing_empty: false, ..self.split(pat).0 })
1353     }
1354
1355     /// An iterator over substrings of `self`, separated by characters
1356     /// matched by a pattern and yielded in reverse order.
1357     ///
1358     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1359     /// function or closure that determines if a character matches.
1360     ///
1361     /// [`char`]: prim@char
1362     /// [pattern]: self::pattern
1363     ///
1364     /// Equivalent to [`split`], except that the trailing substring is
1365     /// skipped if empty.
1366     ///
1367     /// [`split`]: str::split
1368     ///
1369     /// This method can be used for string data that is _terminated_,
1370     /// rather than _separated_ by a pattern.
1371     ///
1372     /// # Iterator behavior
1373     ///
1374     /// The returned iterator requires that the pattern supports a
1375     /// reverse search, and it will be double ended if a forward/reverse
1376     /// search yields the same elements.
1377     ///
1378     /// For iterating from the front, the [`split_terminator`] method can be
1379     /// used.
1380     ///
1381     /// [`split_terminator`]: str::split_terminator
1382     ///
1383     /// # Examples
1384     ///
1385     /// ```
1386     /// let v: Vec<&str> = "A.B.".rsplit_terminator('.').collect();
1387     /// assert_eq!(v, ["B", "A"]);
1388     ///
1389     /// let v: Vec<&str> = "A..B..".rsplit_terminator(".").collect();
1390     /// assert_eq!(v, ["", "B", "", "A"]);
1391     /// ```
1392     #[stable(feature = "rust1", since = "1.0.0")]
1393     #[inline]
1394     pub fn rsplit_terminator<'a, P>(&'a self, pat: P) -> RSplitTerminator<'a, P>
1395     where
1396         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1397     {
1398         RSplitTerminator(self.split_terminator(pat).0)
1399     }
1400
1401     /// An iterator over substrings of the given string slice, separated by a
1402     /// pattern, restricted to returning at most `n` items.
1403     ///
1404     /// If `n` substrings are returned, the last substring (the `n`th substring)
1405     /// will contain the remainder of the string.
1406     ///
1407     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1408     /// function or closure that determines if a character matches.
1409     ///
1410     /// [`char`]: prim@char
1411     /// [pattern]: self::pattern
1412     ///
1413     /// # Iterator behavior
1414     ///
1415     /// The returned iterator will not be double ended, because it is
1416     /// not efficient to support.
1417     ///
1418     /// If the pattern allows a reverse search, the [`rsplitn`] method can be
1419     /// used.
1420     ///
1421     /// [`rsplitn`]: str::rsplitn
1422     ///
1423     /// # Examples
1424     ///
1425     /// Simple patterns:
1426     ///
1427     /// ```
1428     /// let v: Vec<&str> = "Mary had a little lambda".splitn(3, ' ').collect();
1429     /// assert_eq!(v, ["Mary", "had", "a little lambda"]);
1430     ///
1431     /// let v: Vec<&str> = "lionXXtigerXleopard".splitn(3, "X").collect();
1432     /// assert_eq!(v, ["lion", "", "tigerXleopard"]);
1433     ///
1434     /// let v: Vec<&str> = "abcXdef".splitn(1, 'X').collect();
1435     /// assert_eq!(v, ["abcXdef"]);
1436     ///
1437     /// let v: Vec<&str> = "".splitn(1, 'X').collect();
1438     /// assert_eq!(v, [""]);
1439     /// ```
1440     ///
1441     /// A more complex pattern, using a closure:
1442     ///
1443     /// ```
1444     /// let v: Vec<&str> = "abc1defXghi".splitn(2, |c| c == '1' || c == 'X').collect();
1445     /// assert_eq!(v, ["abc", "defXghi"]);
1446     /// ```
1447     #[stable(feature = "rust1", since = "1.0.0")]
1448     #[inline]
1449     pub fn splitn<'a, P: Pattern<'a>>(&'a self, n: usize, pat: P) -> SplitN<'a, P> {
1450         SplitN(SplitNInternal { iter: self.split(pat).0, count: n })
1451     }
1452
1453     /// An iterator over substrings of this string slice, separated by a
1454     /// pattern, starting from the end of the string, restricted to returning
1455     /// at most `n` items.
1456     ///
1457     /// If `n` substrings are returned, the last substring (the `n`th substring)
1458     /// will contain the remainder of the string.
1459     ///
1460     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1461     /// function or closure that determines if a character matches.
1462     ///
1463     /// [`char`]: prim@char
1464     /// [pattern]: self::pattern
1465     ///
1466     /// # Iterator behavior
1467     ///
1468     /// The returned iterator will not be double ended, because it is not
1469     /// efficient to support.
1470     ///
1471     /// For splitting from the front, the [`splitn`] method can be used.
1472     ///
1473     /// [`splitn`]: str::splitn
1474     ///
1475     /// # Examples
1476     ///
1477     /// Simple patterns:
1478     ///
1479     /// ```
1480     /// let v: Vec<&str> = "Mary had a little lamb".rsplitn(3, ' ').collect();
1481     /// assert_eq!(v, ["lamb", "little", "Mary had a"]);
1482     ///
1483     /// let v: Vec<&str> = "lionXXtigerXleopard".rsplitn(3, 'X').collect();
1484     /// assert_eq!(v, ["leopard", "tiger", "lionX"]);
1485     ///
1486     /// let v: Vec<&str> = "lion::tiger::leopard".rsplitn(2, "::").collect();
1487     /// assert_eq!(v, ["leopard", "lion::tiger"]);
1488     /// ```
1489     ///
1490     /// A more complex pattern, using a closure:
1491     ///
1492     /// ```
1493     /// let v: Vec<&str> = "abc1defXghi".rsplitn(2, |c| c == '1' || c == 'X').collect();
1494     /// assert_eq!(v, ["ghi", "abc1def"]);
1495     /// ```
1496     #[stable(feature = "rust1", since = "1.0.0")]
1497     #[inline]
1498     pub fn rsplitn<'a, P>(&'a self, n: usize, pat: P) -> RSplitN<'a, P>
1499     where
1500         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1501     {
1502         RSplitN(self.splitn(n, pat).0)
1503     }
1504
1505     /// Splits the string on the first occurrence of the specified delimiter and
1506     /// returns prefix before delimiter and suffix after delimiter.
1507     ///
1508     /// # Examples
1509     ///
1510     /// ```
1511     /// #![feature(str_split_once)]
1512     ///
1513     /// assert_eq!("cfg".split_once('='), None);
1514     /// assert_eq!("cfg=foo".split_once('='), Some(("cfg", "foo")));
1515     /// assert_eq!("cfg=foo=bar".split_once('='), Some(("cfg", "foo=bar")));
1516     /// ```
1517     #[unstable(feature = "str_split_once", reason = "newly added", issue = "74773")]
1518     #[inline]
1519     pub fn split_once<'a, P: Pattern<'a>>(&'a self, delimiter: P) -> Option<(&'a str, &'a str)> {
1520         let (start, end) = delimiter.into_searcher(self).next_match()?;
1521         Some((&self[..start], &self[end..]))
1522     }
1523
1524     /// Splits the string on the last occurrence of the specified delimiter and
1525     /// returns prefix before delimiter and suffix after delimiter.
1526     ///
1527     /// # Examples
1528     ///
1529     /// ```
1530     /// #![feature(str_split_once)]
1531     ///
1532     /// assert_eq!("cfg".rsplit_once('='), None);
1533     /// assert_eq!("cfg=foo".rsplit_once('='), Some(("cfg", "foo")));
1534     /// assert_eq!("cfg=foo=bar".rsplit_once('='), Some(("cfg=foo", "bar")));
1535     /// ```
1536     #[unstable(feature = "str_split_once", reason = "newly added", issue = "74773")]
1537     #[inline]
1538     pub fn rsplit_once<'a, P>(&'a self, delimiter: P) -> Option<(&'a str, &'a str)>
1539     where
1540         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1541     {
1542         let (start, end) = delimiter.into_searcher(self).next_match_back()?;
1543         Some((&self[..start], &self[end..]))
1544     }
1545
1546     /// An iterator over the disjoint matches of a pattern within the given string
1547     /// slice.
1548     ///
1549     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1550     /// function or closure that determines if a character matches.
1551     ///
1552     /// [`char`]: prim@char
1553     /// [pattern]: self::pattern
1554     ///
1555     /// # Iterator behavior
1556     ///
1557     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1558     /// allows a reverse search and forward/reverse search yields the same
1559     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1560     ///
1561     /// If the pattern allows a reverse search but its results might differ
1562     /// from a forward search, the [`rmatches`] method can be used.
1563     ///
1564     /// [`rmatches`]: str::matches
1565     ///
1566     /// # Examples
1567     ///
1568     /// Basic usage:
1569     ///
1570     /// ```
1571     /// let v: Vec<&str> = "abcXXXabcYYYabc".matches("abc").collect();
1572     /// assert_eq!(v, ["abc", "abc", "abc"]);
1573     ///
1574     /// let v: Vec<&str> = "1abc2abc3".matches(char::is_numeric).collect();
1575     /// assert_eq!(v, ["1", "2", "3"]);
1576     /// ```
1577     #[stable(feature = "str_matches", since = "1.2.0")]
1578     #[inline]
1579     pub fn matches<'a, P: Pattern<'a>>(&'a self, pat: P) -> Matches<'a, P> {
1580         Matches(MatchesInternal(pat.into_searcher(self)))
1581     }
1582
1583     /// An iterator over the disjoint matches of a pattern within this string slice,
1584     /// yielded in reverse order.
1585     ///
1586     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1587     /// function or closure that determines if a character matches.
1588     ///
1589     /// [`char`]: prim@char
1590     /// [pattern]: self::pattern
1591     ///
1592     /// # Iterator behavior
1593     ///
1594     /// The returned iterator requires that the pattern supports a reverse
1595     /// search, and it will be a [`DoubleEndedIterator`] if a forward/reverse
1596     /// search yields the same elements.
1597     ///
1598     /// For iterating from the front, the [`matches`] method can be used.
1599     ///
1600     /// [`matches`]: str::matches
1601     ///
1602     /// # Examples
1603     ///
1604     /// Basic usage:
1605     ///
1606     /// ```
1607     /// let v: Vec<&str> = "abcXXXabcYYYabc".rmatches("abc").collect();
1608     /// assert_eq!(v, ["abc", "abc", "abc"]);
1609     ///
1610     /// let v: Vec<&str> = "1abc2abc3".rmatches(char::is_numeric).collect();
1611     /// assert_eq!(v, ["3", "2", "1"]);
1612     /// ```
1613     #[stable(feature = "str_matches", since = "1.2.0")]
1614     #[inline]
1615     pub fn rmatches<'a, P>(&'a self, pat: P) -> RMatches<'a, P>
1616     where
1617         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1618     {
1619         RMatches(self.matches(pat).0)
1620     }
1621
1622     /// An iterator over the disjoint matches of a pattern within this string
1623     /// slice as well as the index that the match starts at.
1624     ///
1625     /// For matches of `pat` within `self` that overlap, only the indices
1626     /// corresponding to the first match are returned.
1627     ///
1628     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1629     /// function or closure that determines if a character matches.
1630     ///
1631     /// [`char`]: prim@char
1632     /// [pattern]: self::pattern
1633     ///
1634     /// # Iterator behavior
1635     ///
1636     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1637     /// allows a reverse search and forward/reverse search yields the same
1638     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1639     ///
1640     /// If the pattern allows a reverse search but its results might differ
1641     /// from a forward search, the [`rmatch_indices`] method can be used.
1642     ///
1643     /// [`rmatch_indices`]: str::match_indices
1644     ///
1645     /// # Examples
1646     ///
1647     /// Basic usage:
1648     ///
1649     /// ```
1650     /// let v: Vec<_> = "abcXXXabcYYYabc".match_indices("abc").collect();
1651     /// assert_eq!(v, [(0, "abc"), (6, "abc"), (12, "abc")]);
1652     ///
1653     /// let v: Vec<_> = "1abcabc2".match_indices("abc").collect();
1654     /// assert_eq!(v, [(1, "abc"), (4, "abc")]);
1655     ///
1656     /// let v: Vec<_> = "ababa".match_indices("aba").collect();
1657     /// assert_eq!(v, [(0, "aba")]); // only the first `aba`
1658     /// ```
1659     #[stable(feature = "str_match_indices", since = "1.5.0")]
1660     #[inline]
1661     pub fn match_indices<'a, P: Pattern<'a>>(&'a self, pat: P) -> MatchIndices<'a, P> {
1662         MatchIndices(MatchIndicesInternal(pat.into_searcher(self)))
1663     }
1664
1665     /// An iterator over the disjoint matches of a pattern within `self`,
1666     /// yielded in reverse order along with the index of the match.
1667     ///
1668     /// For matches of `pat` within `self` that overlap, only the indices
1669     /// corresponding to the last match are returned.
1670     ///
1671     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1672     /// function or closure that determines if a character matches.
1673     ///
1674     /// [`char`]: prim@char
1675     /// [pattern]: self::pattern
1676     ///
1677     /// # Iterator behavior
1678     ///
1679     /// The returned iterator requires that the pattern supports a reverse
1680     /// search, and it will be a [`DoubleEndedIterator`] if a forward/reverse
1681     /// search yields the same elements.
1682     ///
1683     /// For iterating from the front, the [`match_indices`] method can be used.
1684     ///
1685     /// [`match_indices`]: str::match_indices
1686     ///
1687     /// # Examples
1688     ///
1689     /// Basic usage:
1690     ///
1691     /// ```
1692     /// let v: Vec<_> = "abcXXXabcYYYabc".rmatch_indices("abc").collect();
1693     /// assert_eq!(v, [(12, "abc"), (6, "abc"), (0, "abc")]);
1694     ///
1695     /// let v: Vec<_> = "1abcabc2".rmatch_indices("abc").collect();
1696     /// assert_eq!(v, [(4, "abc"), (1, "abc")]);
1697     ///
1698     /// let v: Vec<_> = "ababa".rmatch_indices("aba").collect();
1699     /// assert_eq!(v, [(2, "aba")]); // only the last `aba`
1700     /// ```
1701     #[stable(feature = "str_match_indices", since = "1.5.0")]
1702     #[inline]
1703     pub fn rmatch_indices<'a, P>(&'a self, pat: P) -> RMatchIndices<'a, P>
1704     where
1705         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1706     {
1707         RMatchIndices(self.match_indices(pat).0)
1708     }
1709
1710     /// Returns a string slice with leading and trailing whitespace removed.
1711     ///
1712     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1713     /// Core Property `White_Space`.
1714     ///
1715     /// # Examples
1716     ///
1717     /// Basic usage:
1718     ///
1719     /// ```
1720     /// let s = " Hello\tworld\t";
1721     ///
1722     /// assert_eq!("Hello\tworld", s.trim());
1723     /// ```
1724     #[inline]
1725     #[must_use = "this returns the trimmed string as a slice, \
1726                   without modifying the original"]
1727     #[stable(feature = "rust1", since = "1.0.0")]
1728     pub fn trim(&self) -> &str {
1729         self.trim_matches(|c: char| c.is_whitespace())
1730     }
1731
1732     /// Returns a string slice with leading whitespace removed.
1733     ///
1734     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1735     /// Core Property `White_Space`.
1736     ///
1737     /// # Text directionality
1738     ///
1739     /// A string is a sequence of bytes. `start` in this context means the first
1740     /// position of that byte string; for a left-to-right language like English or
1741     /// Russian, this will be left side, and for right-to-left languages like
1742     /// Arabic or Hebrew, this will be the right side.
1743     ///
1744     /// # Examples
1745     ///
1746     /// Basic usage:
1747     ///
1748     /// ```
1749     /// let s = " Hello\tworld\t";
1750     /// assert_eq!("Hello\tworld\t", s.trim_start());
1751     /// ```
1752     ///
1753     /// Directionality:
1754     ///
1755     /// ```
1756     /// let s = "  English  ";
1757     /// assert!(Some('E') == s.trim_start().chars().next());
1758     ///
1759     /// let s = "  עברית  ";
1760     /// assert!(Some('ע') == s.trim_start().chars().next());
1761     /// ```
1762     #[inline]
1763     #[must_use = "this returns the trimmed string as a new slice, \
1764                   without modifying the original"]
1765     #[stable(feature = "trim_direction", since = "1.30.0")]
1766     pub fn trim_start(&self) -> &str {
1767         self.trim_start_matches(|c: char| c.is_whitespace())
1768     }
1769
1770     /// Returns a string slice with trailing whitespace removed.
1771     ///
1772     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1773     /// Core Property `White_Space`.
1774     ///
1775     /// # Text directionality
1776     ///
1777     /// A string is a sequence of bytes. `end` in this context means the last
1778     /// position of that byte string; for a left-to-right language like English or
1779     /// Russian, this will be right side, and for right-to-left languages like
1780     /// Arabic or Hebrew, this will be the left side.
1781     ///
1782     /// # Examples
1783     ///
1784     /// Basic usage:
1785     ///
1786     /// ```
1787     /// let s = " Hello\tworld\t";
1788     /// assert_eq!(" Hello\tworld", s.trim_end());
1789     /// ```
1790     ///
1791     /// Directionality:
1792     ///
1793     /// ```
1794     /// let s = "  English  ";
1795     /// assert!(Some('h') == s.trim_end().chars().rev().next());
1796     ///
1797     /// let s = "  עברית  ";
1798     /// assert!(Some('ת') == s.trim_end().chars().rev().next());
1799     /// ```
1800     #[inline]
1801     #[must_use = "this returns the trimmed string as a new slice, \
1802                   without modifying the original"]
1803     #[stable(feature = "trim_direction", since = "1.30.0")]
1804     pub fn trim_end(&self) -> &str {
1805         self.trim_end_matches(|c: char| c.is_whitespace())
1806     }
1807
1808     /// Returns a string slice with leading whitespace removed.
1809     ///
1810     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1811     /// Core Property `White_Space`.
1812     ///
1813     /// # Text directionality
1814     ///
1815     /// A string is a sequence of bytes. 'Left' in this context means the first
1816     /// position of that byte string; for a language like Arabic or Hebrew
1817     /// which are 'right to left' rather than 'left to right', this will be
1818     /// the _right_ side, not the left.
1819     ///
1820     /// # Examples
1821     ///
1822     /// Basic usage:
1823     ///
1824     /// ```
1825     /// let s = " Hello\tworld\t";
1826     ///
1827     /// assert_eq!("Hello\tworld\t", s.trim_left());
1828     /// ```
1829     ///
1830     /// Directionality:
1831     ///
1832     /// ```
1833     /// let s = "  English";
1834     /// assert!(Some('E') == s.trim_left().chars().next());
1835     ///
1836     /// let s = "  עברית";
1837     /// assert!(Some('ע') == s.trim_left().chars().next());
1838     /// ```
1839     #[inline]
1840     #[stable(feature = "rust1", since = "1.0.0")]
1841     #[rustc_deprecated(
1842         since = "1.33.0",
1843         reason = "superseded by `trim_start`",
1844         suggestion = "trim_start"
1845     )]
1846     pub fn trim_left(&self) -> &str {
1847         self.trim_start()
1848     }
1849
1850     /// Returns a string slice with trailing whitespace removed.
1851     ///
1852     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1853     /// Core Property `White_Space`.
1854     ///
1855     /// # Text directionality
1856     ///
1857     /// A string is a sequence of bytes. 'Right' in this context means the last
1858     /// position of that byte string; for a language like Arabic or Hebrew
1859     /// which are 'right to left' rather than 'left to right', this will be
1860     /// the _left_ side, not the right.
1861     ///
1862     /// # Examples
1863     ///
1864     /// Basic usage:
1865     ///
1866     /// ```
1867     /// let s = " Hello\tworld\t";
1868     ///
1869     /// assert_eq!(" Hello\tworld", s.trim_right());
1870     /// ```
1871     ///
1872     /// Directionality:
1873     ///
1874     /// ```
1875     /// let s = "English  ";
1876     /// assert!(Some('h') == s.trim_right().chars().rev().next());
1877     ///
1878     /// let s = "עברית  ";
1879     /// assert!(Some('ת') == s.trim_right().chars().rev().next());
1880     /// ```
1881     #[inline]
1882     #[stable(feature = "rust1", since = "1.0.0")]
1883     #[rustc_deprecated(
1884         since = "1.33.0",
1885         reason = "superseded by `trim_end`",
1886         suggestion = "trim_end"
1887     )]
1888     pub fn trim_right(&self) -> &str {
1889         self.trim_end()
1890     }
1891
1892     /// Returns a string slice with all prefixes and suffixes that match a
1893     /// pattern repeatedly removed.
1894     ///
1895     /// The [pattern] can be a [`char`], a slice of [`char`]s, or a function
1896     /// or closure that determines if a character matches.
1897     ///
1898     /// [`char`]: prim@char
1899     /// [pattern]: self::pattern
1900     ///
1901     /// # Examples
1902     ///
1903     /// Simple patterns:
1904     ///
1905     /// ```
1906     /// assert_eq!("11foo1bar11".trim_matches('1'), "foo1bar");
1907     /// assert_eq!("123foo1bar123".trim_matches(char::is_numeric), "foo1bar");
1908     ///
1909     /// let x: &[_] = &['1', '2'];
1910     /// assert_eq!("12foo1bar12".trim_matches(x), "foo1bar");
1911     /// ```
1912     ///
1913     /// A more complex pattern, using a closure:
1914     ///
1915     /// ```
1916     /// assert_eq!("1foo1barXX".trim_matches(|c| c == '1' || c == 'X'), "foo1bar");
1917     /// ```
1918     #[must_use = "this returns the trimmed string as a new slice, \
1919                   without modifying the original"]
1920     #[stable(feature = "rust1", since = "1.0.0")]
1921     pub fn trim_matches<'a, P>(&'a self, pat: P) -> &'a str
1922     where
1923         P: Pattern<'a, Searcher: DoubleEndedSearcher<'a>>,
1924     {
1925         let mut i = 0;
1926         let mut j = 0;
1927         let mut matcher = pat.into_searcher(self);
1928         if let Some((a, b)) = matcher.next_reject() {
1929             i = a;
1930             j = b; // Remember earliest known match, correct it below if
1931             // last match is different
1932         }
1933         if let Some((_, b)) = matcher.next_reject_back() {
1934             j = b;
1935         }
1936         // SAFETY: `Searcher` is known to return valid indices.
1937         unsafe { self.get_unchecked(i..j) }
1938     }
1939
1940     /// Returns a string slice with all prefixes that match a pattern
1941     /// repeatedly removed.
1942     ///
1943     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1944     /// function or closure that determines if a character matches.
1945     ///
1946     /// [`char`]: prim@char
1947     /// [pattern]: self::pattern
1948     ///
1949     /// # Text directionality
1950     ///
1951     /// A string is a sequence of bytes. `start` in this context means the first
1952     /// position of that byte string; for a left-to-right language like English or
1953     /// Russian, this will be left side, and for right-to-left languages like
1954     /// Arabic or Hebrew, this will be the right side.
1955     ///
1956     /// # Examples
1957     ///
1958     /// Basic usage:
1959     ///
1960     /// ```
1961     /// assert_eq!("11foo1bar11".trim_start_matches('1'), "foo1bar11");
1962     /// assert_eq!("123foo1bar123".trim_start_matches(char::is_numeric), "foo1bar123");
1963     ///
1964     /// let x: &[_] = &['1', '2'];
1965     /// assert_eq!("12foo1bar12".trim_start_matches(x), "foo1bar12");
1966     /// ```
1967     #[must_use = "this returns the trimmed string as a new slice, \
1968                   without modifying the original"]
1969     #[stable(feature = "trim_direction", since = "1.30.0")]
1970     pub fn trim_start_matches<'a, P: Pattern<'a>>(&'a self, pat: P) -> &'a str {
1971         let mut i = self.len();
1972         let mut matcher = pat.into_searcher(self);
1973         if let Some((a, _)) = matcher.next_reject() {
1974             i = a;
1975         }
1976         // SAFETY: `Searcher` is known to return valid indices.
1977         unsafe { self.get_unchecked(i..self.len()) }
1978     }
1979
1980     /// Returns a string slice with the prefix removed.
1981     ///
1982     /// If the string starts with the pattern `prefix`, returns substring after the prefix, wrapped
1983     /// in `Some`.  Unlike `trim_start_matches`, this method removes the prefix exactly once.
1984     ///
1985     /// If the string does not start with `prefix`, returns `None`.
1986     ///
1987     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1988     /// function or closure that determines if a character matches.
1989     ///
1990     /// [`char`]: prim@char
1991     /// [pattern]: self::pattern
1992     ///
1993     /// # Examples
1994     ///
1995     /// ```
1996     /// assert_eq!("foo:bar".strip_prefix("foo:"), Some("bar"));
1997     /// assert_eq!("foo:bar".strip_prefix("bar"), None);
1998     /// assert_eq!("foofoo".strip_prefix("foo"), Some("foo"));
1999     /// ```
2000     #[must_use = "this returns the remaining substring as a new slice, \
2001                   without modifying the original"]
2002     #[stable(feature = "str_strip", since = "1.45.0")]
2003     pub fn strip_prefix<'a, P: Pattern<'a>>(&'a self, prefix: P) -> Option<&'a str> {
2004         prefix.strip_prefix_of(self)
2005     }
2006
2007     /// Returns a string slice with the suffix removed.
2008     ///
2009     /// If the string ends with the pattern `suffix`, returns the substring before the suffix,
2010     /// wrapped in `Some`.  Unlike `trim_end_matches`, this method removes the suffix exactly once.
2011     ///
2012     /// If the string does not end with `suffix`, returns `None`.
2013     ///
2014     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2015     /// function or closure that determines if a character matches.
2016     ///
2017     /// [`char`]: prim@char
2018     /// [pattern]: self::pattern
2019     ///
2020     /// # Examples
2021     ///
2022     /// ```
2023     /// assert_eq!("bar:foo".strip_suffix(":foo"), Some("bar"));
2024     /// assert_eq!("bar:foo".strip_suffix("bar"), None);
2025     /// assert_eq!("foofoo".strip_suffix("foo"), Some("foo"));
2026     /// ```
2027     #[must_use = "this returns the remaining substring as a new slice, \
2028                   without modifying the original"]
2029     #[stable(feature = "str_strip", since = "1.45.0")]
2030     pub fn strip_suffix<'a, P>(&'a self, suffix: P) -> Option<&'a str>
2031     where
2032         P: Pattern<'a>,
2033         <P as Pattern<'a>>::Searcher: ReverseSearcher<'a>,
2034     {
2035         suffix.strip_suffix_of(self)
2036     }
2037
2038     /// Returns a string slice with all suffixes that match a pattern
2039     /// repeatedly removed.
2040     ///
2041     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2042     /// function or closure that determines if a character matches.
2043     ///
2044     /// [`char`]: prim@char
2045     /// [pattern]: self::pattern
2046     ///
2047     /// # Text directionality
2048     ///
2049     /// A string is a sequence of bytes. `end` in this context means the last
2050     /// position of that byte string; for a left-to-right language like English or
2051     /// Russian, this will be right side, and for right-to-left languages like
2052     /// Arabic or Hebrew, this will be the left side.
2053     ///
2054     /// # Examples
2055     ///
2056     /// Simple patterns:
2057     ///
2058     /// ```
2059     /// assert_eq!("11foo1bar11".trim_end_matches('1'), "11foo1bar");
2060     /// assert_eq!("123foo1bar123".trim_end_matches(char::is_numeric), "123foo1bar");
2061     ///
2062     /// let x: &[_] = &['1', '2'];
2063     /// assert_eq!("12foo1bar12".trim_end_matches(x), "12foo1bar");
2064     /// ```
2065     ///
2066     /// A more complex pattern, using a closure:
2067     ///
2068     /// ```
2069     /// assert_eq!("1fooX".trim_end_matches(|c| c == '1' || c == 'X'), "1foo");
2070     /// ```
2071     #[must_use = "this returns the trimmed string as a new slice, \
2072                   without modifying the original"]
2073     #[stable(feature = "trim_direction", since = "1.30.0")]
2074     pub fn trim_end_matches<'a, P>(&'a self, pat: P) -> &'a str
2075     where
2076         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
2077     {
2078         let mut j = 0;
2079         let mut matcher = pat.into_searcher(self);
2080         if let Some((_, b)) = matcher.next_reject_back() {
2081             j = b;
2082         }
2083         // SAFETY: `Searcher` is known to return valid indices.
2084         unsafe { self.get_unchecked(0..j) }
2085     }
2086
2087     /// Returns a string slice with all prefixes that match a pattern
2088     /// repeatedly removed.
2089     ///
2090     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2091     /// function or closure that determines if a character matches.
2092     ///
2093     /// [`char`]: prim@char
2094     /// [pattern]: self::pattern
2095     ///
2096     /// # Text directionality
2097     ///
2098     /// A string is a sequence of bytes. 'Left' in this context means the first
2099     /// position of that byte string; for a language like Arabic or Hebrew
2100     /// which are 'right to left' rather than 'left to right', this will be
2101     /// the _right_ side, not the left.
2102     ///
2103     /// # Examples
2104     ///
2105     /// Basic usage:
2106     ///
2107     /// ```
2108     /// assert_eq!("11foo1bar11".trim_left_matches('1'), "foo1bar11");
2109     /// assert_eq!("123foo1bar123".trim_left_matches(char::is_numeric), "foo1bar123");
2110     ///
2111     /// let x: &[_] = &['1', '2'];
2112     /// assert_eq!("12foo1bar12".trim_left_matches(x), "foo1bar12");
2113     /// ```
2114     #[stable(feature = "rust1", since = "1.0.0")]
2115     #[rustc_deprecated(
2116         since = "1.33.0",
2117         reason = "superseded by `trim_start_matches`",
2118         suggestion = "trim_start_matches"
2119     )]
2120     pub fn trim_left_matches<'a, P: Pattern<'a>>(&'a self, pat: P) -> &'a str {
2121         self.trim_start_matches(pat)
2122     }
2123
2124     /// Returns a string slice with all suffixes that match a pattern
2125     /// repeatedly removed.
2126     ///
2127     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2128     /// function or closure that determines if a character matches.
2129     ///
2130     /// [`char`]: prim@char
2131     /// [pattern]: self::pattern
2132     ///
2133     /// # Text directionality
2134     ///
2135     /// A string is a sequence of bytes. 'Right' in this context means the last
2136     /// position of that byte string; for a language like Arabic or Hebrew
2137     /// which are 'right to left' rather than 'left to right', this will be
2138     /// the _left_ side, not the right.
2139     ///
2140     /// # Examples
2141     ///
2142     /// Simple patterns:
2143     ///
2144     /// ```
2145     /// assert_eq!("11foo1bar11".trim_right_matches('1'), "11foo1bar");
2146     /// assert_eq!("123foo1bar123".trim_right_matches(char::is_numeric), "123foo1bar");
2147     ///
2148     /// let x: &[_] = &['1', '2'];
2149     /// assert_eq!("12foo1bar12".trim_right_matches(x), "12foo1bar");
2150     /// ```
2151     ///
2152     /// A more complex pattern, using a closure:
2153     ///
2154     /// ```
2155     /// assert_eq!("1fooX".trim_right_matches(|c| c == '1' || c == 'X'), "1foo");
2156     /// ```
2157     #[stable(feature = "rust1", since = "1.0.0")]
2158     #[rustc_deprecated(
2159         since = "1.33.0",
2160         reason = "superseded by `trim_end_matches`",
2161         suggestion = "trim_end_matches"
2162     )]
2163     pub fn trim_right_matches<'a, P>(&'a self, pat: P) -> &'a str
2164     where
2165         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
2166     {
2167         self.trim_end_matches(pat)
2168     }
2169
2170     /// Parses this string slice into another type.
2171     ///
2172     /// Because `parse` is so general, it can cause problems with type
2173     /// inference. As such, `parse` is one of the few times you'll see
2174     /// the syntax affectionately known as the 'turbofish': `::<>`. This
2175     /// helps the inference algorithm understand specifically which type
2176     /// you're trying to parse into.
2177     ///
2178     /// `parse` can parse any type that implements the [`FromStr`] trait.
2179
2180     ///
2181     /// # Errors
2182     ///
2183     /// Will return [`Err`] if it's not possible to parse this string slice into
2184     /// the desired type.
2185     ///
2186     /// [`Err`]: FromStr::Err
2187     ///
2188     /// # Examples
2189     ///
2190     /// Basic usage
2191     ///
2192     /// ```
2193     /// let four: u32 = "4".parse().unwrap();
2194     ///
2195     /// assert_eq!(4, four);
2196     /// ```
2197     ///
2198     /// Using the 'turbofish' instead of annotating `four`:
2199     ///
2200     /// ```
2201     /// let four = "4".parse::<u32>();
2202     ///
2203     /// assert_eq!(Ok(4), four);
2204     /// ```
2205     ///
2206     /// Failing to parse:
2207     ///
2208     /// ```
2209     /// let nope = "j".parse::<u32>();
2210     ///
2211     /// assert!(nope.is_err());
2212     /// ```
2213     #[inline]
2214     #[stable(feature = "rust1", since = "1.0.0")]
2215     pub fn parse<F: FromStr>(&self) -> Result<F, F::Err> {
2216         FromStr::from_str(self)
2217     }
2218
2219     /// Checks if all characters in this string are within the ASCII range.
2220     ///
2221     /// # Examples
2222     ///
2223     /// ```
2224     /// let ascii = "hello!\n";
2225     /// let non_ascii = "Grüße, Jürgen ❤";
2226     ///
2227     /// assert!(ascii.is_ascii());
2228     /// assert!(!non_ascii.is_ascii());
2229     /// ```
2230     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2231     #[inline]
2232     pub fn is_ascii(&self) -> bool {
2233         // We can treat each byte as character here: all multibyte characters
2234         // start with a byte that is not in the ascii range, so we will stop
2235         // there already.
2236         self.as_bytes().is_ascii()
2237     }
2238
2239     /// Checks that two strings are an ASCII case-insensitive match.
2240     ///
2241     /// Same as `to_ascii_lowercase(a) == to_ascii_lowercase(b)`,
2242     /// but without allocating and copying temporaries.
2243     ///
2244     /// # Examples
2245     ///
2246     /// ```
2247     /// assert!("Ferris".eq_ignore_ascii_case("FERRIS"));
2248     /// assert!("Ferrös".eq_ignore_ascii_case("FERRöS"));
2249     /// assert!(!"Ferrös".eq_ignore_ascii_case("FERRÖS"));
2250     /// ```
2251     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2252     #[inline]
2253     pub fn eq_ignore_ascii_case(&self, other: &str) -> bool {
2254         self.as_bytes().eq_ignore_ascii_case(other.as_bytes())
2255     }
2256
2257     /// Converts this string to its ASCII upper case equivalent in-place.
2258     ///
2259     /// ASCII letters 'a' to 'z' are mapped to 'A' to 'Z',
2260     /// but non-ASCII letters are unchanged.
2261     ///
2262     /// To return a new uppercased value without modifying the existing one, use
2263     /// [`to_ascii_uppercase()`].
2264     ///
2265     /// [`to_ascii_uppercase()`]: #method.to_ascii_uppercase
2266     ///
2267     /// # Examples
2268     ///
2269     /// ```
2270     /// let mut s = String::from("Grüße, Jürgen ❤");
2271     ///
2272     /// s.make_ascii_uppercase();
2273     ///
2274     /// assert_eq!("GRüßE, JüRGEN ❤", s);
2275     /// ```
2276     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2277     #[inline]
2278     pub fn make_ascii_uppercase(&mut self) {
2279         // SAFETY: safe because we transmute two types with the same layout.
2280         let me = unsafe { self.as_bytes_mut() };
2281         me.make_ascii_uppercase()
2282     }
2283
2284     /// Converts this string to its ASCII lower case equivalent in-place.
2285     ///
2286     /// ASCII letters 'A' to 'Z' are mapped to 'a' to 'z',
2287     /// but non-ASCII letters are unchanged.
2288     ///
2289     /// To return a new lowercased value without modifying the existing one, use
2290     /// [`to_ascii_lowercase()`].
2291     ///
2292     /// [`to_ascii_lowercase()`]: #method.to_ascii_lowercase
2293     ///
2294     /// # Examples
2295     ///
2296     /// ```
2297     /// let mut s = String::from("GRÜßE, JÜRGEN ❤");
2298     ///
2299     /// s.make_ascii_lowercase();
2300     ///
2301     /// assert_eq!("grÜße, jÜrgen ❤", s);
2302     /// ```
2303     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2304     #[inline]
2305     pub fn make_ascii_lowercase(&mut self) {
2306         // SAFETY: safe because we transmute two types with the same layout.
2307         let me = unsafe { self.as_bytes_mut() };
2308         me.make_ascii_lowercase()
2309     }
2310
2311     /// Return an iterator that escapes each char in `self` with [`char::escape_debug`].
2312     ///
2313     /// Note: only extended grapheme codepoints that begin the string will be
2314     /// escaped.
2315     ///
2316     /// # Examples
2317     ///
2318     /// As an iterator:
2319     ///
2320     /// ```
2321     /// for c in "❤\n!".escape_debug() {
2322     ///     print!("{}", c);
2323     /// }
2324     /// println!();
2325     /// ```
2326     ///
2327     /// Using `println!` directly:
2328     ///
2329     /// ```
2330     /// println!("{}", "❤\n!".escape_debug());
2331     /// ```
2332     ///
2333     ///
2334     /// Both are equivalent to:
2335     ///
2336     /// ```
2337     /// println!("❤\\n!");
2338     /// ```
2339     ///
2340     /// Using `to_string`:
2341     ///
2342     /// ```
2343     /// assert_eq!("❤\n!".escape_debug().to_string(), "❤\\n!");
2344     /// ```
2345     #[stable(feature = "str_escape", since = "1.34.0")]
2346     pub fn escape_debug(&self) -> EscapeDebug<'_> {
2347         let mut chars = self.chars();
2348         EscapeDebug {
2349             inner: chars
2350                 .next()
2351                 .map(|first| first.escape_debug_ext(true))
2352                 .into_iter()
2353                 .flatten()
2354                 .chain(chars.flat_map(CharEscapeDebugContinue)),
2355         }
2356     }
2357
2358     /// Return an iterator that escapes each char in `self` with [`char::escape_default`].
2359     ///
2360     /// # Examples
2361     ///
2362     /// As an iterator:
2363     ///
2364     /// ```
2365     /// for c in "❤\n!".escape_default() {
2366     ///     print!("{}", c);
2367     /// }
2368     /// println!();
2369     /// ```
2370     ///
2371     /// Using `println!` directly:
2372     ///
2373     /// ```
2374     /// println!("{}", "❤\n!".escape_default());
2375     /// ```
2376     ///
2377     ///
2378     /// Both are equivalent to:
2379     ///
2380     /// ```
2381     /// println!("\\u{{2764}}\\n!");
2382     /// ```
2383     ///
2384     /// Using `to_string`:
2385     ///
2386     /// ```
2387     /// assert_eq!("❤\n!".escape_default().to_string(), "\\u{2764}\\n!");
2388     /// ```
2389     #[stable(feature = "str_escape", since = "1.34.0")]
2390     pub fn escape_default(&self) -> EscapeDefault<'_> {
2391         EscapeDefault { inner: self.chars().flat_map(CharEscapeDefault) }
2392     }
2393
2394     /// Return an iterator that escapes each char in `self` with [`char::escape_unicode`].
2395     ///
2396     /// # Examples
2397     ///
2398     /// As an iterator:
2399     ///
2400     /// ```
2401     /// for c in "❤\n!".escape_unicode() {
2402     ///     print!("{}", c);
2403     /// }
2404     /// println!();
2405     /// ```
2406     ///
2407     /// Using `println!` directly:
2408     ///
2409     /// ```
2410     /// println!("{}", "❤\n!".escape_unicode());
2411     /// ```
2412     ///
2413     ///
2414     /// Both are equivalent to:
2415     ///
2416     /// ```
2417     /// println!("\\u{{2764}}\\u{{a}}\\u{{21}}");
2418     /// ```
2419     ///
2420     /// Using `to_string`:
2421     ///
2422     /// ```
2423     /// assert_eq!("❤\n!".escape_unicode().to_string(), "\\u{2764}\\u{a}\\u{21}");
2424     /// ```
2425     #[stable(feature = "str_escape", since = "1.34.0")]
2426     pub fn escape_unicode(&self) -> EscapeUnicode<'_> {
2427         EscapeUnicode { inner: self.chars().flat_map(CharEscapeUnicode) }
2428     }
2429 }
2430
2431 #[stable(feature = "rust1", since = "1.0.0")]
2432 impl AsRef<[u8]> for str {
2433     #[inline]
2434     fn as_ref(&self) -> &[u8] {
2435         self.as_bytes()
2436     }
2437 }
2438
2439 #[stable(feature = "rust1", since = "1.0.0")]
2440 impl Default for &str {
2441     /// Creates an empty str
2442     #[inline]
2443     fn default() -> Self {
2444         ""
2445     }
2446 }
2447
2448 #[stable(feature = "default_mut_str", since = "1.28.0")]
2449 impl Default for &mut str {
2450     /// Creates an empty mutable str
2451     #[inline]
2452     fn default() -> Self {
2453         // SAFETY: The empty string is valid UTF-8.
2454         unsafe { from_utf8_unchecked_mut(&mut []) }
2455     }
2456 }
2457
2458 impl_fn_for_zst! {
2459     /// A nameable, cloneable fn type
2460     #[derive(Clone)]
2461     struct LinesAnyMap impl<'a> Fn = |line: &'a str| -> &'a str {
2462         let l = line.len();
2463         if l > 0 && line.as_bytes()[l - 1] == b'\r' { &line[0 .. l - 1] }
2464         else { line }
2465     };
2466
2467     #[derive(Clone)]
2468     struct CharEscapeDebugContinue impl Fn = |c: char| -> char::EscapeDebug {
2469         c.escape_debug_ext(false)
2470     };
2471
2472     #[derive(Clone)]
2473     struct CharEscapeUnicode impl Fn = |c: char| -> char::EscapeUnicode {
2474         c.escape_unicode()
2475     };
2476     #[derive(Clone)]
2477     struct CharEscapeDefault impl Fn = |c: char| -> char::EscapeDefault {
2478         c.escape_default()
2479     };
2480
2481     #[derive(Clone)]
2482     struct IsWhitespace impl Fn = |c: char| -> bool {
2483         c.is_whitespace()
2484     };
2485
2486     #[derive(Clone)]
2487     struct IsAsciiWhitespace impl Fn = |byte: &u8| -> bool {
2488         byte.is_ascii_whitespace()
2489     };
2490
2491     #[derive(Clone)]
2492     struct IsNotEmpty impl<'a, 'b> Fn = |s: &'a &'b str| -> bool {
2493         !s.is_empty()
2494     };
2495
2496     #[derive(Clone)]
2497     struct BytesIsNotEmpty impl<'a, 'b> Fn = |s: &'a &'b [u8]| -> bool {
2498         !s.is_empty()
2499     };
2500
2501     #[derive(Clone)]
2502     struct UnsafeBytesToStr impl<'a> Fn = |bytes: &'a [u8]| -> &'a str {
2503         // SAFETY: not safe
2504         unsafe { from_utf8_unchecked(bytes) }
2505     };
2506 }