]> git.lizzy.rs Git - rust.git/blob - library/core/src/str/mod.rs
Auto merge of #78965 - jryans:emscripten-threads-libc, r=kennytm
[rust.git] / library / core / src / str / mod.rs
1 //! String manipulation.
2 //!
3 //! For more details, see the [`std::str`] module.
4 //!
5 //! [`std::str`]: ../../std/str/index.html
6
7 #![stable(feature = "rust1", since = "1.0.0")]
8
9 mod converts;
10 mod error;
11 mod iter;
12 mod traits;
13 mod validations;
14
15 use self::pattern::Pattern;
16 use self::pattern::{DoubleEndedSearcher, ReverseSearcher, Searcher};
17
18 use crate::char;
19 use crate::mem;
20 use crate::slice::{self, SliceIndex};
21
22 pub mod pattern;
23
24 #[unstable(feature = "str_internals", issue = "none")]
25 #[allow(missing_docs)]
26 pub mod lossy;
27
28 #[stable(feature = "rust1", since = "1.0.0")]
29 pub use converts::{from_utf8, from_utf8_unchecked};
30
31 #[stable(feature = "str_mut_extras", since = "1.20.0")]
32 pub use converts::{from_utf8_mut, from_utf8_unchecked_mut};
33
34 #[stable(feature = "rust1", since = "1.0.0")]
35 pub use error::{ParseBoolError, Utf8Error};
36
37 #[stable(feature = "rust1", since = "1.0.0")]
38 pub use traits::FromStr;
39
40 #[stable(feature = "rust1", since = "1.0.0")]
41 pub use iter::{Bytes, CharIndices, Chars, Lines, SplitWhitespace};
42
43 #[stable(feature = "rust1", since = "1.0.0")]
44 #[allow(deprecated)]
45 pub use iter::LinesAny;
46
47 #[stable(feature = "rust1", since = "1.0.0")]
48 pub use iter::{RSplit, RSplitTerminator, Split, SplitTerminator};
49
50 #[stable(feature = "rust1", since = "1.0.0")]
51 pub use iter::{RSplitN, SplitN};
52
53 #[stable(feature = "str_matches", since = "1.2.0")]
54 pub use iter::{Matches, RMatches};
55
56 #[stable(feature = "str_match_indices", since = "1.5.0")]
57 pub use iter::{MatchIndices, RMatchIndices};
58
59 #[stable(feature = "encode_utf16", since = "1.8.0")]
60 pub use iter::EncodeUtf16;
61
62 #[stable(feature = "str_escape", since = "1.34.0")]
63 pub use iter::{EscapeDebug, EscapeDefault, EscapeUnicode};
64
65 #[stable(feature = "split_ascii_whitespace", since = "1.34.0")]
66 pub use iter::SplitAsciiWhitespace;
67
68 #[unstable(feature = "split_inclusive", issue = "72360")]
69 use iter::SplitInclusive;
70
71 #[unstable(feature = "str_internals", issue = "none")]
72 pub use validations::next_code_point;
73
74 use iter::MatchIndicesInternal;
75 use iter::SplitInternal;
76 use iter::{MatchesInternal, SplitNInternal};
77
78 use validations::truncate_to_char_boundary;
79
80 #[inline(never)]
81 #[cold]
82 #[track_caller]
83 fn slice_error_fail(s: &str, begin: usize, end: usize) -> ! {
84     const MAX_DISPLAY_LENGTH: usize = 256;
85     let (truncated, s_trunc) = truncate_to_char_boundary(s, MAX_DISPLAY_LENGTH);
86     let ellipsis = if truncated { "[...]" } else { "" };
87
88     // 1. out of bounds
89     if begin > s.len() || end > s.len() {
90         let oob_index = if begin > s.len() { begin } else { end };
91         panic!("byte index {} is out of bounds of `{}`{}", oob_index, s_trunc, ellipsis);
92     }
93
94     // 2. begin <= end
95     assert!(
96         begin <= end,
97         "begin <= end ({} <= {}) when slicing `{}`{}",
98         begin,
99         end,
100         s_trunc,
101         ellipsis
102     );
103
104     // 3. character boundary
105     let index = if !s.is_char_boundary(begin) { begin } else { end };
106     // find the character
107     let mut char_start = index;
108     while !s.is_char_boundary(char_start) {
109         char_start -= 1;
110     }
111     // `char_start` must be less than len and a char boundary
112     let ch = s[char_start..].chars().next().unwrap();
113     let char_range = char_start..char_start + ch.len_utf8();
114     panic!(
115         "byte index {} is not a char boundary; it is inside {:?} (bytes {:?}) of `{}`{}",
116         index, ch, char_range, s_trunc, ellipsis
117     );
118 }
119
120 #[lang = "str"]
121 #[cfg(not(test))]
122 impl str {
123     /// Returns the length of `self`.
124     ///
125     /// This length is in bytes, not [`char`]s or graphemes. In other words,
126     /// it may not be what a human considers the length of the string.
127     ///
128     /// [`char`]: prim@char
129     ///
130     /// # Examples
131     ///
132     /// Basic usage:
133     ///
134     /// ```
135     /// let len = "foo".len();
136     /// assert_eq!(3, len);
137     ///
138     /// assert_eq!("ƒoo".len(), 4); // fancy f!
139     /// assert_eq!("ƒoo".chars().count(), 3);
140     /// ```
141     #[stable(feature = "rust1", since = "1.0.0")]
142     #[rustc_const_stable(feature = "const_str_len", since = "1.32.0")]
143     #[inline]
144     pub const fn len(&self) -> usize {
145         self.as_bytes().len()
146     }
147
148     /// Returns `true` if `self` has a length of zero bytes.
149     ///
150     /// # Examples
151     ///
152     /// Basic usage:
153     ///
154     /// ```
155     /// let s = "";
156     /// assert!(s.is_empty());
157     ///
158     /// let s = "not empty";
159     /// assert!(!s.is_empty());
160     /// ```
161     #[inline]
162     #[stable(feature = "rust1", since = "1.0.0")]
163     #[rustc_const_stable(feature = "const_str_is_empty", since = "1.32.0")]
164     pub const fn is_empty(&self) -> bool {
165         self.len() == 0
166     }
167
168     /// Checks that `index`-th byte is the first byte in a UTF-8 code point
169     /// sequence or the end of the string.
170     ///
171     /// The start and end of the string (when `index == self.len()`) are
172     /// considered to be boundaries.
173     ///
174     /// Returns `false` if `index` is greater than `self.len()`.
175     ///
176     /// # Examples
177     ///
178     /// ```
179     /// let s = "Löwe 老虎 Léopard";
180     /// assert!(s.is_char_boundary(0));
181     /// // start of `老`
182     /// assert!(s.is_char_boundary(6));
183     /// assert!(s.is_char_boundary(s.len()));
184     ///
185     /// // second byte of `ö`
186     /// assert!(!s.is_char_boundary(2));
187     ///
188     /// // third byte of `老`
189     /// assert!(!s.is_char_boundary(8));
190     /// ```
191     #[stable(feature = "is_char_boundary", since = "1.9.0")]
192     #[inline]
193     pub fn is_char_boundary(&self, index: usize) -> bool {
194         // 0 and len are always ok.
195         // Test for 0 explicitly so that it can optimize out the check
196         // easily and skip reading string data for that case.
197         if index == 0 || index == self.len() {
198             return true;
199         }
200         match self.as_bytes().get(index) {
201             None => false,
202             // This is bit magic equivalent to: b < 128 || b >= 192
203             Some(&b) => (b as i8) >= -0x40,
204         }
205     }
206
207     /// Converts a string slice to a byte slice. To convert the byte slice back
208     /// into a string slice, use the [`from_utf8`] function.
209     ///
210     /// # Examples
211     ///
212     /// Basic usage:
213     ///
214     /// ```
215     /// let bytes = "bors".as_bytes();
216     /// assert_eq!(b"bors", bytes);
217     /// ```
218     #[stable(feature = "rust1", since = "1.0.0")]
219     #[rustc_const_stable(feature = "str_as_bytes", since = "1.32.0")]
220     #[inline(always)]
221     #[allow(unused_attributes)]
222     #[cfg_attr(not(bootstrap), rustc_allow_const_fn_unstable(const_fn_transmute))]
223     #[cfg_attr(bootstrap, allow_internal_unstable(const_fn_transmute))]
224     pub const fn as_bytes(&self) -> &[u8] {
225         // SAFETY: const sound because we transmute two types with the same layout
226         unsafe { mem::transmute(self) }
227     }
228
229     /// Converts a mutable string slice to a mutable byte slice.
230     ///
231     /// # Safety
232     ///
233     /// The caller must ensure that the content of the slice is valid UTF-8
234     /// before the borrow ends and the underlying `str` is used.
235     ///
236     /// Use of a `str` whose contents are not valid UTF-8 is undefined behavior.
237     ///
238     /// # Examples
239     ///
240     /// Basic usage:
241     ///
242     /// ```
243     /// let mut s = String::from("Hello");
244     /// let bytes = unsafe { s.as_bytes_mut() };
245     ///
246     /// assert_eq!(b"Hello", bytes);
247     /// ```
248     ///
249     /// Mutability:
250     ///
251     /// ```
252     /// let mut s = String::from("🗻∈🌏");
253     ///
254     /// unsafe {
255     ///     let bytes = s.as_bytes_mut();
256     ///
257     ///     bytes[0] = 0xF0;
258     ///     bytes[1] = 0x9F;
259     ///     bytes[2] = 0x8D;
260     ///     bytes[3] = 0x94;
261     /// }
262     ///
263     /// assert_eq!("🍔∈🌏", s);
264     /// ```
265     #[stable(feature = "str_mut_extras", since = "1.20.0")]
266     #[inline(always)]
267     pub unsafe fn as_bytes_mut(&mut self) -> &mut [u8] {
268         // SAFETY: the cast from `&str` to `&[u8]` is safe since `str`
269         // has the same layout as `&[u8]` (only libstd can make this guarantee).
270         // The pointer dereference is safe since it comes from a mutable reference which
271         // is guaranteed to be valid for writes.
272         unsafe { &mut *(self as *mut str as *mut [u8]) }
273     }
274
275     /// Converts a string slice to a raw pointer.
276     ///
277     /// As string slices are a slice of bytes, the raw pointer points to a
278     /// [`u8`]. This pointer will be pointing to the first byte of the string
279     /// slice.
280     ///
281     /// The caller must ensure that the returned pointer is never written to.
282     /// If you need to mutate the contents of the string slice, use [`as_mut_ptr`].
283     ///
284     /// [`as_mut_ptr`]: str::as_mut_ptr
285     ///
286     /// # Examples
287     ///
288     /// Basic usage:
289     ///
290     /// ```
291     /// let s = "Hello";
292     /// let ptr = s.as_ptr();
293     /// ```
294     #[stable(feature = "rust1", since = "1.0.0")]
295     #[rustc_const_stable(feature = "rustc_str_as_ptr", since = "1.32.0")]
296     #[inline]
297     pub const fn as_ptr(&self) -> *const u8 {
298         self as *const str as *const u8
299     }
300
301     /// Converts a mutable string slice to a raw pointer.
302     ///
303     /// As string slices are a slice of bytes, the raw pointer points to a
304     /// [`u8`]. This pointer will be pointing to the first byte of the string
305     /// slice.
306     ///
307     /// It is your responsibility to make sure that the string slice only gets
308     /// modified in a way that it remains valid UTF-8.
309     #[stable(feature = "str_as_mut_ptr", since = "1.36.0")]
310     #[inline]
311     pub fn as_mut_ptr(&mut self) -> *mut u8 {
312         self as *mut str as *mut u8
313     }
314
315     /// Returns a subslice of `str`.
316     ///
317     /// This is the non-panicking alternative to indexing the `str`. Returns
318     /// [`None`] whenever equivalent indexing operation would panic.
319     ///
320     /// # Examples
321     ///
322     /// ```
323     /// let v = String::from("🗻∈🌏");
324     ///
325     /// assert_eq!(Some("🗻"), v.get(0..4));
326     ///
327     /// // indices not on UTF-8 sequence boundaries
328     /// assert!(v.get(1..).is_none());
329     /// assert!(v.get(..8).is_none());
330     ///
331     /// // out of bounds
332     /// assert!(v.get(..42).is_none());
333     /// ```
334     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
335     #[inline]
336     pub fn get<I: SliceIndex<str>>(&self, i: I) -> Option<&I::Output> {
337         i.get(self)
338     }
339
340     /// Returns a mutable subslice of `str`.
341     ///
342     /// This is the non-panicking alternative to indexing the `str`. Returns
343     /// [`None`] whenever equivalent indexing operation would panic.
344     ///
345     /// # Examples
346     ///
347     /// ```
348     /// let mut v = String::from("hello");
349     /// // correct length
350     /// assert!(v.get_mut(0..5).is_some());
351     /// // out of bounds
352     /// assert!(v.get_mut(..42).is_none());
353     /// assert_eq!(Some("he"), v.get_mut(0..2).map(|v| &*v));
354     ///
355     /// assert_eq!("hello", v);
356     /// {
357     ///     let s = v.get_mut(0..2);
358     ///     let s = s.map(|s| {
359     ///         s.make_ascii_uppercase();
360     ///         &*s
361     ///     });
362     ///     assert_eq!(Some("HE"), s);
363     /// }
364     /// assert_eq!("HEllo", v);
365     /// ```
366     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
367     #[inline]
368     pub fn get_mut<I: SliceIndex<str>>(&mut self, i: I) -> Option<&mut I::Output> {
369         i.get_mut(self)
370     }
371
372     /// Returns an unchecked subslice of `str`.
373     ///
374     /// This is the unchecked alternative to indexing the `str`.
375     ///
376     /// # Safety
377     ///
378     /// Callers of this function are responsible that these preconditions are
379     /// satisfied:
380     ///
381     /// * The starting index must not exceed the ending index;
382     /// * Indexes must be within bounds of the original slice;
383     /// * Indexes must lie on UTF-8 sequence boundaries.
384     ///
385     /// Failing that, the returned string slice may reference invalid memory or
386     /// violate the invariants communicated by the `str` type.
387     ///
388     /// # Examples
389     ///
390     /// ```
391     /// let v = "🗻∈🌏";
392     /// unsafe {
393     ///     assert_eq!("🗻", v.get_unchecked(0..4));
394     ///     assert_eq!("∈", v.get_unchecked(4..7));
395     ///     assert_eq!("🌏", v.get_unchecked(7..11));
396     /// }
397     /// ```
398     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
399     #[inline]
400     pub unsafe fn get_unchecked<I: SliceIndex<str>>(&self, i: I) -> &I::Output {
401         // SAFETY: the caller must uphold the safety contract for `get_unchecked`;
402         // the slice is dereferencable because `self` is a safe reference.
403         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
404         unsafe { &*i.get_unchecked(self) }
405     }
406
407     /// Returns a mutable, unchecked subslice of `str`.
408     ///
409     /// This is the unchecked alternative to indexing the `str`.
410     ///
411     /// # Safety
412     ///
413     /// Callers of this function are responsible that these preconditions are
414     /// satisfied:
415     ///
416     /// * The starting index must not exceed the ending index;
417     /// * Indexes must be within bounds of the original slice;
418     /// * Indexes must lie on UTF-8 sequence boundaries.
419     ///
420     /// Failing that, the returned string slice may reference invalid memory or
421     /// violate the invariants communicated by the `str` type.
422     ///
423     /// # Examples
424     ///
425     /// ```
426     /// let mut v = String::from("🗻∈🌏");
427     /// unsafe {
428     ///     assert_eq!("🗻", v.get_unchecked_mut(0..4));
429     ///     assert_eq!("∈", v.get_unchecked_mut(4..7));
430     ///     assert_eq!("🌏", v.get_unchecked_mut(7..11));
431     /// }
432     /// ```
433     #[stable(feature = "str_checked_slicing", since = "1.20.0")]
434     #[inline]
435     pub unsafe fn get_unchecked_mut<I: SliceIndex<str>>(&mut self, i: I) -> &mut I::Output {
436         // SAFETY: the caller must uphold the safety contract for `get_unchecked_mut`;
437         // the slice is dereferencable because `self` is a safe reference.
438         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
439         unsafe { &mut *i.get_unchecked_mut(self) }
440     }
441
442     /// Creates a string slice from another string slice, bypassing safety
443     /// checks.
444     ///
445     /// This is generally not recommended, use with caution! For a safe
446     /// alternative see [`str`] and [`Index`].
447     ///
448     /// [`Index`]: crate::ops::Index
449     ///
450     /// This new slice goes from `begin` to `end`, including `begin` but
451     /// excluding `end`.
452     ///
453     /// To get a mutable string slice instead, see the
454     /// [`slice_mut_unchecked`] method.
455     ///
456     /// [`slice_mut_unchecked`]: str::slice_mut_unchecked
457     ///
458     /// # Safety
459     ///
460     /// Callers of this function are responsible that three preconditions are
461     /// satisfied:
462     ///
463     /// * `begin` must not exceed `end`.
464     /// * `begin` and `end` must be byte positions within the string slice.
465     /// * `begin` and `end` must lie on UTF-8 sequence boundaries.
466     ///
467     /// # Examples
468     ///
469     /// Basic usage:
470     ///
471     /// ```
472     /// let s = "Löwe 老虎 Léopard";
473     ///
474     /// unsafe {
475     ///     assert_eq!("Löwe 老虎 Léopard", s.slice_unchecked(0, 21));
476     /// }
477     ///
478     /// let s = "Hello, world!";
479     ///
480     /// unsafe {
481     ///     assert_eq!("world", s.slice_unchecked(7, 12));
482     /// }
483     /// ```
484     #[stable(feature = "rust1", since = "1.0.0")]
485     #[rustc_deprecated(since = "1.29.0", reason = "use `get_unchecked(begin..end)` instead")]
486     #[inline]
487     pub unsafe fn slice_unchecked(&self, begin: usize, end: usize) -> &str {
488         // SAFETY: the caller must uphold the safety contract for `get_unchecked`;
489         // the slice is dereferencable because `self` is a safe reference.
490         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
491         unsafe { &*(begin..end).get_unchecked(self) }
492     }
493
494     /// Creates a string slice from another string slice, bypassing safety
495     /// checks.
496     /// This is generally not recommended, use with caution! For a safe
497     /// alternative see [`str`] and [`IndexMut`].
498     ///
499     /// [`IndexMut`]: crate::ops::IndexMut
500     ///
501     /// This new slice goes from `begin` to `end`, including `begin` but
502     /// excluding `end`.
503     ///
504     /// To get an immutable string slice instead, see the
505     /// [`slice_unchecked`] method.
506     ///
507     /// [`slice_unchecked`]: str::slice_unchecked
508     ///
509     /// # Safety
510     ///
511     /// Callers of this function are responsible that three preconditions are
512     /// satisfied:
513     ///
514     /// * `begin` must not exceed `end`.
515     /// * `begin` and `end` must be byte positions within the string slice.
516     /// * `begin` and `end` must lie on UTF-8 sequence boundaries.
517     #[stable(feature = "str_slice_mut", since = "1.5.0")]
518     #[rustc_deprecated(since = "1.29.0", reason = "use `get_unchecked_mut(begin..end)` instead")]
519     #[inline]
520     pub unsafe fn slice_mut_unchecked(&mut self, begin: usize, end: usize) -> &mut str {
521         // SAFETY: the caller must uphold the safety contract for `get_unchecked_mut`;
522         // the slice is dereferencable because `self` is a safe reference.
523         // The returned pointer is safe because impls of `SliceIndex` have to guarantee that it is.
524         unsafe { &mut *(begin..end).get_unchecked_mut(self) }
525     }
526
527     /// Divide one string slice into two at an index.
528     ///
529     /// The argument, `mid`, should be a byte offset from the start of the
530     /// string. It must also be on the boundary of a UTF-8 code point.
531     ///
532     /// The two slices returned go from the start of the string slice to `mid`,
533     /// and from `mid` to the end of the string slice.
534     ///
535     /// To get mutable string slices instead, see the [`split_at_mut`]
536     /// method.
537     ///
538     /// [`split_at_mut`]: str::split_at_mut
539     ///
540     /// # Panics
541     ///
542     /// Panics if `mid` is not on a UTF-8 code point boundary, or if it is
543     /// past the end of the last code point of the string slice.
544     ///
545     /// # Examples
546     ///
547     /// Basic usage:
548     ///
549     /// ```
550     /// let s = "Per Martin-Löf";
551     ///
552     /// let (first, last) = s.split_at(3);
553     ///
554     /// assert_eq!("Per", first);
555     /// assert_eq!(" Martin-Löf", last);
556     /// ```
557     #[inline]
558     #[stable(feature = "str_split_at", since = "1.4.0")]
559     pub fn split_at(&self, mid: usize) -> (&str, &str) {
560         // is_char_boundary checks that the index is in [0, .len()]
561         if self.is_char_boundary(mid) {
562             // SAFETY: just checked that `mid` is on a char boundary.
563             unsafe { (self.get_unchecked(0..mid), self.get_unchecked(mid..self.len())) }
564         } else {
565             slice_error_fail(self, 0, mid)
566         }
567     }
568
569     /// Divide one mutable string slice into two at an index.
570     ///
571     /// The argument, `mid`, should be a byte offset from the start of the
572     /// string. It must also be on the boundary of a UTF-8 code point.
573     ///
574     /// The two slices returned go from the start of the string slice to `mid`,
575     /// and from `mid` to the end of the string slice.
576     ///
577     /// To get immutable string slices instead, see the [`split_at`] method.
578     ///
579     /// [`split_at`]: str::split_at
580     ///
581     /// # Panics
582     ///
583     /// Panics if `mid` is not on a UTF-8 code point boundary, or if it is
584     /// past the end of the last code point of the string slice.
585     ///
586     /// # Examples
587     ///
588     /// Basic usage:
589     ///
590     /// ```
591     /// let mut s = "Per Martin-Löf".to_string();
592     /// {
593     ///     let (first, last) = s.split_at_mut(3);
594     ///     first.make_ascii_uppercase();
595     ///     assert_eq!("PER", first);
596     ///     assert_eq!(" Martin-Löf", last);
597     /// }
598     /// assert_eq!("PER Martin-Löf", s);
599     /// ```
600     #[inline]
601     #[stable(feature = "str_split_at", since = "1.4.0")]
602     pub fn split_at_mut(&mut self, mid: usize) -> (&mut str, &mut str) {
603         // is_char_boundary checks that the index is in [0, .len()]
604         if self.is_char_boundary(mid) {
605             let len = self.len();
606             let ptr = self.as_mut_ptr();
607             // SAFETY: just checked that `mid` is on a char boundary.
608             unsafe {
609                 (
610                     from_utf8_unchecked_mut(slice::from_raw_parts_mut(ptr, mid)),
611                     from_utf8_unchecked_mut(slice::from_raw_parts_mut(ptr.add(mid), len - mid)),
612                 )
613             }
614         } else {
615             slice_error_fail(self, 0, mid)
616         }
617     }
618
619     /// Returns an iterator over the [`char`]s of a string slice.
620     ///
621     /// As a string slice consists of valid UTF-8, we can iterate through a
622     /// string slice by [`char`]. This method returns such an iterator.
623     ///
624     /// It's important to remember that [`char`] represents a Unicode Scalar
625     /// Value, and may not match your idea of what a 'character' is. Iteration
626     /// over grapheme clusters may be what you actually want. This functionality
627     /// is not provided by Rust's standard library, check crates.io instead.
628     ///
629     /// # Examples
630     ///
631     /// Basic usage:
632     ///
633     /// ```
634     /// let word = "goodbye";
635     ///
636     /// let count = word.chars().count();
637     /// assert_eq!(7, count);
638     ///
639     /// let mut chars = word.chars();
640     ///
641     /// assert_eq!(Some('g'), chars.next());
642     /// assert_eq!(Some('o'), chars.next());
643     /// assert_eq!(Some('o'), chars.next());
644     /// assert_eq!(Some('d'), chars.next());
645     /// assert_eq!(Some('b'), chars.next());
646     /// assert_eq!(Some('y'), chars.next());
647     /// assert_eq!(Some('e'), chars.next());
648     ///
649     /// assert_eq!(None, chars.next());
650     /// ```
651     ///
652     /// Remember, [`char`]s may not match your intuition about characters:
653     ///
654     /// [`char`]: prim@char
655     ///
656     /// ```
657     /// let y = "y̆";
658     ///
659     /// let mut chars = y.chars();
660     ///
661     /// assert_eq!(Some('y'), chars.next()); // not 'y̆'
662     /// assert_eq!(Some('\u{0306}'), chars.next());
663     ///
664     /// assert_eq!(None, chars.next());
665     /// ```
666     #[stable(feature = "rust1", since = "1.0.0")]
667     #[inline]
668     pub fn chars(&self) -> Chars<'_> {
669         Chars { iter: self.as_bytes().iter() }
670     }
671
672     /// Returns an iterator over the [`char`]s of a string slice, and their
673     /// positions.
674     ///
675     /// As a string slice consists of valid UTF-8, we can iterate through a
676     /// string slice by [`char`]. This method returns an iterator of both
677     /// these [`char`]s, as well as their byte positions.
678     ///
679     /// The iterator yields tuples. The position is first, the [`char`] is
680     /// second.
681     ///
682     /// # Examples
683     ///
684     /// Basic usage:
685     ///
686     /// ```
687     /// let word = "goodbye";
688     ///
689     /// let count = word.char_indices().count();
690     /// assert_eq!(7, count);
691     ///
692     /// let mut char_indices = word.char_indices();
693     ///
694     /// assert_eq!(Some((0, 'g')), char_indices.next());
695     /// assert_eq!(Some((1, 'o')), char_indices.next());
696     /// assert_eq!(Some((2, 'o')), char_indices.next());
697     /// assert_eq!(Some((3, 'd')), char_indices.next());
698     /// assert_eq!(Some((4, 'b')), char_indices.next());
699     /// assert_eq!(Some((5, 'y')), char_indices.next());
700     /// assert_eq!(Some((6, 'e')), char_indices.next());
701     ///
702     /// assert_eq!(None, char_indices.next());
703     /// ```
704     ///
705     /// Remember, [`char`]s may not match your intuition about characters:
706     ///
707     /// [`char`]: prim@char
708     ///
709     /// ```
710     /// let yes = "y̆es";
711     ///
712     /// let mut char_indices = yes.char_indices();
713     ///
714     /// assert_eq!(Some((0, 'y')), char_indices.next()); // not (0, 'y̆')
715     /// assert_eq!(Some((1, '\u{0306}')), char_indices.next());
716     ///
717     /// // note the 3 here - the last character took up two bytes
718     /// assert_eq!(Some((3, 'e')), char_indices.next());
719     /// assert_eq!(Some((4, 's')), char_indices.next());
720     ///
721     /// assert_eq!(None, char_indices.next());
722     /// ```
723     #[stable(feature = "rust1", since = "1.0.0")]
724     #[inline]
725     pub fn char_indices(&self) -> CharIndices<'_> {
726         CharIndices { front_offset: 0, iter: self.chars() }
727     }
728
729     /// An iterator over the bytes of a string slice.
730     ///
731     /// As a string slice consists of a sequence of bytes, we can iterate
732     /// through a string slice by byte. This method returns such an iterator.
733     ///
734     /// # Examples
735     ///
736     /// Basic usage:
737     ///
738     /// ```
739     /// let mut bytes = "bors".bytes();
740     ///
741     /// assert_eq!(Some(b'b'), bytes.next());
742     /// assert_eq!(Some(b'o'), bytes.next());
743     /// assert_eq!(Some(b'r'), bytes.next());
744     /// assert_eq!(Some(b's'), bytes.next());
745     ///
746     /// assert_eq!(None, bytes.next());
747     /// ```
748     #[stable(feature = "rust1", since = "1.0.0")]
749     #[inline]
750     pub fn bytes(&self) -> Bytes<'_> {
751         Bytes(self.as_bytes().iter().copied())
752     }
753
754     /// Splits a string slice by whitespace.
755     ///
756     /// The iterator returned will return string slices that are sub-slices of
757     /// the original string slice, separated by any amount of whitespace.
758     ///
759     /// 'Whitespace' is defined according to the terms of the Unicode Derived
760     /// Core Property `White_Space`. If you only want to split on ASCII whitespace
761     /// instead, use [`split_ascii_whitespace`].
762     ///
763     /// [`split_ascii_whitespace`]: str::split_ascii_whitespace
764     ///
765     /// # Examples
766     ///
767     /// Basic usage:
768     ///
769     /// ```
770     /// let mut iter = "A few words".split_whitespace();
771     ///
772     /// assert_eq!(Some("A"), iter.next());
773     /// assert_eq!(Some("few"), iter.next());
774     /// assert_eq!(Some("words"), iter.next());
775     ///
776     /// assert_eq!(None, iter.next());
777     /// ```
778     ///
779     /// All kinds of whitespace are considered:
780     ///
781     /// ```
782     /// let mut iter = " Mary   had\ta\u{2009}little  \n\t lamb".split_whitespace();
783     /// assert_eq!(Some("Mary"), iter.next());
784     /// assert_eq!(Some("had"), iter.next());
785     /// assert_eq!(Some("a"), iter.next());
786     /// assert_eq!(Some("little"), iter.next());
787     /// assert_eq!(Some("lamb"), iter.next());
788     ///
789     /// assert_eq!(None, iter.next());
790     /// ```
791     #[stable(feature = "split_whitespace", since = "1.1.0")]
792     #[inline]
793     pub fn split_whitespace(&self) -> SplitWhitespace<'_> {
794         SplitWhitespace { inner: self.split(IsWhitespace).filter(IsNotEmpty) }
795     }
796
797     /// Splits a string slice by ASCII whitespace.
798     ///
799     /// The iterator returned will return string slices that are sub-slices of
800     /// the original string slice, separated by any amount of ASCII whitespace.
801     ///
802     /// To split by Unicode `Whitespace` instead, use [`split_whitespace`].
803     ///
804     /// [`split_whitespace`]: str::split_whitespace
805     ///
806     /// # Examples
807     ///
808     /// Basic usage:
809     ///
810     /// ```
811     /// let mut iter = "A few words".split_ascii_whitespace();
812     ///
813     /// assert_eq!(Some("A"), iter.next());
814     /// assert_eq!(Some("few"), iter.next());
815     /// assert_eq!(Some("words"), iter.next());
816     ///
817     /// assert_eq!(None, iter.next());
818     /// ```
819     ///
820     /// All kinds of ASCII whitespace are considered:
821     ///
822     /// ```
823     /// let mut iter = " Mary   had\ta little  \n\t lamb".split_ascii_whitespace();
824     /// assert_eq!(Some("Mary"), iter.next());
825     /// assert_eq!(Some("had"), iter.next());
826     /// assert_eq!(Some("a"), iter.next());
827     /// assert_eq!(Some("little"), iter.next());
828     /// assert_eq!(Some("lamb"), iter.next());
829     ///
830     /// assert_eq!(None, iter.next());
831     /// ```
832     #[stable(feature = "split_ascii_whitespace", since = "1.34.0")]
833     #[inline]
834     pub fn split_ascii_whitespace(&self) -> SplitAsciiWhitespace<'_> {
835         let inner =
836             self.as_bytes().split(IsAsciiWhitespace).filter(BytesIsNotEmpty).map(UnsafeBytesToStr);
837         SplitAsciiWhitespace { inner }
838     }
839
840     /// An iterator over the lines of a string, as string slices.
841     ///
842     /// Lines are ended with either a newline (`\n`) or a carriage return with
843     /// a line feed (`\r\n`).
844     ///
845     /// The final line ending is optional. A string that ends with a final line
846     /// ending will return the same lines as an otherwise identical string
847     /// without a final line ending.
848     ///
849     /// # Examples
850     ///
851     /// Basic usage:
852     ///
853     /// ```
854     /// let text = "foo\r\nbar\n\nbaz\n";
855     /// let mut lines = text.lines();
856     ///
857     /// assert_eq!(Some("foo"), lines.next());
858     /// assert_eq!(Some("bar"), lines.next());
859     /// assert_eq!(Some(""), lines.next());
860     /// assert_eq!(Some("baz"), lines.next());
861     ///
862     /// assert_eq!(None, lines.next());
863     /// ```
864     ///
865     /// The final line ending isn't required:
866     ///
867     /// ```
868     /// let text = "foo\nbar\n\r\nbaz";
869     /// let mut lines = text.lines();
870     ///
871     /// assert_eq!(Some("foo"), lines.next());
872     /// assert_eq!(Some("bar"), lines.next());
873     /// assert_eq!(Some(""), lines.next());
874     /// assert_eq!(Some("baz"), lines.next());
875     ///
876     /// assert_eq!(None, lines.next());
877     /// ```
878     #[stable(feature = "rust1", since = "1.0.0")]
879     #[inline]
880     pub fn lines(&self) -> Lines<'_> {
881         Lines(self.split_terminator('\n').map(LinesAnyMap))
882     }
883
884     /// An iterator over the lines of a string.
885     #[stable(feature = "rust1", since = "1.0.0")]
886     #[rustc_deprecated(since = "1.4.0", reason = "use lines() instead now")]
887     #[inline]
888     #[allow(deprecated)]
889     pub fn lines_any(&self) -> LinesAny<'_> {
890         LinesAny(self.lines())
891     }
892
893     /// Returns an iterator of `u16` over the string encoded as UTF-16.
894     ///
895     /// # Examples
896     ///
897     /// Basic usage:
898     ///
899     /// ```
900     /// let text = "Zażółć gęślą jaźń";
901     ///
902     /// let utf8_len = text.len();
903     /// let utf16_len = text.encode_utf16().count();
904     ///
905     /// assert!(utf16_len <= utf8_len);
906     /// ```
907     #[stable(feature = "encode_utf16", since = "1.8.0")]
908     pub fn encode_utf16(&self) -> EncodeUtf16<'_> {
909         EncodeUtf16 { chars: self.chars(), extra: 0 }
910     }
911
912     /// Returns `true` if the given pattern matches a sub-slice of
913     /// this string slice.
914     ///
915     /// Returns `false` if it does not.
916     ///
917     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
918     /// function or closure that determines if a character matches.
919     ///
920     /// [`char`]: prim@char
921     /// [pattern]: self::pattern
922     ///
923     /// # Examples
924     ///
925     /// Basic usage:
926     ///
927     /// ```
928     /// let bananas = "bananas";
929     ///
930     /// assert!(bananas.contains("nana"));
931     /// assert!(!bananas.contains("apples"));
932     /// ```
933     #[stable(feature = "rust1", since = "1.0.0")]
934     #[inline]
935     pub fn contains<'a, P: Pattern<'a>>(&'a self, pat: P) -> bool {
936         pat.is_contained_in(self)
937     }
938
939     /// Returns `true` if the given pattern matches a prefix of this
940     /// string slice.
941     ///
942     /// Returns `false` if it does not.
943     ///
944     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
945     /// function or closure that determines if a character matches.
946     ///
947     /// [`char`]: prim@char
948     /// [pattern]: self::pattern
949     ///
950     /// # Examples
951     ///
952     /// Basic usage:
953     ///
954     /// ```
955     /// let bananas = "bananas";
956     ///
957     /// assert!(bananas.starts_with("bana"));
958     /// assert!(!bananas.starts_with("nana"));
959     /// ```
960     #[stable(feature = "rust1", since = "1.0.0")]
961     pub fn starts_with<'a, P: Pattern<'a>>(&'a self, pat: P) -> bool {
962         pat.is_prefix_of(self)
963     }
964
965     /// Returns `true` if the given pattern matches a suffix of this
966     /// string slice.
967     ///
968     /// Returns `false` if it does not.
969     ///
970     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
971     /// function or closure that determines if a character matches.
972     ///
973     /// [`char`]: prim@char
974     /// [pattern]: self::pattern
975     ///
976     /// # Examples
977     ///
978     /// Basic usage:
979     ///
980     /// ```
981     /// let bananas = "bananas";
982     ///
983     /// assert!(bananas.ends_with("anas"));
984     /// assert!(!bananas.ends_with("nana"));
985     /// ```
986     #[stable(feature = "rust1", since = "1.0.0")]
987     pub fn ends_with<'a, P>(&'a self, pat: P) -> bool
988     where
989         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
990     {
991         pat.is_suffix_of(self)
992     }
993
994     /// Returns the byte index of the first character of this string slice that
995     /// matches the pattern.
996     ///
997     /// Returns [`None`] if the pattern doesn't match.
998     ///
999     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1000     /// function or closure that determines if a character matches.
1001     ///
1002     /// [`char`]: prim@char
1003     /// [pattern]: self::pattern
1004     ///
1005     /// # Examples
1006     ///
1007     /// Simple patterns:
1008     ///
1009     /// ```
1010     /// let s = "Löwe 老虎 Léopard Gepardi";
1011     ///
1012     /// assert_eq!(s.find('L'), Some(0));
1013     /// assert_eq!(s.find('é'), Some(14));
1014     /// assert_eq!(s.find("pard"), Some(17));
1015     /// ```
1016     ///
1017     /// More complex patterns using point-free style and closures:
1018     ///
1019     /// ```
1020     /// let s = "Löwe 老虎 Léopard";
1021     ///
1022     /// assert_eq!(s.find(char::is_whitespace), Some(5));
1023     /// assert_eq!(s.find(char::is_lowercase), Some(1));
1024     /// assert_eq!(s.find(|c: char| c.is_whitespace() || c.is_lowercase()), Some(1));
1025     /// assert_eq!(s.find(|c: char| (c < 'o') && (c > 'a')), Some(4));
1026     /// ```
1027     ///
1028     /// Not finding the pattern:
1029     ///
1030     /// ```
1031     /// let s = "Löwe 老虎 Léopard";
1032     /// let x: &[_] = &['1', '2'];
1033     ///
1034     /// assert_eq!(s.find(x), None);
1035     /// ```
1036     #[stable(feature = "rust1", since = "1.0.0")]
1037     #[inline]
1038     pub fn find<'a, P: Pattern<'a>>(&'a self, pat: P) -> Option<usize> {
1039         pat.into_searcher(self).next_match().map(|(i, _)| i)
1040     }
1041
1042     /// Returns the byte index for the first character of the rightmost match of the pattern in
1043     /// this string slice.
1044     ///
1045     /// Returns [`None`] if the pattern doesn't match.
1046     ///
1047     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1048     /// function or closure that determines if a character matches.
1049     ///
1050     /// [`char`]: prim@char
1051     /// [pattern]: self::pattern
1052     ///
1053     /// # Examples
1054     ///
1055     /// Simple patterns:
1056     ///
1057     /// ```
1058     /// let s = "Löwe 老虎 Léopard Gepardi";
1059     ///
1060     /// assert_eq!(s.rfind('L'), Some(13));
1061     /// assert_eq!(s.rfind('é'), Some(14));
1062     /// assert_eq!(s.rfind("pard"), Some(24));
1063     /// ```
1064     ///
1065     /// More complex patterns with closures:
1066     ///
1067     /// ```
1068     /// let s = "Löwe 老虎 Léopard";
1069     ///
1070     /// assert_eq!(s.rfind(char::is_whitespace), Some(12));
1071     /// assert_eq!(s.rfind(char::is_lowercase), Some(20));
1072     /// ```
1073     ///
1074     /// Not finding the pattern:
1075     ///
1076     /// ```
1077     /// let s = "Löwe 老虎 Léopard";
1078     /// let x: &[_] = &['1', '2'];
1079     ///
1080     /// assert_eq!(s.rfind(x), None);
1081     /// ```
1082     #[stable(feature = "rust1", since = "1.0.0")]
1083     #[inline]
1084     pub fn rfind<'a, P>(&'a self, pat: P) -> Option<usize>
1085     where
1086         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1087     {
1088         pat.into_searcher(self).next_match_back().map(|(i, _)| i)
1089     }
1090
1091     /// An iterator over substrings of this string slice, separated by
1092     /// characters matched by a pattern.
1093     ///
1094     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1095     /// function or closure that determines if a character matches.
1096     ///
1097     /// [`char`]: prim@char
1098     /// [pattern]: self::pattern
1099     ///
1100     /// # Iterator behavior
1101     ///
1102     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1103     /// allows a reverse search and forward/reverse search yields the same
1104     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1105     ///
1106     /// If the pattern allows a reverse search but its results might differ
1107     /// from a forward search, the [`rsplit`] method can be used.
1108     ///
1109     /// [`rsplit`]: str::rsplit
1110     ///
1111     /// # Examples
1112     ///
1113     /// Simple patterns:
1114     ///
1115     /// ```
1116     /// let v: Vec<&str> = "Mary had a little lamb".split(' ').collect();
1117     /// assert_eq!(v, ["Mary", "had", "a", "little", "lamb"]);
1118     ///
1119     /// let v: Vec<&str> = "".split('X').collect();
1120     /// assert_eq!(v, [""]);
1121     ///
1122     /// let v: Vec<&str> = "lionXXtigerXleopard".split('X').collect();
1123     /// assert_eq!(v, ["lion", "", "tiger", "leopard"]);
1124     ///
1125     /// let v: Vec<&str> = "lion::tiger::leopard".split("::").collect();
1126     /// assert_eq!(v, ["lion", "tiger", "leopard"]);
1127     ///
1128     /// let v: Vec<&str> = "abc1def2ghi".split(char::is_numeric).collect();
1129     /// assert_eq!(v, ["abc", "def", "ghi"]);
1130     ///
1131     /// let v: Vec<&str> = "lionXtigerXleopard".split(char::is_uppercase).collect();
1132     /// assert_eq!(v, ["lion", "tiger", "leopard"]);
1133     /// ```
1134     ///
1135     /// A more complex pattern, using a closure:
1136     ///
1137     /// ```
1138     /// let v: Vec<&str> = "abc1defXghi".split(|c| c == '1' || c == 'X').collect();
1139     /// assert_eq!(v, ["abc", "def", "ghi"]);
1140     /// ```
1141     ///
1142     /// If a string contains multiple contiguous separators, you will end up
1143     /// with empty strings in the output:
1144     ///
1145     /// ```
1146     /// let x = "||||a||b|c".to_string();
1147     /// let d: Vec<_> = x.split('|').collect();
1148     ///
1149     /// assert_eq!(d, &["", "", "", "", "a", "", "b", "c"]);
1150     /// ```
1151     ///
1152     /// Contiguous separators are separated by the empty string.
1153     ///
1154     /// ```
1155     /// let x = "(///)".to_string();
1156     /// let d: Vec<_> = x.split('/').collect();
1157     ///
1158     /// assert_eq!(d, &["(", "", "", ")"]);
1159     /// ```
1160     ///
1161     /// Separators at the start or end of a string are neighbored
1162     /// by empty strings.
1163     ///
1164     /// ```
1165     /// let d: Vec<_> = "010".split("0").collect();
1166     /// assert_eq!(d, &["", "1", ""]);
1167     /// ```
1168     ///
1169     /// When the empty string is used as a separator, it separates
1170     /// every character in the string, along with the beginning
1171     /// and end of the string.
1172     ///
1173     /// ```
1174     /// let f: Vec<_> = "rust".split("").collect();
1175     /// assert_eq!(f, &["", "r", "u", "s", "t", ""]);
1176     /// ```
1177     ///
1178     /// Contiguous separators can lead to possibly surprising behavior
1179     /// when whitespace is used as the separator. This code is correct:
1180     ///
1181     /// ```
1182     /// let x = "    a  b c".to_string();
1183     /// let d: Vec<_> = x.split(' ').collect();
1184     ///
1185     /// assert_eq!(d, &["", "", "", "", "a", "", "b", "c"]);
1186     /// ```
1187     ///
1188     /// It does _not_ give you:
1189     ///
1190     /// ```,ignore
1191     /// assert_eq!(d, &["a", "b", "c"]);
1192     /// ```
1193     ///
1194     /// Use [`split_whitespace`] for this behavior.
1195     ///
1196     /// [`split_whitespace`]: str::split_whitespace
1197     #[stable(feature = "rust1", since = "1.0.0")]
1198     #[inline]
1199     pub fn split<'a, P: Pattern<'a>>(&'a self, pat: P) -> Split<'a, P> {
1200         Split(SplitInternal {
1201             start: 0,
1202             end: self.len(),
1203             matcher: pat.into_searcher(self),
1204             allow_trailing_empty: true,
1205             finished: false,
1206         })
1207     }
1208
1209     /// An iterator over substrings of this string slice, separated by
1210     /// characters matched by a pattern. Differs from the iterator produced by
1211     /// `split` in that `split_inclusive` leaves the matched part as the
1212     /// terminator of the substring.
1213     ///
1214     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1215     /// function or closure that determines if a character matches.
1216     ///
1217     /// [`char`]: prim@char
1218     /// [pattern]: self::pattern
1219     ///
1220     /// # Examples
1221     ///
1222     /// ```
1223     /// #![feature(split_inclusive)]
1224     /// let v: Vec<&str> = "Mary had a little lamb\nlittle lamb\nlittle lamb."
1225     ///     .split_inclusive('\n').collect();
1226     /// assert_eq!(v, ["Mary had a little lamb\n", "little lamb\n", "little lamb."]);
1227     /// ```
1228     ///
1229     /// If the last element of the string is matched,
1230     /// that element will be considered the terminator of the preceding substring.
1231     /// That substring will be the last item returned by the iterator.
1232     ///
1233     /// ```
1234     /// #![feature(split_inclusive)]
1235     /// let v: Vec<&str> = "Mary had a little lamb\nlittle lamb\nlittle lamb.\n"
1236     ///     .split_inclusive('\n').collect();
1237     /// assert_eq!(v, ["Mary had a little lamb\n", "little lamb\n", "little lamb.\n"]);
1238     /// ```
1239     #[unstable(feature = "split_inclusive", issue = "72360")]
1240     #[inline]
1241     pub fn split_inclusive<'a, P: Pattern<'a>>(&'a self, pat: P) -> SplitInclusive<'a, P> {
1242         SplitInclusive(SplitInternal {
1243             start: 0,
1244             end: self.len(),
1245             matcher: pat.into_searcher(self),
1246             allow_trailing_empty: false,
1247             finished: false,
1248         })
1249     }
1250
1251     /// An iterator over substrings of the given string slice, separated by
1252     /// characters matched by a pattern and yielded in reverse order.
1253     ///
1254     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1255     /// function or closure that determines if a character matches.
1256     ///
1257     /// [`char`]: prim@char
1258     /// [pattern]: self::pattern
1259     ///
1260     /// # Iterator behavior
1261     ///
1262     /// The returned iterator requires that the pattern supports a reverse
1263     /// search, and it will be a [`DoubleEndedIterator`] if a forward/reverse
1264     /// search yields the same elements.
1265     ///
1266     /// For iterating from the front, the [`split`] method can be used.
1267     ///
1268     /// [`split`]: str::split
1269     ///
1270     /// # Examples
1271     ///
1272     /// Simple patterns:
1273     ///
1274     /// ```
1275     /// let v: Vec<&str> = "Mary had a little lamb".rsplit(' ').collect();
1276     /// assert_eq!(v, ["lamb", "little", "a", "had", "Mary"]);
1277     ///
1278     /// let v: Vec<&str> = "".rsplit('X').collect();
1279     /// assert_eq!(v, [""]);
1280     ///
1281     /// let v: Vec<&str> = "lionXXtigerXleopard".rsplit('X').collect();
1282     /// assert_eq!(v, ["leopard", "tiger", "", "lion"]);
1283     ///
1284     /// let v: Vec<&str> = "lion::tiger::leopard".rsplit("::").collect();
1285     /// assert_eq!(v, ["leopard", "tiger", "lion"]);
1286     /// ```
1287     ///
1288     /// A more complex pattern, using a closure:
1289     ///
1290     /// ```
1291     /// let v: Vec<&str> = "abc1defXghi".rsplit(|c| c == '1' || c == 'X').collect();
1292     /// assert_eq!(v, ["ghi", "def", "abc"]);
1293     /// ```
1294     #[stable(feature = "rust1", since = "1.0.0")]
1295     #[inline]
1296     pub fn rsplit<'a, P>(&'a self, pat: P) -> RSplit<'a, P>
1297     where
1298         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1299     {
1300         RSplit(self.split(pat).0)
1301     }
1302
1303     /// An iterator over substrings of the given string slice, separated by
1304     /// characters matched by a pattern.
1305     ///
1306     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1307     /// function or closure that determines if a character matches.
1308     ///
1309     /// [`char`]: prim@char
1310     /// [pattern]: self::pattern
1311     ///
1312     /// Equivalent to [`split`], except that the trailing substring
1313     /// is skipped if empty.
1314     ///
1315     /// [`split`]: str::split
1316     ///
1317     /// This method can be used for string data that is _terminated_,
1318     /// rather than _separated_ by a pattern.
1319     ///
1320     /// # Iterator behavior
1321     ///
1322     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1323     /// allows a reverse search and forward/reverse search yields the same
1324     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1325     ///
1326     /// If the pattern allows a reverse search but its results might differ
1327     /// from a forward search, the [`rsplit_terminator`] method can be used.
1328     ///
1329     /// [`rsplit_terminator`]: str::rsplit_terminator
1330     ///
1331     /// # Examples
1332     ///
1333     /// Basic usage:
1334     ///
1335     /// ```
1336     /// let v: Vec<&str> = "A.B.".split_terminator('.').collect();
1337     /// assert_eq!(v, ["A", "B"]);
1338     ///
1339     /// let v: Vec<&str> = "A..B..".split_terminator(".").collect();
1340     /// assert_eq!(v, ["A", "", "B", ""]);
1341     /// ```
1342     #[stable(feature = "rust1", since = "1.0.0")]
1343     #[inline]
1344     pub fn split_terminator<'a, P: Pattern<'a>>(&'a self, pat: P) -> SplitTerminator<'a, P> {
1345         SplitTerminator(SplitInternal { allow_trailing_empty: false, ..self.split(pat).0 })
1346     }
1347
1348     /// An iterator over substrings of `self`, separated by characters
1349     /// matched by a pattern and yielded in reverse order.
1350     ///
1351     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1352     /// function or closure that determines if a character matches.
1353     ///
1354     /// [`char`]: prim@char
1355     /// [pattern]: self::pattern
1356     ///
1357     /// Equivalent to [`split`], except that the trailing substring is
1358     /// skipped if empty.
1359     ///
1360     /// [`split`]: str::split
1361     ///
1362     /// This method can be used for string data that is _terminated_,
1363     /// rather than _separated_ by a pattern.
1364     ///
1365     /// # Iterator behavior
1366     ///
1367     /// The returned iterator requires that the pattern supports a
1368     /// reverse search, and it will be double ended if a forward/reverse
1369     /// search yields the same elements.
1370     ///
1371     /// For iterating from the front, the [`split_terminator`] method can be
1372     /// used.
1373     ///
1374     /// [`split_terminator`]: str::split_terminator
1375     ///
1376     /// # Examples
1377     ///
1378     /// ```
1379     /// let v: Vec<&str> = "A.B.".rsplit_terminator('.').collect();
1380     /// assert_eq!(v, ["B", "A"]);
1381     ///
1382     /// let v: Vec<&str> = "A..B..".rsplit_terminator(".").collect();
1383     /// assert_eq!(v, ["", "B", "", "A"]);
1384     /// ```
1385     #[stable(feature = "rust1", since = "1.0.0")]
1386     #[inline]
1387     pub fn rsplit_terminator<'a, P>(&'a self, pat: P) -> RSplitTerminator<'a, P>
1388     where
1389         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1390     {
1391         RSplitTerminator(self.split_terminator(pat).0)
1392     }
1393
1394     /// An iterator over substrings of the given string slice, separated by a
1395     /// pattern, restricted to returning at most `n` items.
1396     ///
1397     /// If `n` substrings are returned, the last substring (the `n`th substring)
1398     /// will contain the remainder of the string.
1399     ///
1400     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1401     /// function or closure that determines if a character matches.
1402     ///
1403     /// [`char`]: prim@char
1404     /// [pattern]: self::pattern
1405     ///
1406     /// # Iterator behavior
1407     ///
1408     /// The returned iterator will not be double ended, because it is
1409     /// not efficient to support.
1410     ///
1411     /// If the pattern allows a reverse search, the [`rsplitn`] method can be
1412     /// used.
1413     ///
1414     /// [`rsplitn`]: str::rsplitn
1415     ///
1416     /// # Examples
1417     ///
1418     /// Simple patterns:
1419     ///
1420     /// ```
1421     /// let v: Vec<&str> = "Mary had a little lambda".splitn(3, ' ').collect();
1422     /// assert_eq!(v, ["Mary", "had", "a little lambda"]);
1423     ///
1424     /// let v: Vec<&str> = "lionXXtigerXleopard".splitn(3, "X").collect();
1425     /// assert_eq!(v, ["lion", "", "tigerXleopard"]);
1426     ///
1427     /// let v: Vec<&str> = "abcXdef".splitn(1, 'X').collect();
1428     /// assert_eq!(v, ["abcXdef"]);
1429     ///
1430     /// let v: Vec<&str> = "".splitn(1, 'X').collect();
1431     /// assert_eq!(v, [""]);
1432     /// ```
1433     ///
1434     /// A more complex pattern, using a closure:
1435     ///
1436     /// ```
1437     /// let v: Vec<&str> = "abc1defXghi".splitn(2, |c| c == '1' || c == 'X').collect();
1438     /// assert_eq!(v, ["abc", "defXghi"]);
1439     /// ```
1440     #[stable(feature = "rust1", since = "1.0.0")]
1441     #[inline]
1442     pub fn splitn<'a, P: Pattern<'a>>(&'a self, n: usize, pat: P) -> SplitN<'a, P> {
1443         SplitN(SplitNInternal { iter: self.split(pat).0, count: n })
1444     }
1445
1446     /// An iterator over substrings of this string slice, separated by a
1447     /// pattern, starting from the end of the string, restricted to returning
1448     /// at most `n` items.
1449     ///
1450     /// If `n` substrings are returned, the last substring (the `n`th substring)
1451     /// will contain the remainder of the string.
1452     ///
1453     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1454     /// function or closure that determines if a character matches.
1455     ///
1456     /// [`char`]: prim@char
1457     /// [pattern]: self::pattern
1458     ///
1459     /// # Iterator behavior
1460     ///
1461     /// The returned iterator will not be double ended, because it is not
1462     /// efficient to support.
1463     ///
1464     /// For splitting from the front, the [`splitn`] method can be used.
1465     ///
1466     /// [`splitn`]: str::splitn
1467     ///
1468     /// # Examples
1469     ///
1470     /// Simple patterns:
1471     ///
1472     /// ```
1473     /// let v: Vec<&str> = "Mary had a little lamb".rsplitn(3, ' ').collect();
1474     /// assert_eq!(v, ["lamb", "little", "Mary had a"]);
1475     ///
1476     /// let v: Vec<&str> = "lionXXtigerXleopard".rsplitn(3, 'X').collect();
1477     /// assert_eq!(v, ["leopard", "tiger", "lionX"]);
1478     ///
1479     /// let v: Vec<&str> = "lion::tiger::leopard".rsplitn(2, "::").collect();
1480     /// assert_eq!(v, ["leopard", "lion::tiger"]);
1481     /// ```
1482     ///
1483     /// A more complex pattern, using a closure:
1484     ///
1485     /// ```
1486     /// let v: Vec<&str> = "abc1defXghi".rsplitn(2, |c| c == '1' || c == 'X').collect();
1487     /// assert_eq!(v, ["ghi", "abc1def"]);
1488     /// ```
1489     #[stable(feature = "rust1", since = "1.0.0")]
1490     #[inline]
1491     pub fn rsplitn<'a, P>(&'a self, n: usize, pat: P) -> RSplitN<'a, P>
1492     where
1493         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1494     {
1495         RSplitN(self.splitn(n, pat).0)
1496     }
1497
1498     /// Splits the string on the first occurrence of the specified delimiter and
1499     /// returns prefix before delimiter and suffix after delimiter.
1500     ///
1501     /// # Examples
1502     ///
1503     /// ```
1504     /// #![feature(str_split_once)]
1505     ///
1506     /// assert_eq!("cfg".split_once('='), None);
1507     /// assert_eq!("cfg=foo".split_once('='), Some(("cfg", "foo")));
1508     /// assert_eq!("cfg=foo=bar".split_once('='), Some(("cfg", "foo=bar")));
1509     /// ```
1510     #[unstable(feature = "str_split_once", reason = "newly added", issue = "74773")]
1511     #[inline]
1512     pub fn split_once<'a, P: Pattern<'a>>(&'a self, delimiter: P) -> Option<(&'a str, &'a str)> {
1513         let (start, end) = delimiter.into_searcher(self).next_match()?;
1514         Some((&self[..start], &self[end..]))
1515     }
1516
1517     /// Splits the string on the last occurrence of the specified delimiter and
1518     /// returns prefix before delimiter and suffix after delimiter.
1519     ///
1520     /// # Examples
1521     ///
1522     /// ```
1523     /// #![feature(str_split_once)]
1524     ///
1525     /// assert_eq!("cfg".rsplit_once('='), None);
1526     /// assert_eq!("cfg=foo".rsplit_once('='), Some(("cfg", "foo")));
1527     /// assert_eq!("cfg=foo=bar".rsplit_once('='), Some(("cfg=foo", "bar")));
1528     /// ```
1529     #[unstable(feature = "str_split_once", reason = "newly added", issue = "74773")]
1530     #[inline]
1531     pub fn rsplit_once<'a, P>(&'a self, delimiter: P) -> Option<(&'a str, &'a str)>
1532     where
1533         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1534     {
1535         let (start, end) = delimiter.into_searcher(self).next_match_back()?;
1536         Some((&self[..start], &self[end..]))
1537     }
1538
1539     /// An iterator over the disjoint matches of a pattern within the given string
1540     /// slice.
1541     ///
1542     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1543     /// function or closure that determines if a character matches.
1544     ///
1545     /// [`char`]: prim@char
1546     /// [pattern]: self::pattern
1547     ///
1548     /// # Iterator behavior
1549     ///
1550     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1551     /// allows a reverse search and forward/reverse search yields the same
1552     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1553     ///
1554     /// If the pattern allows a reverse search but its results might differ
1555     /// from a forward search, the [`rmatches`] method can be used.
1556     ///
1557     /// [`rmatches`]: str::matches
1558     ///
1559     /// # Examples
1560     ///
1561     /// Basic usage:
1562     ///
1563     /// ```
1564     /// let v: Vec<&str> = "abcXXXabcYYYabc".matches("abc").collect();
1565     /// assert_eq!(v, ["abc", "abc", "abc"]);
1566     ///
1567     /// let v: Vec<&str> = "1abc2abc3".matches(char::is_numeric).collect();
1568     /// assert_eq!(v, ["1", "2", "3"]);
1569     /// ```
1570     #[stable(feature = "str_matches", since = "1.2.0")]
1571     #[inline]
1572     pub fn matches<'a, P: Pattern<'a>>(&'a self, pat: P) -> Matches<'a, P> {
1573         Matches(MatchesInternal(pat.into_searcher(self)))
1574     }
1575
1576     /// An iterator over the disjoint matches of a pattern within this string slice,
1577     /// yielded in reverse order.
1578     ///
1579     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1580     /// function or closure that determines if a character matches.
1581     ///
1582     /// [`char`]: prim@char
1583     /// [pattern]: self::pattern
1584     ///
1585     /// # Iterator behavior
1586     ///
1587     /// The returned iterator requires that the pattern supports a reverse
1588     /// search, and it will be a [`DoubleEndedIterator`] if a forward/reverse
1589     /// search yields the same elements.
1590     ///
1591     /// For iterating from the front, the [`matches`] method can be used.
1592     ///
1593     /// [`matches`]: str::matches
1594     ///
1595     /// # Examples
1596     ///
1597     /// Basic usage:
1598     ///
1599     /// ```
1600     /// let v: Vec<&str> = "abcXXXabcYYYabc".rmatches("abc").collect();
1601     /// assert_eq!(v, ["abc", "abc", "abc"]);
1602     ///
1603     /// let v: Vec<&str> = "1abc2abc3".rmatches(char::is_numeric).collect();
1604     /// assert_eq!(v, ["3", "2", "1"]);
1605     /// ```
1606     #[stable(feature = "str_matches", since = "1.2.0")]
1607     #[inline]
1608     pub fn rmatches<'a, P>(&'a self, pat: P) -> RMatches<'a, P>
1609     where
1610         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1611     {
1612         RMatches(self.matches(pat).0)
1613     }
1614
1615     /// An iterator over the disjoint matches of a pattern within this string
1616     /// slice as well as the index that the match starts at.
1617     ///
1618     /// For matches of `pat` within `self` that overlap, only the indices
1619     /// corresponding to the first match are returned.
1620     ///
1621     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1622     /// function or closure that determines if a character matches.
1623     ///
1624     /// [`char`]: prim@char
1625     /// [pattern]: self::pattern
1626     ///
1627     /// # Iterator behavior
1628     ///
1629     /// The returned iterator will be a [`DoubleEndedIterator`] if the pattern
1630     /// allows a reverse search and forward/reverse search yields the same
1631     /// elements. This is true for, e.g., [`char`], but not for `&str`.
1632     ///
1633     /// If the pattern allows a reverse search but its results might differ
1634     /// from a forward search, the [`rmatch_indices`] method can be used.
1635     ///
1636     /// [`rmatch_indices`]: str::match_indices
1637     ///
1638     /// # Examples
1639     ///
1640     /// Basic usage:
1641     ///
1642     /// ```
1643     /// let v: Vec<_> = "abcXXXabcYYYabc".match_indices("abc").collect();
1644     /// assert_eq!(v, [(0, "abc"), (6, "abc"), (12, "abc")]);
1645     ///
1646     /// let v: Vec<_> = "1abcabc2".match_indices("abc").collect();
1647     /// assert_eq!(v, [(1, "abc"), (4, "abc")]);
1648     ///
1649     /// let v: Vec<_> = "ababa".match_indices("aba").collect();
1650     /// assert_eq!(v, [(0, "aba")]); // only the first `aba`
1651     /// ```
1652     #[stable(feature = "str_match_indices", since = "1.5.0")]
1653     #[inline]
1654     pub fn match_indices<'a, P: Pattern<'a>>(&'a self, pat: P) -> MatchIndices<'a, P> {
1655         MatchIndices(MatchIndicesInternal(pat.into_searcher(self)))
1656     }
1657
1658     /// An iterator over the disjoint matches of a pattern within `self`,
1659     /// yielded in reverse order along with the index of the match.
1660     ///
1661     /// For matches of `pat` within `self` that overlap, only the indices
1662     /// corresponding to the last match are returned.
1663     ///
1664     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1665     /// function or closure that determines if a character matches.
1666     ///
1667     /// [`char`]: prim@char
1668     /// [pattern]: self::pattern
1669     ///
1670     /// # Iterator behavior
1671     ///
1672     /// The returned iterator requires that the pattern supports a reverse
1673     /// search, and it will be a [`DoubleEndedIterator`] if a forward/reverse
1674     /// search yields the same elements.
1675     ///
1676     /// For iterating from the front, the [`match_indices`] method can be used.
1677     ///
1678     /// [`match_indices`]: str::match_indices
1679     ///
1680     /// # Examples
1681     ///
1682     /// Basic usage:
1683     ///
1684     /// ```
1685     /// let v: Vec<_> = "abcXXXabcYYYabc".rmatch_indices("abc").collect();
1686     /// assert_eq!(v, [(12, "abc"), (6, "abc"), (0, "abc")]);
1687     ///
1688     /// let v: Vec<_> = "1abcabc2".rmatch_indices("abc").collect();
1689     /// assert_eq!(v, [(4, "abc"), (1, "abc")]);
1690     ///
1691     /// let v: Vec<_> = "ababa".rmatch_indices("aba").collect();
1692     /// assert_eq!(v, [(2, "aba")]); // only the last `aba`
1693     /// ```
1694     #[stable(feature = "str_match_indices", since = "1.5.0")]
1695     #[inline]
1696     pub fn rmatch_indices<'a, P>(&'a self, pat: P) -> RMatchIndices<'a, P>
1697     where
1698         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
1699     {
1700         RMatchIndices(self.match_indices(pat).0)
1701     }
1702
1703     /// Returns a string slice with leading and trailing whitespace removed.
1704     ///
1705     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1706     /// Core Property `White_Space`.
1707     ///
1708     /// # Examples
1709     ///
1710     /// Basic usage:
1711     ///
1712     /// ```
1713     /// let s = " Hello\tworld\t";
1714     ///
1715     /// assert_eq!("Hello\tworld", s.trim());
1716     /// ```
1717     #[inline]
1718     #[must_use = "this returns the trimmed string as a slice, \
1719                   without modifying the original"]
1720     #[stable(feature = "rust1", since = "1.0.0")]
1721     pub fn trim(&self) -> &str {
1722         self.trim_matches(|c: char| c.is_whitespace())
1723     }
1724
1725     /// Returns a string slice with leading whitespace removed.
1726     ///
1727     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1728     /// Core Property `White_Space`.
1729     ///
1730     /// # Text directionality
1731     ///
1732     /// A string is a sequence of bytes. `start` in this context means the first
1733     /// position of that byte string; for a left-to-right language like English or
1734     /// Russian, this will be left side, and for right-to-left languages like
1735     /// Arabic or Hebrew, this will be the right side.
1736     ///
1737     /// # Examples
1738     ///
1739     /// Basic usage:
1740     ///
1741     /// ```
1742     /// let s = " Hello\tworld\t";
1743     /// assert_eq!("Hello\tworld\t", s.trim_start());
1744     /// ```
1745     ///
1746     /// Directionality:
1747     ///
1748     /// ```
1749     /// let s = "  English  ";
1750     /// assert!(Some('E') == s.trim_start().chars().next());
1751     ///
1752     /// let s = "  עברית  ";
1753     /// assert!(Some('ע') == s.trim_start().chars().next());
1754     /// ```
1755     #[inline]
1756     #[must_use = "this returns the trimmed string as a new slice, \
1757                   without modifying the original"]
1758     #[stable(feature = "trim_direction", since = "1.30.0")]
1759     pub fn trim_start(&self) -> &str {
1760         self.trim_start_matches(|c: char| c.is_whitespace())
1761     }
1762
1763     /// Returns a string slice with trailing whitespace removed.
1764     ///
1765     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1766     /// Core Property `White_Space`.
1767     ///
1768     /// # Text directionality
1769     ///
1770     /// A string is a sequence of bytes. `end` in this context means the last
1771     /// position of that byte string; for a left-to-right language like English or
1772     /// Russian, this will be right side, and for right-to-left languages like
1773     /// Arabic or Hebrew, this will be the left side.
1774     ///
1775     /// # Examples
1776     ///
1777     /// Basic usage:
1778     ///
1779     /// ```
1780     /// let s = " Hello\tworld\t";
1781     /// assert_eq!(" Hello\tworld", s.trim_end());
1782     /// ```
1783     ///
1784     /// Directionality:
1785     ///
1786     /// ```
1787     /// let s = "  English  ";
1788     /// assert!(Some('h') == s.trim_end().chars().rev().next());
1789     ///
1790     /// let s = "  עברית  ";
1791     /// assert!(Some('ת') == s.trim_end().chars().rev().next());
1792     /// ```
1793     #[inline]
1794     #[must_use = "this returns the trimmed string as a new slice, \
1795                   without modifying the original"]
1796     #[stable(feature = "trim_direction", since = "1.30.0")]
1797     pub fn trim_end(&self) -> &str {
1798         self.trim_end_matches(|c: char| c.is_whitespace())
1799     }
1800
1801     /// Returns a string slice with leading whitespace removed.
1802     ///
1803     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1804     /// Core Property `White_Space`.
1805     ///
1806     /// # Text directionality
1807     ///
1808     /// A string is a sequence of bytes. 'Left' in this context means the first
1809     /// position of that byte string; for a language like Arabic or Hebrew
1810     /// which are 'right to left' rather than 'left to right', this will be
1811     /// the _right_ side, not the left.
1812     ///
1813     /// # Examples
1814     ///
1815     /// Basic usage:
1816     ///
1817     /// ```
1818     /// let s = " Hello\tworld\t";
1819     ///
1820     /// assert_eq!("Hello\tworld\t", s.trim_left());
1821     /// ```
1822     ///
1823     /// Directionality:
1824     ///
1825     /// ```
1826     /// let s = "  English";
1827     /// assert!(Some('E') == s.trim_left().chars().next());
1828     ///
1829     /// let s = "  עברית";
1830     /// assert!(Some('ע') == s.trim_left().chars().next());
1831     /// ```
1832     #[inline]
1833     #[stable(feature = "rust1", since = "1.0.0")]
1834     #[rustc_deprecated(
1835         since = "1.33.0",
1836         reason = "superseded by `trim_start`",
1837         suggestion = "trim_start"
1838     )]
1839     pub fn trim_left(&self) -> &str {
1840         self.trim_start()
1841     }
1842
1843     /// Returns a string slice with trailing whitespace removed.
1844     ///
1845     /// 'Whitespace' is defined according to the terms of the Unicode Derived
1846     /// Core Property `White_Space`.
1847     ///
1848     /// # Text directionality
1849     ///
1850     /// A string is a sequence of bytes. 'Right' in this context means the last
1851     /// position of that byte string; for a language like Arabic or Hebrew
1852     /// which are 'right to left' rather than 'left to right', this will be
1853     /// the _left_ side, not the right.
1854     ///
1855     /// # Examples
1856     ///
1857     /// Basic usage:
1858     ///
1859     /// ```
1860     /// let s = " Hello\tworld\t";
1861     ///
1862     /// assert_eq!(" Hello\tworld", s.trim_right());
1863     /// ```
1864     ///
1865     /// Directionality:
1866     ///
1867     /// ```
1868     /// let s = "English  ";
1869     /// assert!(Some('h') == s.trim_right().chars().rev().next());
1870     ///
1871     /// let s = "עברית  ";
1872     /// assert!(Some('ת') == s.trim_right().chars().rev().next());
1873     /// ```
1874     #[inline]
1875     #[stable(feature = "rust1", since = "1.0.0")]
1876     #[rustc_deprecated(
1877         since = "1.33.0",
1878         reason = "superseded by `trim_end`",
1879         suggestion = "trim_end"
1880     )]
1881     pub fn trim_right(&self) -> &str {
1882         self.trim_end()
1883     }
1884
1885     /// Returns a string slice with all prefixes and suffixes that match a
1886     /// pattern repeatedly removed.
1887     ///
1888     /// The [pattern] can be a [`char`], a slice of [`char`]s, or a function
1889     /// or closure that determines if a character matches.
1890     ///
1891     /// [`char`]: prim@char
1892     /// [pattern]: self::pattern
1893     ///
1894     /// # Examples
1895     ///
1896     /// Simple patterns:
1897     ///
1898     /// ```
1899     /// assert_eq!("11foo1bar11".trim_matches('1'), "foo1bar");
1900     /// assert_eq!("123foo1bar123".trim_matches(char::is_numeric), "foo1bar");
1901     ///
1902     /// let x: &[_] = &['1', '2'];
1903     /// assert_eq!("12foo1bar12".trim_matches(x), "foo1bar");
1904     /// ```
1905     ///
1906     /// A more complex pattern, using a closure:
1907     ///
1908     /// ```
1909     /// assert_eq!("1foo1barXX".trim_matches(|c| c == '1' || c == 'X'), "foo1bar");
1910     /// ```
1911     #[must_use = "this returns the trimmed string as a new slice, \
1912                   without modifying the original"]
1913     #[stable(feature = "rust1", since = "1.0.0")]
1914     pub fn trim_matches<'a, P>(&'a self, pat: P) -> &'a str
1915     where
1916         P: Pattern<'a, Searcher: DoubleEndedSearcher<'a>>,
1917     {
1918         let mut i = 0;
1919         let mut j = 0;
1920         let mut matcher = pat.into_searcher(self);
1921         if let Some((a, b)) = matcher.next_reject() {
1922             i = a;
1923             j = b; // Remember earliest known match, correct it below if
1924             // last match is different
1925         }
1926         if let Some((_, b)) = matcher.next_reject_back() {
1927             j = b;
1928         }
1929         // SAFETY: `Searcher` is known to return valid indices.
1930         unsafe { self.get_unchecked(i..j) }
1931     }
1932
1933     /// Returns a string slice with all prefixes that match a pattern
1934     /// repeatedly removed.
1935     ///
1936     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1937     /// function or closure that determines if a character matches.
1938     ///
1939     /// [`char`]: prim@char
1940     /// [pattern]: self::pattern
1941     ///
1942     /// # Text directionality
1943     ///
1944     /// A string is a sequence of bytes. `start` in this context means the first
1945     /// position of that byte string; for a left-to-right language like English or
1946     /// Russian, this will be left side, and for right-to-left languages like
1947     /// Arabic or Hebrew, this will be the right side.
1948     ///
1949     /// # Examples
1950     ///
1951     /// Basic usage:
1952     ///
1953     /// ```
1954     /// assert_eq!("11foo1bar11".trim_start_matches('1'), "foo1bar11");
1955     /// assert_eq!("123foo1bar123".trim_start_matches(char::is_numeric), "foo1bar123");
1956     ///
1957     /// let x: &[_] = &['1', '2'];
1958     /// assert_eq!("12foo1bar12".trim_start_matches(x), "foo1bar12");
1959     /// ```
1960     #[must_use = "this returns the trimmed string as a new slice, \
1961                   without modifying the original"]
1962     #[stable(feature = "trim_direction", since = "1.30.0")]
1963     pub fn trim_start_matches<'a, P: Pattern<'a>>(&'a self, pat: P) -> &'a str {
1964         let mut i = self.len();
1965         let mut matcher = pat.into_searcher(self);
1966         if let Some((a, _)) = matcher.next_reject() {
1967             i = a;
1968         }
1969         // SAFETY: `Searcher` is known to return valid indices.
1970         unsafe { self.get_unchecked(i..self.len()) }
1971     }
1972
1973     /// Returns a string slice with the prefix removed.
1974     ///
1975     /// If the string starts with the pattern `prefix`, returns substring after the prefix, wrapped
1976     /// in `Some`.  Unlike `trim_start_matches`, this method removes the prefix exactly once.
1977     ///
1978     /// If the string does not start with `prefix`, returns `None`.
1979     ///
1980     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
1981     /// function or closure that determines if a character matches.
1982     ///
1983     /// [`char`]: prim@char
1984     /// [pattern]: self::pattern
1985     ///
1986     /// # Examples
1987     ///
1988     /// ```
1989     /// assert_eq!("foo:bar".strip_prefix("foo:"), Some("bar"));
1990     /// assert_eq!("foo:bar".strip_prefix("bar"), None);
1991     /// assert_eq!("foofoo".strip_prefix("foo"), Some("foo"));
1992     /// ```
1993     #[must_use = "this returns the remaining substring as a new slice, \
1994                   without modifying the original"]
1995     #[stable(feature = "str_strip", since = "1.45.0")]
1996     pub fn strip_prefix<'a, P: Pattern<'a>>(&'a self, prefix: P) -> Option<&'a str> {
1997         prefix.strip_prefix_of(self)
1998     }
1999
2000     /// Returns a string slice with the suffix removed.
2001     ///
2002     /// If the string ends with the pattern `suffix`, returns the substring before the suffix,
2003     /// wrapped in `Some`.  Unlike `trim_end_matches`, this method removes the suffix exactly once.
2004     ///
2005     /// If the string does not end with `suffix`, returns `None`.
2006     ///
2007     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2008     /// function or closure that determines if a character matches.
2009     ///
2010     /// [`char`]: prim@char
2011     /// [pattern]: self::pattern
2012     ///
2013     /// # Examples
2014     ///
2015     /// ```
2016     /// assert_eq!("bar:foo".strip_suffix(":foo"), Some("bar"));
2017     /// assert_eq!("bar:foo".strip_suffix("bar"), None);
2018     /// assert_eq!("foofoo".strip_suffix("foo"), Some("foo"));
2019     /// ```
2020     #[must_use = "this returns the remaining substring as a new slice, \
2021                   without modifying the original"]
2022     #[stable(feature = "str_strip", since = "1.45.0")]
2023     pub fn strip_suffix<'a, P>(&'a self, suffix: P) -> Option<&'a str>
2024     where
2025         P: Pattern<'a>,
2026         <P as Pattern<'a>>::Searcher: ReverseSearcher<'a>,
2027     {
2028         suffix.strip_suffix_of(self)
2029     }
2030
2031     /// Returns a string slice with all suffixes that match a pattern
2032     /// repeatedly removed.
2033     ///
2034     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2035     /// function or closure that determines if a character matches.
2036     ///
2037     /// [`char`]: prim@char
2038     /// [pattern]: self::pattern
2039     ///
2040     /// # Text directionality
2041     ///
2042     /// A string is a sequence of bytes. `end` in this context means the last
2043     /// position of that byte string; for a left-to-right language like English or
2044     /// Russian, this will be right side, and for right-to-left languages like
2045     /// Arabic or Hebrew, this will be the left side.
2046     ///
2047     /// # Examples
2048     ///
2049     /// Simple patterns:
2050     ///
2051     /// ```
2052     /// assert_eq!("11foo1bar11".trim_end_matches('1'), "11foo1bar");
2053     /// assert_eq!("123foo1bar123".trim_end_matches(char::is_numeric), "123foo1bar");
2054     ///
2055     /// let x: &[_] = &['1', '2'];
2056     /// assert_eq!("12foo1bar12".trim_end_matches(x), "12foo1bar");
2057     /// ```
2058     ///
2059     /// A more complex pattern, using a closure:
2060     ///
2061     /// ```
2062     /// assert_eq!("1fooX".trim_end_matches(|c| c == '1' || c == 'X'), "1foo");
2063     /// ```
2064     #[must_use = "this returns the trimmed string as a new slice, \
2065                   without modifying the original"]
2066     #[stable(feature = "trim_direction", since = "1.30.0")]
2067     pub fn trim_end_matches<'a, P>(&'a self, pat: P) -> &'a str
2068     where
2069         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
2070     {
2071         let mut j = 0;
2072         let mut matcher = pat.into_searcher(self);
2073         if let Some((_, b)) = matcher.next_reject_back() {
2074             j = b;
2075         }
2076         // SAFETY: `Searcher` is known to return valid indices.
2077         unsafe { self.get_unchecked(0..j) }
2078     }
2079
2080     /// Returns a string slice with all prefixes that match a pattern
2081     /// repeatedly removed.
2082     ///
2083     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2084     /// function or closure that determines if a character matches.
2085     ///
2086     /// [`char`]: prim@char
2087     /// [pattern]: self::pattern
2088     ///
2089     /// # Text directionality
2090     ///
2091     /// A string is a sequence of bytes. 'Left' in this context means the first
2092     /// position of that byte string; for a language like Arabic or Hebrew
2093     /// which are 'right to left' rather than 'left to right', this will be
2094     /// the _right_ side, not the left.
2095     ///
2096     /// # Examples
2097     ///
2098     /// Basic usage:
2099     ///
2100     /// ```
2101     /// assert_eq!("11foo1bar11".trim_left_matches('1'), "foo1bar11");
2102     /// assert_eq!("123foo1bar123".trim_left_matches(char::is_numeric), "foo1bar123");
2103     ///
2104     /// let x: &[_] = &['1', '2'];
2105     /// assert_eq!("12foo1bar12".trim_left_matches(x), "foo1bar12");
2106     /// ```
2107     #[stable(feature = "rust1", since = "1.0.0")]
2108     #[rustc_deprecated(
2109         since = "1.33.0",
2110         reason = "superseded by `trim_start_matches`",
2111         suggestion = "trim_start_matches"
2112     )]
2113     pub fn trim_left_matches<'a, P: Pattern<'a>>(&'a self, pat: P) -> &'a str {
2114         self.trim_start_matches(pat)
2115     }
2116
2117     /// Returns a string slice with all suffixes that match a pattern
2118     /// repeatedly removed.
2119     ///
2120     /// The [pattern] can be a `&str`, [`char`], a slice of [`char`]s, or a
2121     /// function or closure that determines if a character matches.
2122     ///
2123     /// [`char`]: prim@char
2124     /// [pattern]: self::pattern
2125     ///
2126     /// # Text directionality
2127     ///
2128     /// A string is a sequence of bytes. 'Right' in this context means the last
2129     /// position of that byte string; for a language like Arabic or Hebrew
2130     /// which are 'right to left' rather than 'left to right', this will be
2131     /// the _left_ side, not the right.
2132     ///
2133     /// # Examples
2134     ///
2135     /// Simple patterns:
2136     ///
2137     /// ```
2138     /// assert_eq!("11foo1bar11".trim_right_matches('1'), "11foo1bar");
2139     /// assert_eq!("123foo1bar123".trim_right_matches(char::is_numeric), "123foo1bar");
2140     ///
2141     /// let x: &[_] = &['1', '2'];
2142     /// assert_eq!("12foo1bar12".trim_right_matches(x), "12foo1bar");
2143     /// ```
2144     ///
2145     /// A more complex pattern, using a closure:
2146     ///
2147     /// ```
2148     /// assert_eq!("1fooX".trim_right_matches(|c| c == '1' || c == 'X'), "1foo");
2149     /// ```
2150     #[stable(feature = "rust1", since = "1.0.0")]
2151     #[rustc_deprecated(
2152         since = "1.33.0",
2153         reason = "superseded by `trim_end_matches`",
2154         suggestion = "trim_end_matches"
2155     )]
2156     pub fn trim_right_matches<'a, P>(&'a self, pat: P) -> &'a str
2157     where
2158         P: Pattern<'a, Searcher: ReverseSearcher<'a>>,
2159     {
2160         self.trim_end_matches(pat)
2161     }
2162
2163     /// Parses this string slice into another type.
2164     ///
2165     /// Because `parse` is so general, it can cause problems with type
2166     /// inference. As such, `parse` is one of the few times you'll see
2167     /// the syntax affectionately known as the 'turbofish': `::<>`. This
2168     /// helps the inference algorithm understand specifically which type
2169     /// you're trying to parse into.
2170     ///
2171     /// `parse` can parse any type that implements the [`FromStr`] trait.
2172
2173     ///
2174     /// # Errors
2175     ///
2176     /// Will return [`Err`] if it's not possible to parse this string slice into
2177     /// the desired type.
2178     ///
2179     /// [`Err`]: FromStr::Err
2180     ///
2181     /// # Examples
2182     ///
2183     /// Basic usage
2184     ///
2185     /// ```
2186     /// let four: u32 = "4".parse().unwrap();
2187     ///
2188     /// assert_eq!(4, four);
2189     /// ```
2190     ///
2191     /// Using the 'turbofish' instead of annotating `four`:
2192     ///
2193     /// ```
2194     /// let four = "4".parse::<u32>();
2195     ///
2196     /// assert_eq!(Ok(4), four);
2197     /// ```
2198     ///
2199     /// Failing to parse:
2200     ///
2201     /// ```
2202     /// let nope = "j".parse::<u32>();
2203     ///
2204     /// assert!(nope.is_err());
2205     /// ```
2206     #[inline]
2207     #[stable(feature = "rust1", since = "1.0.0")]
2208     pub fn parse<F: FromStr>(&self) -> Result<F, F::Err> {
2209         FromStr::from_str(self)
2210     }
2211
2212     /// Checks if all characters in this string are within the ASCII range.
2213     ///
2214     /// # Examples
2215     ///
2216     /// ```
2217     /// let ascii = "hello!\n";
2218     /// let non_ascii = "Grüße, Jürgen ❤";
2219     ///
2220     /// assert!(ascii.is_ascii());
2221     /// assert!(!non_ascii.is_ascii());
2222     /// ```
2223     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2224     #[inline]
2225     pub fn is_ascii(&self) -> bool {
2226         // We can treat each byte as character here: all multibyte characters
2227         // start with a byte that is not in the ascii range, so we will stop
2228         // there already.
2229         self.as_bytes().is_ascii()
2230     }
2231
2232     /// Checks that two strings are an ASCII case-insensitive match.
2233     ///
2234     /// Same as `to_ascii_lowercase(a) == to_ascii_lowercase(b)`,
2235     /// but without allocating and copying temporaries.
2236     ///
2237     /// # Examples
2238     ///
2239     /// ```
2240     /// assert!("Ferris".eq_ignore_ascii_case("FERRIS"));
2241     /// assert!("Ferrös".eq_ignore_ascii_case("FERRöS"));
2242     /// assert!(!"Ferrös".eq_ignore_ascii_case("FERRÖS"));
2243     /// ```
2244     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2245     #[inline]
2246     pub fn eq_ignore_ascii_case(&self, other: &str) -> bool {
2247         self.as_bytes().eq_ignore_ascii_case(other.as_bytes())
2248     }
2249
2250     /// Converts this string to its ASCII upper case equivalent in-place.
2251     ///
2252     /// ASCII letters 'a' to 'z' are mapped to 'A' to 'Z',
2253     /// but non-ASCII letters are unchanged.
2254     ///
2255     /// To return a new uppercased value without modifying the existing one, use
2256     /// [`to_ascii_uppercase`].
2257     ///
2258     /// [`to_ascii_uppercase`]: #method.to_ascii_uppercase
2259     ///
2260     /// # Examples
2261     ///
2262     /// ```
2263     /// let mut s = String::from("Grüße, Jürgen ❤");
2264     ///
2265     /// s.make_ascii_uppercase();
2266     ///
2267     /// assert_eq!("GRüßE, JüRGEN ❤", s);
2268     /// ```
2269     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2270     #[inline]
2271     pub fn make_ascii_uppercase(&mut self) {
2272         // SAFETY: safe because we transmute two types with the same layout.
2273         let me = unsafe { self.as_bytes_mut() };
2274         me.make_ascii_uppercase()
2275     }
2276
2277     /// Converts this string to its ASCII lower case equivalent in-place.
2278     ///
2279     /// ASCII letters 'A' to 'Z' are mapped to 'a' to 'z',
2280     /// but non-ASCII letters are unchanged.
2281     ///
2282     /// To return a new lowercased value without modifying the existing one, use
2283     /// [`to_ascii_lowercase`].
2284     ///
2285     /// [`to_ascii_lowercase`]: #method.to_ascii_lowercase
2286     ///
2287     /// # Examples
2288     ///
2289     /// ```
2290     /// let mut s = String::from("GRÜßE, JÜRGEN ❤");
2291     ///
2292     /// s.make_ascii_lowercase();
2293     ///
2294     /// assert_eq!("grÜße, jÜrgen ❤", s);
2295     /// ```
2296     #[stable(feature = "ascii_methods_on_intrinsics", since = "1.23.0")]
2297     #[inline]
2298     pub fn make_ascii_lowercase(&mut self) {
2299         // SAFETY: safe because we transmute two types with the same layout.
2300         let me = unsafe { self.as_bytes_mut() };
2301         me.make_ascii_lowercase()
2302     }
2303
2304     /// Return an iterator that escapes each char in `self` with [`char::escape_debug`].
2305     ///
2306     /// Note: only extended grapheme codepoints that begin the string will be
2307     /// escaped.
2308     ///
2309     /// # Examples
2310     ///
2311     /// As an iterator:
2312     ///
2313     /// ```
2314     /// for c in "❤\n!".escape_debug() {
2315     ///     print!("{}", c);
2316     /// }
2317     /// println!();
2318     /// ```
2319     ///
2320     /// Using `println!` directly:
2321     ///
2322     /// ```
2323     /// println!("{}", "❤\n!".escape_debug());
2324     /// ```
2325     ///
2326     ///
2327     /// Both are equivalent to:
2328     ///
2329     /// ```
2330     /// println!("❤\\n!");
2331     /// ```
2332     ///
2333     /// Using `to_string`:
2334     ///
2335     /// ```
2336     /// assert_eq!("❤\n!".escape_debug().to_string(), "❤\\n!");
2337     /// ```
2338     #[stable(feature = "str_escape", since = "1.34.0")]
2339     pub fn escape_debug(&self) -> EscapeDebug<'_> {
2340         let mut chars = self.chars();
2341         EscapeDebug {
2342             inner: chars
2343                 .next()
2344                 .map(|first| first.escape_debug_ext(true))
2345                 .into_iter()
2346                 .flatten()
2347                 .chain(chars.flat_map(CharEscapeDebugContinue)),
2348         }
2349     }
2350
2351     /// Return an iterator that escapes each char in `self` with [`char::escape_default`].
2352     ///
2353     /// # Examples
2354     ///
2355     /// As an iterator:
2356     ///
2357     /// ```
2358     /// for c in "❤\n!".escape_default() {
2359     ///     print!("{}", c);
2360     /// }
2361     /// println!();
2362     /// ```
2363     ///
2364     /// Using `println!` directly:
2365     ///
2366     /// ```
2367     /// println!("{}", "❤\n!".escape_default());
2368     /// ```
2369     ///
2370     ///
2371     /// Both are equivalent to:
2372     ///
2373     /// ```
2374     /// println!("\\u{{2764}}\\n!");
2375     /// ```
2376     ///
2377     /// Using `to_string`:
2378     ///
2379     /// ```
2380     /// assert_eq!("❤\n!".escape_default().to_string(), "\\u{2764}\\n!");
2381     /// ```
2382     #[stable(feature = "str_escape", since = "1.34.0")]
2383     pub fn escape_default(&self) -> EscapeDefault<'_> {
2384         EscapeDefault { inner: self.chars().flat_map(CharEscapeDefault) }
2385     }
2386
2387     /// Return an iterator that escapes each char in `self` with [`char::escape_unicode`].
2388     ///
2389     /// # Examples
2390     ///
2391     /// As an iterator:
2392     ///
2393     /// ```
2394     /// for c in "❤\n!".escape_unicode() {
2395     ///     print!("{}", c);
2396     /// }
2397     /// println!();
2398     /// ```
2399     ///
2400     /// Using `println!` directly:
2401     ///
2402     /// ```
2403     /// println!("{}", "❤\n!".escape_unicode());
2404     /// ```
2405     ///
2406     ///
2407     /// Both are equivalent to:
2408     ///
2409     /// ```
2410     /// println!("\\u{{2764}}\\u{{a}}\\u{{21}}");
2411     /// ```
2412     ///
2413     /// Using `to_string`:
2414     ///
2415     /// ```
2416     /// assert_eq!("❤\n!".escape_unicode().to_string(), "\\u{2764}\\u{a}\\u{21}");
2417     /// ```
2418     #[stable(feature = "str_escape", since = "1.34.0")]
2419     pub fn escape_unicode(&self) -> EscapeUnicode<'_> {
2420         EscapeUnicode { inner: self.chars().flat_map(CharEscapeUnicode) }
2421     }
2422 }
2423
2424 #[stable(feature = "rust1", since = "1.0.0")]
2425 impl AsRef<[u8]> for str {
2426     #[inline]
2427     fn as_ref(&self) -> &[u8] {
2428         self.as_bytes()
2429     }
2430 }
2431
2432 #[stable(feature = "rust1", since = "1.0.0")]
2433 impl Default for &str {
2434     /// Creates an empty str
2435     #[inline]
2436     fn default() -> Self {
2437         ""
2438     }
2439 }
2440
2441 #[stable(feature = "default_mut_str", since = "1.28.0")]
2442 impl Default for &mut str {
2443     /// Creates an empty mutable str
2444     #[inline]
2445     fn default() -> Self {
2446         // SAFETY: The empty string is valid UTF-8.
2447         unsafe { from_utf8_unchecked_mut(&mut []) }
2448     }
2449 }
2450
2451 impl_fn_for_zst! {
2452     /// A nameable, cloneable fn type
2453     #[derive(Clone)]
2454     struct LinesAnyMap impl<'a> Fn = |line: &'a str| -> &'a str {
2455         let l = line.len();
2456         if l > 0 && line.as_bytes()[l - 1] == b'\r' { &line[0 .. l - 1] }
2457         else { line }
2458     };
2459
2460     #[derive(Clone)]
2461     struct CharEscapeDebugContinue impl Fn = |c: char| -> char::EscapeDebug {
2462         c.escape_debug_ext(false)
2463     };
2464
2465     #[derive(Clone)]
2466     struct CharEscapeUnicode impl Fn = |c: char| -> char::EscapeUnicode {
2467         c.escape_unicode()
2468     };
2469     #[derive(Clone)]
2470     struct CharEscapeDefault impl Fn = |c: char| -> char::EscapeDefault {
2471         c.escape_default()
2472     };
2473
2474     #[derive(Clone)]
2475     struct IsWhitespace impl Fn = |c: char| -> bool {
2476         c.is_whitespace()
2477     };
2478
2479     #[derive(Clone)]
2480     struct IsAsciiWhitespace impl Fn = |byte: &u8| -> bool {
2481         byte.is_ascii_whitespace()
2482     };
2483
2484     #[derive(Clone)]
2485     struct IsNotEmpty impl<'a, 'b> Fn = |s: &'a &'b str| -> bool {
2486         !s.is_empty()
2487     };
2488
2489     #[derive(Clone)]
2490     struct BytesIsNotEmpty impl<'a, 'b> Fn = |s: &'a &'b [u8]| -> bool {
2491         !s.is_empty()
2492     };
2493
2494     #[derive(Clone)]
2495     struct UnsafeBytesToStr impl<'a> Fn = |bytes: &'a [u8]| -> &'a str {
2496         // SAFETY: not safe
2497         unsafe { from_utf8_unchecked(bytes) }
2498     };
2499 }