]> git.lizzy.rs Git - rust.git/blob - compiler/rustc_mir_build/src/thir/pattern/_match.rs
Unify the two kinds of specialization by adding a Wildcard ctor
[rust.git] / compiler / rustc_mir_build / src / thir / pattern / _match.rs
1 //! Note: most of the tests relevant to this file can be found (at the time of writing) in
2 //! src/tests/ui/pattern/usefulness.
3 //!
4 //! This file includes the logic for exhaustiveness and usefulness checking for
5 //! pattern-matching. Specifically, given a list of patterns for a type, we can
6 //! tell whether:
7 //! (a) the patterns cover every possible constructor for the type (exhaustiveness)
8 //! (b) each pattern is necessary (usefulness)
9 //!
10 //! The algorithm implemented here is a modified version of the one described in:
11 //! http://moscova.inria.fr/~maranget/papers/warn/index.html
12 //! However, to save future implementors from reading the original paper, we
13 //! summarise the algorithm here to hopefully save time and be a little clearer
14 //! (without being so rigorous).
15 //!
16 //! # Premise
17 //!
18 //! The core of the algorithm revolves about a "usefulness" check. In particular, we
19 //! are trying to compute a predicate `U(P, p)` where `P` is a list of patterns (we refer to this as
20 //! a matrix). `U(P, p)` represents whether, given an existing list of patterns
21 //! `P_1 ..= P_m`, adding a new pattern `p` will be "useful" (that is, cover previously-
22 //! uncovered values of the type).
23 //!
24 //! If we have this predicate, then we can easily compute both exhaustiveness of an
25 //! entire set of patterns and the individual usefulness of each one.
26 //! (a) the set of patterns is exhaustive iff `U(P, _)` is false (i.e., adding a wildcard
27 //! match doesn't increase the number of values we're matching)
28 //! (b) a pattern `P_i` is not useful if `U(P[0..=(i-1), P_i)` is false (i.e., adding a
29 //! pattern to those that have come before it doesn't increase the number of values
30 //! we're matching).
31 //!
32 //! # Core concept
33 //!
34 //! The idea that powers everything that is done in this file is the following: a value is made
35 //! from a constructor applied to some fields. Examples of constructors are `Some`, `None`, `(,)`
36 //! (the 2-tuple constructor), `Foo {..}` (the constructor for a struct `Foo`), and `2` (the
37 //! constructor for the number `2`). Fields are just a (possibly empty) list of values.
38 //!
39 //! Some of the constructors listed above might feel weird: `None` and `2` don't take any
40 //! arguments. This is part of what makes constructors so general: we will consider plain values
41 //! like numbers and string literals to be constructors that take no arguments, also called "0-ary
42 //! constructors"; they are the simplest case of constructors. This allows us to see any value as
43 //! made up from a tree of constructors, each having a given number of children. For example:
44 //! `(None, Ok(0))` is made from 4 different constructors.
45 //!
46 //! This idea can be extended to patterns: a pattern captures a set of possible values, and we can
47 //! describe this set using constructors. For example, `Err(_)` captures all values of the type
48 //! `Result<T, E>` that start with the `Err` constructor (for some choice of `T` and `E`). The
49 //! wildcard `_` captures all values of the given type starting with any of the constructors for
50 //! that type.
51 //!
52 //! We use this to compute whether different patterns might capture a same value. Do the patterns
53 //! `Ok("foo")` and `Err(_)` capture a common value? The answer is no, because the first pattern
54 //! captures only values starting with the `Ok` constructor and the second only values starting
55 //! with the `Err` constructor. Do the patterns `Some(42)` and `Some(1..10)` intersect? They might,
56 //! since they both capture values starting with `Some`. To be certain, we need to dig under the
57 //! `Some` constructor and continue asking the question. This is the main idea behind the
58 //! exhaustiveness algorithm: by looking at patterns constructor-by-constructor, we can efficiently
59 //! figure out if some new pattern might capture a value that hadn't been captured by previous
60 //! patterns.
61 //!
62 //! Constructors are represented by the `Constructor` enum, and its fields by the `Fields` enum.
63 //! Most of the complexity of this file resides in transforming between patterns and
64 //! (`Constructor`, `Fields`) pairs, handling all the special cases correctly.
65 //!
66 //! Caveat: this constructors/fields distinction doesn't quite cover every Rust value. For example
67 //! a value of type `Rc<u64>` doesn't fit this idea very well, nor do various other things.
68 //! However, this idea covers most of the cases that are relevant to exhaustiveness checking.
69 //!
70 //!
71 //! # Algorithm
72 //!
73 //! Recall that `U(P, p)` represents whether, given an existing list of patterns (aka matrix) `P`,
74 //! adding a new pattern `p` will cover previously-uncovered values of the type.
75 //! During the course of the algorithm, the rows of the matrix won't just be individual patterns,
76 //! but rather partially-deconstructed patterns in the form of a list of fields. The paper
77 //! calls those pattern-vectors, and we will call them pattern-stacks. The same holds for the
78 //! new pattern `p`.
79 //!
80 //! For example, say we have the following:
81 //!
82 //! ```
83 //! // x: (Option<bool>, Result<()>)
84 //! match x {
85 //!     (Some(true), _) => {}
86 //!     (None, Err(())) => {}
87 //!     (None, Err(_)) => {}
88 //! }
89 //! ```
90 //!
91 //! Here, the matrix `P` starts as:
92 //!
93 //! ```
94 //! [
95 //!     [(Some(true), _)],
96 //!     [(None, Err(()))],
97 //!     [(None, Err(_))],
98 //! ]
99 //! ```
100 //!
101 //! We can tell it's not exhaustive, because `U(P, _)` is true (we're not covering
102 //! `[(Some(false), _)]`, for instance). In addition, row 3 is not useful, because
103 //! all the values it covers are already covered by row 2.
104 //!
105 //! A list of patterns can be thought of as a stack, because we are mainly interested in the top of
106 //! the stack at any given point, and we can pop or apply constructors to get new pattern-stacks.
107 //! To match the paper, the top of the stack is at the beginning / on the left.
108 //!
109 //! There are two important operations on pattern-stacks necessary to understand the algorithm:
110 //!
111 //! 1. We can pop a given constructor off the top of a stack. This operation is called
112 //!    `specialize`, and is denoted `S(c, p)` where `c` is a constructor (like `Some` or
113 //!    `None`) and `p` a pattern-stack.
114 //!    If the pattern on top of the stack can cover `c`, this removes the constructor and
115 //!    pushes its arguments onto the stack. It also expands OR-patterns into distinct patterns.
116 //!    Otherwise the pattern-stack is discarded.
117 //!    This essentially filters those pattern-stacks whose top covers the constructor `c` and
118 //!    discards the others.
119 //!
120 //!    For example, the first pattern above initially gives a stack `[(Some(true), _)]`. If we
121 //!    pop the tuple constructor, we are left with `[Some(true), _]`, and if we then pop the
122 //!    `Some` constructor we get `[true, _]`. If we had popped `None` instead, we would get
123 //!    nothing back.
124 //!
125 //!    This returns zero or more new pattern-stacks, as follows. We look at the pattern `p_1`
126 //!    on top of the stack, and we have four cases:
127 //!         1.1. `p_1 = c(r_1, .., r_a)`, i.e. the top of the stack has constructor `c`. We
128 //!              push onto the stack the arguments of this constructor, and return the result:
129 //!                 r_1, .., r_a, p_2, .., p_n
130 //!         1.2. `p_1 = c'(r_1, .., r_a')` where `c ≠ c'`. We discard the current stack and
131 //!              return nothing.
132 //!         1.3. `p_1 = _`. We push onto the stack as many wildcards as the constructor `c` has
133 //!              arguments (its arity), and return the resulting stack:
134 //!                 _, .., _, p_2, .., p_n
135 //!         1.4. `p_1 = r_1 | r_2`. We expand the OR-pattern and then recurse on each resulting
136 //!              stack:
137 //!                 S(c, (r_1, p_2, .., p_n))
138 //!                 S(c, (r_2, p_2, .., p_n))
139 //!
140 //! 2. We can pop a wildcard off the top of the stack. This is called `S(_, p)`, where `p` is
141 //!    a pattern-stack. Note: the paper calls this `D(p)`.
142 //!    This is used when we know there are missing constructor cases, but there might be
143 //!    existing wildcard patterns, so to check the usefulness of the matrix, we have to check
144 //!    all its *other* components.
145 //!
146 //!    It is computed as follows. We look at the pattern `p_1` on top of the stack,
147 //!    and we have three cases:
148 //!         2.1. `p_1 = c(r_1, .., r_a)`. We discard the current stack and return nothing.
149 //!         2.2. `p_1 = _`. We return the rest of the stack:
150 //!                 p_2, .., p_n
151 //!         2.3. `p_1 = r_1 | r_2`. We expand the OR-pattern and then recurse on each resulting
152 //!           stack.
153 //!                 S(_, (r_1, p_2, .., p_n))
154 //!                 S(_, (r_2, p_2, .., p_n))
155 //!
156 //! Note that the OR-patterns are not always used directly in Rust, but are used to derive the
157 //! exhaustive integer matching rules, so they're written here for posterity.
158 //!
159 //! Both those operations extend straightforwardly to a list or pattern-stacks, i.e. a matrix, by
160 //! working row-by-row. Popping a constructor ends up keeping only the matrix rows that start with
161 //! the given constructor, and popping a wildcard keeps those rows that start with a wildcard.
162 //!
163 //!
164 //! The algorithm for computing `U`
165 //! -------------------------------
166 //! The algorithm is inductive (on the number of columns: i.e., components of tuple patterns).
167 //! That means we're going to check the components from left-to-right, so the algorithm
168 //! operates principally on the first component of the matrix and new pattern-stack `p`.
169 //! This algorithm is realised in the `is_useful` function.
170 //!
171 //! Base case. (`n = 0`, i.e., an empty tuple pattern)
172 //!     - If `P` already contains an empty pattern (i.e., if the number of patterns `m > 0`),
173 //!       then `U(P, p)` is false.
174 //!     - Otherwise, `P` must be empty, so `U(P, p)` is true.
175 //!
176 //! Inductive step. (`n > 0`, i.e., whether there's at least one column
177 //!                  [which may then be expanded into further columns later])
178 //! We're going to match on the top of the new pattern-stack, `p_1`.
179 //!     - If `p_1 == c(r_1, .., r_a)`, i.e. we have a constructor pattern.
180 //! Then, the usefulness of `p_1` can be reduced to whether it is useful when
181 //! we ignore all the patterns in the first column of `P` that involve other constructors.
182 //! This is where `S(c, P)` comes in:
183 //! `U(P, p) := U(S(c, P), S(c, p))`
184 //! This special case is handled in `is_useful_specialized`.
185 //!
186 //! For example, if `P` is:
187 //!
188 //! ```
189 //! [
190 //!     [Some(true), _],
191 //!     [None, 0],
192 //! ]
193 //! ```
194 //!
195 //! and `p` is [Some(false), 0], then we don't care about row 2 since we know `p` only
196 //! matches values that row 2 doesn't. For row 1 however, we need to dig into the
197 //! arguments of `Some` to know whether some new value is covered. So we compute
198 //! `U([[true, _]], [false, 0])`.
199 //!
200 //!   - If `p_1 == _`, then we look at the list of constructors that appear in the first
201 //! component of the rows of `P`:
202 //!   + If there are some constructors that aren't present, then we might think that the
203 //! wildcard `_` is useful, since it covers those constructors that weren't covered
204 //! before.
205 //! That's almost correct, but only works if there were no wildcards in those first
206 //! components. So we need to check that `p` is useful with respect to the rows that
207 //! start with a wildcard, if there are any. This is where `D` comes in:
208 //! `U(P, p) := U(S(_, P), S(_, p))`
209 //!
210 //! For example, if `P` is:
211 //!
212 //! ```
213 //! [
214 //!     [_, true, _],
215 //!     [None, false, 1],
216 //! ]
217 //! ```
218 //!
219 //! and `p` is [_, false, _], the `Some` constructor doesn't appear in `P`. So if we
220 //! only had row 2, we'd know that `p` is useful. However row 1 starts with a
221 //! wildcard, so we need to check whether `U([[true, _]], [false, 1])`.
222 //!
223 //!   + Otherwise, all possible constructors (for the relevant type) are present. In this
224 //! case we must check whether the wildcard pattern covers any unmatched value. For
225 //! that, we can think of the `_` pattern as a big OR-pattern that covers all
226 //! possible constructors. For `Option`, that would mean `_ = None | Some(_)` for
227 //! example. The wildcard pattern is useful in this case if it is useful when
228 //! specialized to one of the possible constructors. So we compute:
229 //! `U(P, p) := ∃(k ϵ constructors) U(S(k, P), S(k, p))`
230 //!
231 //! For example, if `P` is:
232 //!
233 //! ```
234 //! [
235 //!     [Some(true), _],
236 //!     [None, false],
237 //! ]
238 //! ```
239 //!
240 //! and `p` is [_, false], both `None` and `Some` constructors appear in the first
241 //! components of `P`. We will therefore try popping both constructors in turn: we
242 //! compute `U([[true, _]], [_, false])` for the `Some` constructor, and `U([[false]],
243 //! [false])` for the `None` constructor. The first case returns true, so we know that
244 //! `p` is useful for `P`. Indeed, it matches `[Some(false), _]` that wasn't matched
245 //! before.
246 //!
247 //!   - If `p_1 == r_1 | r_2`, then the usefulness depends on each `r_i` separately:
248 //! `U(P, p) := U(P, (r_1, p_2, .., p_n))
249 //!  || U(P, (r_2, p_2, .., p_n))`
250 //!
251 //! Modifications to the algorithm
252 //! ------------------------------
253 //! The algorithm in the paper doesn't cover some of the special cases that arise in Rust, for
254 //! example uninhabited types and variable-length slice patterns. These are drawn attention to
255 //! throughout the code below. I'll make a quick note here about how exhaustive integer matching is
256 //! accounted for, though.
257 //!
258 //! Exhaustive integer matching
259 //! ---------------------------
260 //! An integer type can be thought of as a (huge) sum type: 1 | 2 | 3 | ...
261 //! So to support exhaustive integer matching, we can make use of the logic in the paper for
262 //! OR-patterns. However, we obviously can't just treat ranges x..=y as individual sums, because
263 //! they are likely gigantic. So we instead treat ranges as constructors of the integers. This means
264 //! that we have a constructor *of* constructors (the integers themselves). We then need to work
265 //! through all the inductive step rules above, deriving how the ranges would be treated as
266 //! OR-patterns, and making sure that they're treated in the same way even when they're ranges.
267 //! There are really only four special cases here:
268 //! - When we match on a constructor that's actually a range, we have to treat it as if we would
269 //!   an OR-pattern.
270 //!     + It turns out that we can simply extend the case for single-value patterns in
271 //!      `specialize` to either be *equal* to a value constructor, or *contained within* a range
272 //!      constructor.
273 //!     + When the pattern itself is a range, you just want to tell whether any of the values in
274 //!       the pattern range coincide with values in the constructor range, which is precisely
275 //!       intersection.
276 //!   Since when encountering a range pattern for a value constructor, we also use inclusion, it
277 //!   means that whenever the constructor is a value/range and the pattern is also a value/range,
278 //!   we can simply use intersection to test usefulness.
279 //! - When we're testing for usefulness of a pattern and the pattern's first component is a
280 //!   wildcard.
281 //!     + If all the constructors appear in the matrix, we have a slight complication. By default,
282 //!       the behaviour (i.e., a disjunction over specialised matrices for each constructor) is
283 //!       invalid, because we want a disjunction over every *integer* in each range, not just a
284 //!       disjunction over every range. This is a bit more tricky to deal with: essentially we need
285 //!       to form equivalence classes of subranges of the constructor range for which the behaviour
286 //!       of the matrix `P` and new pattern `p` are the same. This is described in more
287 //!       detail in `Constructor::split`.
288 //!     + If some constructors are missing from the matrix, it turns out we don't need to do
289 //!       anything special (because we know none of the integers are actually wildcards: i.e., we
290 //!       can't span wildcards using ranges).
291 use self::Constructor::*;
292 use self::SliceKind::*;
293 use self::Usefulness::*;
294 use self::WitnessPreference::*;
295
296 use rustc_data_structures::captures::Captures;
297 use rustc_data_structures::fx::{FxHashMap, FxHashSet};
298 use rustc_index::vec::Idx;
299
300 use super::{compare_const_vals, PatternFoldable, PatternFolder};
301 use super::{FieldPat, Pat, PatKind, PatRange};
302
303 use rustc_arena::TypedArena;
304 use rustc_attr::{SignedInt, UnsignedInt};
305 use rustc_hir::def_id::DefId;
306 use rustc_hir::{HirId, RangeEnd};
307 use rustc_middle::mir::interpret::{truncate, ConstValue};
308 use rustc_middle::mir::Field;
309 use rustc_middle::ty::layout::IntegerExt;
310 use rustc_middle::ty::{self, Const, Ty, TyCtxt};
311 use rustc_session::lint;
312 use rustc_span::{Span, DUMMY_SP};
313 use rustc_target::abi::{Integer, Size, VariantIdx};
314
315 use smallvec::{smallvec, SmallVec};
316 use std::cmp::{self, max, min, Ordering};
317 use std::fmt;
318 use std::iter::{FromIterator, IntoIterator};
319 use std::ops::RangeInclusive;
320
321 crate fn expand_pattern<'tcx>(pat: Pat<'tcx>) -> Pat<'tcx> {
322     LiteralExpander.fold_pattern(&pat)
323 }
324
325 struct LiteralExpander;
326
327 impl<'tcx> PatternFolder<'tcx> for LiteralExpander {
328     fn fold_pattern(&mut self, pat: &Pat<'tcx>) -> Pat<'tcx> {
329         debug!("fold_pattern {:?} {:?} {:?}", pat, pat.ty.kind(), pat.kind);
330         match (pat.ty.kind(), &*pat.kind) {
331             (_, &PatKind::Binding { subpattern: Some(ref s), .. }) => s.fold_with(self),
332             (_, &PatKind::AscribeUserType { subpattern: ref s, .. }) => s.fold_with(self),
333             _ => pat.super_fold_with(self),
334         }
335     }
336 }
337
338 impl<'tcx> Pat<'tcx> {
339     pub(super) fn is_wildcard(&self) -> bool {
340         match *self.kind {
341             PatKind::Binding { subpattern: None, .. } | PatKind::Wild => true,
342             _ => false,
343         }
344     }
345 }
346
347 /// A row of a matrix. Rows of len 1 are very common, which is why `SmallVec[_; 2]`
348 /// works well.
349 #[derive(Debug, Clone, PartialEq)]
350 crate struct PatStack<'p, 'tcx>(SmallVec<[&'p Pat<'tcx>; 2]>);
351
352 impl<'p, 'tcx> PatStack<'p, 'tcx> {
353     crate fn from_pattern(pat: &'p Pat<'tcx>) -> Self {
354         PatStack(smallvec![pat])
355     }
356
357     fn from_vec(vec: SmallVec<[&'p Pat<'tcx>; 2]>) -> Self {
358         PatStack(vec)
359     }
360
361     fn is_empty(&self) -> bool {
362         self.0.is_empty()
363     }
364
365     fn len(&self) -> usize {
366         self.0.len()
367     }
368
369     fn head(&self) -> &'p Pat<'tcx> {
370         self.0[0]
371     }
372
373     fn iter(&self) -> impl Iterator<Item = &Pat<'tcx>> {
374         self.0.iter().copied()
375     }
376
377     // If the first pattern is an or-pattern, expand this pattern. Otherwise, return `None`.
378     fn expand_or_pat(&self) -> Option<Vec<Self>> {
379         if self.is_empty() {
380             None
381         } else if let PatKind::Or { pats } = &*self.head().kind {
382             Some(
383                 pats.iter()
384                     .map(|pat| {
385                         let mut new_patstack = PatStack::from_pattern(pat);
386                         new_patstack.0.extend_from_slice(&self.0[1..]);
387                         new_patstack
388                     })
389                     .collect(),
390             )
391         } else {
392             None
393         }
394     }
395
396     /// This computes `S(constructor, self)`. See top of the file for explanations.
397     ///
398     /// This is the main specialization step. It expands the pattern
399     /// into `arity` patterns based on the constructor. For most patterns, the step is trivial,
400     /// for instance tuple patterns are flattened and box patterns expand into their inner pattern.
401     /// Returns `None` if the pattern does not have the given constructor.
402     ///
403     /// OTOH, slice patterns with a subslice pattern (tail @ ..) can be expanded into multiple
404     /// different patterns.
405     /// Structure patterns with a partial wild pattern (Foo { a: 42, .. }) have their missing
406     /// fields filled with wild patterns.
407     ///
408     /// This is roughly the inverse of `Constructor::apply`.
409     fn specialize_constructor(
410         &self,
411         cx: &MatchCheckCtxt<'p, 'tcx>,
412         ctor: &Constructor<'tcx>,
413         ctor_wild_subpatterns: &Fields<'p, 'tcx>,
414         is_my_head_ctor: bool,
415     ) -> Option<PatStack<'p, 'tcx>> {
416         // We return `None` if `ctor` is not covered by `self.head()`. If `ctor` is known to be
417         // derived from `self.head()`, then we don't need to check; otherwise, we compute the
418         // constructor of `self.head()` and check for constructor inclusion.
419         // Note that this shortcut is also necessary for correctness: a pattern should always be
420         // specializable with its own constructor, even in cases where we refuse to inspect values like
421         // opaque constants.
422         if !is_my_head_ctor {
423             let head_ctor = pat_constructor(cx.tcx, cx.param_env, self.head());
424             if !ctor.is_covered_by(cx, &head_ctor, self.head().ty) {
425                 return None;
426             }
427         }
428         let new_fields = ctor_wild_subpatterns.replace_with_pattern_arguments(self.head());
429
430         debug!(
431             "specialize_constructor({:#?}, {:#?}, {:#?}) = {:#?}",
432             self.head(),
433             ctor,
434             ctor_wild_subpatterns,
435             new_fields
436         );
437
438         // We pop the head pattern and push the new fields extracted from the arguments of
439         // `self.head()`.
440         Some(new_fields.push_on_patstack(&self.0[1..]))
441     }
442 }
443
444 impl<'p, 'tcx> Default for PatStack<'p, 'tcx> {
445     fn default() -> Self {
446         PatStack(smallvec![])
447     }
448 }
449
450 impl<'p, 'tcx> FromIterator<&'p Pat<'tcx>> for PatStack<'p, 'tcx> {
451     fn from_iter<T>(iter: T) -> Self
452     where
453         T: IntoIterator<Item = &'p Pat<'tcx>>,
454     {
455         PatStack(iter.into_iter().collect())
456     }
457 }
458
459 /// Depending on the match patterns, the specialization process might be able to use a fast path.
460 /// Tracks whether we can use the fast path and the lookup table needed in those cases.
461 #[derive(Clone, Debug, PartialEq)]
462 enum SpecializationCache {
463     /// Patterns consist of only enum variants.
464     /// Variant patterns does not intersect with each other (in contrast to range patterns),
465     /// so it is possible to precompute the result of `Matrix::specialize_constructor` at a
466     /// lower computational complexity.
467     /// `lookup` is responsible for holding the precomputed result of
468     /// specialization, while `wilds` is used for two purposes: the first one is
469     /// the precomputed result of specialization with a wildcard, and the second is to be used as a
470     /// fallback for `Matrix::specialize_constructor` when it tries to apply a constructor that
471     /// has not been seen in the `Matrix`. See `update_cache` for further explanations.
472     Variants { lookup: FxHashMap<DefId, SmallVec<[usize; 1]>>, wilds: SmallVec<[usize; 1]> },
473     /// Does not belong to the cases above, use the slow path.
474     Incompatible,
475 }
476
477 /// A 2D matrix.
478 #[derive(Clone, PartialEq)]
479 crate struct Matrix<'p, 'tcx> {
480     patterns: Vec<PatStack<'p, 'tcx>>,
481     cache: SpecializationCache,
482 }
483
484 impl<'p, 'tcx> Matrix<'p, 'tcx> {
485     crate fn empty() -> Self {
486         // Use `SpecializationCache::Incompatible` as a placeholder; we will initialize it on the
487         // first call to `push`. See the first half of `update_cache`.
488         Matrix { patterns: vec![], cache: SpecializationCache::Incompatible }
489     }
490
491     /// Pushes a new row to the matrix. If the row starts with an or-pattern, this expands it.
492     crate fn push(&mut self, row: PatStack<'p, 'tcx>) {
493         if let Some(rows) = row.expand_or_pat() {
494             for row in rows {
495                 // We recursively expand the or-patterns of the new rows.
496                 // This is necessary as we might have `0 | (1 | 2)` or e.g., `x @ 0 | x @ (1 | 2)`.
497                 self.push(row)
498             }
499         } else {
500             self.patterns.push(row);
501             self.update_cache(self.patterns.len() - 1);
502         }
503     }
504
505     fn update_cache(&mut self, idx: usize) {
506         let row = &self.patterns[idx];
507         // We don't know which kind of cache could be used until we see the first row; therefore an
508         // empty `Matrix` is initialized with `SpecializationCache::Empty`, then the cache is
509         // assigned the appropriate variant below on the first call to `push`.
510         if self.patterns.is_empty() {
511             self.cache = if row.is_empty() {
512                 SpecializationCache::Incompatible
513             } else {
514                 match *row.head().kind {
515                     PatKind::Variant { .. } => SpecializationCache::Variants {
516                         lookup: FxHashMap::default(),
517                         wilds: SmallVec::new(),
518                     },
519                     // Note: If the first pattern is a wildcard, then all patterns after that is not
520                     // useful. The check is simple enough so we treat it as the same as unsupported
521                     // patterns.
522                     _ => SpecializationCache::Incompatible,
523                 }
524             };
525         }
526         // Update the cache.
527         match &mut self.cache {
528             SpecializationCache::Variants { ref mut lookup, ref mut wilds } => {
529                 let head = row.head();
530                 match *head.kind {
531                     _ if head.is_wildcard() => {
532                         // Per rule 1.3 in the top-level comments, a wildcard pattern is included in
533                         // the result of `specialize_constructor` for *any* `Constructor`.
534                         // We push the wildcard pattern to the precomputed result for constructors
535                         // that we have seen before; results for constructors we have not yet seen
536                         // defaults to `wilds`, which is updated right below.
537                         for (_, v) in lookup.iter_mut() {
538                             v.push(idx);
539                         }
540                         // Per rule 2.1 and 2.2 in the top-level comments, only wildcard patterns
541                         // are included in the result of specialization with a wildcard.
542                         // What we do here is to track the wildcards we have seen; so in addition to
543                         // acting as the precomputed result of specialization with a wildcard, `wilds` also
544                         // serves as the default value of `specialize_constructor` for constructors
545                         // that are not in `lookup`.
546                         wilds.push(idx);
547                     }
548                     PatKind::Variant { adt_def, variant_index, .. } => {
549                         // Handle the cases of rule 1.1 and 1.2 in the top-level comments.
550                         // A variant pattern can only be included in the results of
551                         // `specialize_constructor` for a particular constructor, therefore we are
552                         // using a HashMap to track that.
553                         lookup
554                             .entry(adt_def.variants[variant_index].def_id)
555                             // Default to `wilds` for absent keys. See above for an explanation.
556                             .or_insert_with(|| wilds.clone())
557                             .push(idx);
558                     }
559                     _ => {
560                         self.cache = SpecializationCache::Incompatible;
561                     }
562                 }
563             }
564             SpecializationCache::Incompatible => {}
565         }
566     }
567
568     /// Iterate over the first component of each row
569     fn heads<'a>(&'a self) -> impl Iterator<Item = &'a Pat<'tcx>> + Captures<'p> {
570         self.patterns.iter().map(|r| r.head())
571     }
572
573     /// This computes `S(constructor, self)`. See top of the file for explanations.
574     fn specialize_constructor(
575         &self,
576         cx: &MatchCheckCtxt<'p, 'tcx>,
577         constructor: &Constructor<'tcx>,
578         ctor_wild_subpatterns: &Fields<'p, 'tcx>,
579     ) -> Matrix<'p, 'tcx> {
580         match &self.cache {
581             SpecializationCache::Variants { lookup, wilds } => {
582                 let cached = if let Constructor::Variant(id) = constructor {
583                     lookup
584                         .get(id)
585                         // Default to `wilds` for absent keys. See `update_cache` for an explanation.
586                         .unwrap_or(&wilds)
587                 } else if let Wildcard = constructor {
588                     &wilds
589                 } else {
590                     bug!(
591                         "unexpected constructor encountered while dealing with matrix cache: {:?}",
592                         constructor
593                     );
594                 };
595                 let result: Self = cached
596                     .iter()
597                     .filter_map(|&i| {
598                         self.patterns[i].specialize_constructor(
599                             cx,
600                             constructor,
601                             ctor_wild_subpatterns,
602                             false,
603                         )
604                     })
605                     .collect();
606                 // When debug assertions are enabled, check the results against the "slow path"
607                 // result.
608                 debug_assert_eq!(
609                     result,
610                     Matrix {
611                         patterns: self.patterns.clone(),
612                         cache: SpecializationCache::Incompatible
613                     }
614                     .specialize_constructor(
615                         cx,
616                         constructor,
617                         ctor_wild_subpatterns
618                     )
619                 );
620                 result
621             }
622             SpecializationCache::Incompatible => self
623                 .patterns
624                 .iter()
625                 .filter_map(|r| {
626                     r.specialize_constructor(cx, constructor, ctor_wild_subpatterns, false)
627                 })
628                 .collect(),
629         }
630     }
631 }
632
633 /// Pretty-printer for matrices of patterns, example:
634 ///
635 /// ```text
636 /// +++++++++++++++++++++++++++++
637 /// + _     + []                +
638 /// +++++++++++++++++++++++++++++
639 /// + true  + [First]           +
640 /// +++++++++++++++++++++++++++++
641 /// + true  + [Second(true)]    +
642 /// +++++++++++++++++++++++++++++
643 /// + false + [_]               +
644 /// +++++++++++++++++++++++++++++
645 /// + _     + [_, _, tail @ ..] +
646 /// +++++++++++++++++++++++++++++
647 /// ```
648 impl<'p, 'tcx> fmt::Debug for Matrix<'p, 'tcx> {
649     fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
650         write!(f, "\n")?;
651
652         let Matrix { patterns: m, .. } = self;
653         let pretty_printed_matrix: Vec<Vec<String>> =
654             m.iter().map(|row| row.iter().map(|pat| format!("{:?}", pat)).collect()).collect();
655
656         let column_count = m.iter().map(|row| row.len()).max().unwrap_or(0);
657         assert!(m.iter().all(|row| row.len() == column_count));
658         let column_widths: Vec<usize> = (0..column_count)
659             .map(|col| pretty_printed_matrix.iter().map(|row| row[col].len()).max().unwrap_or(0))
660             .collect();
661
662         let total_width = column_widths.iter().cloned().sum::<usize>() + column_count * 3 + 1;
663         let br = "+".repeat(total_width);
664         write!(f, "{}\n", br)?;
665         for row in pretty_printed_matrix {
666             write!(f, "+")?;
667             for (column, pat_str) in row.into_iter().enumerate() {
668                 write!(f, " ")?;
669                 write!(f, "{:1$}", pat_str, column_widths[column])?;
670                 write!(f, " +")?;
671             }
672             write!(f, "\n")?;
673             write!(f, "{}\n", br)?;
674         }
675         Ok(())
676     }
677 }
678
679 impl<'p, 'tcx> FromIterator<PatStack<'p, 'tcx>> for Matrix<'p, 'tcx> {
680     fn from_iter<T>(iter: T) -> Self
681     where
682         T: IntoIterator<Item = PatStack<'p, 'tcx>>,
683     {
684         let mut matrix = Matrix::empty();
685         for x in iter {
686             // Using `push` ensures we correctly expand or-patterns.
687             matrix.push(x);
688         }
689         matrix
690     }
691 }
692
693 crate struct MatchCheckCtxt<'a, 'tcx> {
694     crate tcx: TyCtxt<'tcx>,
695     /// The module in which the match occurs. This is necessary for
696     /// checking inhabited-ness of types because whether a type is (visibly)
697     /// inhabited can depend on whether it was defined in the current module or
698     /// not. E.g., `struct Foo { _private: ! }` cannot be seen to be empty
699     /// outside it's module and should not be matchable with an empty match
700     /// statement.
701     crate module: DefId,
702     crate param_env: ty::ParamEnv<'tcx>,
703     crate pattern_arena: &'a TypedArena<Pat<'tcx>>,
704 }
705
706 impl<'a, 'tcx> MatchCheckCtxt<'a, 'tcx> {
707     fn is_uninhabited(&self, ty: Ty<'tcx>) -> bool {
708         if self.tcx.features().exhaustive_patterns {
709             self.tcx.is_ty_uninhabited_from(self.module, ty, self.param_env)
710         } else {
711             false
712         }
713     }
714
715     /// Returns whether the given type is an enum from another crate declared `#[non_exhaustive]`.
716     crate fn is_foreign_non_exhaustive_enum(&self, ty: Ty<'tcx>) -> bool {
717         match ty.kind() {
718             ty::Adt(def, ..) => {
719                 def.is_enum() && def.is_variant_list_non_exhaustive() && !def.did.is_local()
720             }
721             _ => false,
722         }
723     }
724 }
725
726 #[derive(Copy, Clone, Debug, PartialEq, Eq)]
727 enum SliceKind {
728     /// Patterns of length `n` (`[x, y]`).
729     FixedLen(u64),
730     /// Patterns using the `..` notation (`[x, .., y]`).
731     /// Captures any array constructor of `length >= i + j`.
732     /// In the case where `array_len` is `Some(_)`,
733     /// this indicates that we only care about the first `i` and the last `j` values of the array,
734     /// and everything in between is a wildcard `_`.
735     VarLen(u64, u64),
736 }
737
738 impl SliceKind {
739     fn arity(self) -> u64 {
740         match self {
741             FixedLen(length) => length,
742             VarLen(prefix, suffix) => prefix + suffix,
743         }
744     }
745
746     /// Whether this pattern includes patterns of length `other_len`.
747     fn covers_length(self, other_len: u64) -> bool {
748         match self {
749             FixedLen(len) => len == other_len,
750             VarLen(prefix, suffix) => prefix + suffix <= other_len,
751         }
752     }
753
754     /// Returns a collection of slices that spans the values covered by `self`, subtracted by the
755     /// values covered by `other`: i.e., `self \ other` (in set notation).
756     fn subtract(self, other: Self) -> SmallVec<[Self; 1]> {
757         // Remember, `VarLen(i, j)` covers the union of `FixedLen` from `i + j` to infinity.
758         // Naming: we remove the "neg" constructors from the "pos" ones.
759         match self {
760             FixedLen(pos_len) => {
761                 if other.covers_length(pos_len) {
762                     smallvec![]
763                 } else {
764                     smallvec![self]
765                 }
766             }
767             VarLen(pos_prefix, pos_suffix) => {
768                 let pos_len = pos_prefix + pos_suffix;
769                 match other {
770                     FixedLen(neg_len) => {
771                         if neg_len < pos_len {
772                             smallvec![self]
773                         } else {
774                             (pos_len..neg_len)
775                                 .map(FixedLen)
776                                 // We know that `neg_len + 1 >= pos_len >= pos_suffix`.
777                                 .chain(Some(VarLen(neg_len + 1 - pos_suffix, pos_suffix)))
778                                 .collect()
779                         }
780                     }
781                     VarLen(neg_prefix, neg_suffix) => {
782                         let neg_len = neg_prefix + neg_suffix;
783                         if neg_len <= pos_len {
784                             smallvec![]
785                         } else {
786                             (pos_len..neg_len).map(FixedLen).collect()
787                         }
788                     }
789                 }
790             }
791         }
792     }
793 }
794
795 /// A constructor for array and slice patterns.
796 #[derive(Copy, Clone, Debug, PartialEq, Eq)]
797 struct Slice {
798     /// `None` if the matched value is a slice, `Some(n)` if it is an array of size `n`.
799     array_len: Option<u64>,
800     /// The kind of pattern it is: fixed-length `[x, y]` or variable length `[x, .., y]`.
801     kind: SliceKind,
802 }
803
804 impl Slice {
805     /// Returns what patterns this constructor covers: either fixed-length patterns or
806     /// variable-length patterns.
807     fn pattern_kind(self) -> SliceKind {
808         match self {
809             Slice { array_len: Some(len), kind: VarLen(prefix, suffix) }
810                 if prefix + suffix == len =>
811             {
812                 FixedLen(len)
813             }
814             _ => self.kind,
815         }
816     }
817
818     /// Returns what values this constructor covers: either values of only one given length, or
819     /// values of length above a given length.
820     /// This is different from `pattern_kind()` because in some cases the pattern only takes into
821     /// account a subset of the entries of the array, but still only captures values of a given
822     /// length.
823     fn value_kind(self) -> SliceKind {
824         match self {
825             Slice { array_len: Some(len), kind: VarLen(_, _) } => FixedLen(len),
826             _ => self.kind,
827         }
828     }
829
830     fn arity(self) -> u64 {
831         self.pattern_kind().arity()
832     }
833
834     /// The exhaustiveness-checking paper does not include any details on
835     /// checking variable-length slice patterns. However, they are matched
836     /// by an infinite collection of fixed-length array patterns.
837     ///
838     /// Checking the infinite set directly would take an infinite amount
839     /// of time. However, it turns out that for each finite set of
840     /// patterns `P`, all sufficiently large array lengths are equivalent:
841     ///
842     /// Each slice `s` with a "sufficiently-large" length `l ≥ L` that applies
843     /// to exactly the subset `Pₜ` of `P` can be transformed to a slice
844     /// `sₘ` for each sufficiently-large length `m` that applies to exactly
845     /// the same subset of `P`.
846     ///
847     /// Because of that, each witness for reachability-checking from one
848     /// of the sufficiently-large lengths can be transformed to an
849     /// equally-valid witness from any other length, so we only have
850     /// to check slice lengths from the "minimal sufficiently-large length"
851     /// and below.
852     ///
853     /// Note that the fact that there is a *single* `sₘ` for each `m`
854     /// not depending on the specific pattern in `P` is important: if
855     /// you look at the pair of patterns
856     ///     `[true, ..]`
857     ///     `[.., false]`
858     /// Then any slice of length ≥1 that matches one of these two
859     /// patterns can be trivially turned to a slice of any
860     /// other length ≥1 that matches them and vice-versa - for
861     /// but the slice from length 2 `[false, true]` that matches neither
862     /// of these patterns can't be turned to a slice from length 1 that
863     /// matches neither of these patterns, so we have to consider
864     /// slices from length 2 there.
865     ///
866     /// Now, to see that that length exists and find it, observe that slice
867     /// patterns are either "fixed-length" patterns (`[_, _, _]`) or
868     /// "variable-length" patterns (`[_, .., _]`).
869     ///
870     /// For fixed-length patterns, all slices with lengths *longer* than
871     /// the pattern's length have the same outcome (of not matching), so
872     /// as long as `L` is greater than the pattern's length we can pick
873     /// any `sₘ` from that length and get the same result.
874     ///
875     /// For variable-length patterns, the situation is more complicated,
876     /// because as seen above the precise value of `sₘ` matters.
877     ///
878     /// However, for each variable-length pattern `p` with a prefix of length
879     /// `plₚ` and suffix of length `slₚ`, only the first `plₚ` and the last
880     /// `slₚ` elements are examined.
881     ///
882     /// Therefore, as long as `L` is positive (to avoid concerns about empty
883     /// types), all elements after the maximum prefix length and before
884     /// the maximum suffix length are not examined by any variable-length
885     /// pattern, and therefore can be added/removed without affecting
886     /// them - creating equivalent patterns from any sufficiently-large
887     /// length.
888     ///
889     /// Of course, if fixed-length patterns exist, we must be sure
890     /// that our length is large enough to miss them all, so
891     /// we can pick `L = max(max(FIXED_LEN)+1, max(PREFIX_LEN) + max(SUFFIX_LEN))`
892     ///
893     /// for example, with the above pair of patterns, all elements
894     /// but the first and last can be added/removed, so any
895     /// witness of length ≥2 (say, `[false, false, true]`) can be
896     /// turned to a witness from any other length ≥2.
897     fn split<'p, 'tcx>(
898         self,
899         cx: &MatchCheckCtxt<'p, 'tcx>,
900         matrix: &Matrix<'p, 'tcx>,
901     ) -> SmallVec<[Constructor<'tcx>; 1]> {
902         let (array_len, self_prefix, self_suffix) = match self {
903             Slice { array_len, kind: VarLen(self_prefix, self_suffix) } => {
904                 (array_len, self_prefix, self_suffix)
905             }
906             _ => return smallvec![Slice(self)],
907         };
908
909         let head_ctors = matrix
910             .heads()
911             .map(|p| pat_constructor(cx.tcx, cx.param_env, p))
912             .filter(|c| !c.is_wildcard());
913
914         let mut max_prefix_len = self_prefix;
915         let mut max_suffix_len = self_suffix;
916         let mut max_fixed_len = 0;
917
918         for ctor in head_ctors {
919             if let Slice(slice) = ctor {
920                 match slice.pattern_kind() {
921                     FixedLen(len) => {
922                         max_fixed_len = cmp::max(max_fixed_len, len);
923                     }
924                     VarLen(prefix, suffix) => {
925                         max_prefix_len = cmp::max(max_prefix_len, prefix);
926                         max_suffix_len = cmp::max(max_suffix_len, suffix);
927                     }
928                 }
929             }
930         }
931
932         // For diagnostics, we keep the prefix and suffix lengths separate, so in the case
933         // where `max_fixed_len + 1` is the largest, we adapt `max_prefix_len` accordingly,
934         // so that `L = max_prefix_len + max_suffix_len`.
935         if max_fixed_len + 1 >= max_prefix_len + max_suffix_len {
936             // The subtraction can't overflow thanks to the above check.
937             // The new `max_prefix_len` is also guaranteed to be larger than its previous
938             // value.
939             max_prefix_len = max_fixed_len + 1 - max_suffix_len;
940         }
941
942         match array_len {
943             Some(len) => {
944                 let kind = if max_prefix_len + max_suffix_len < len {
945                     VarLen(max_prefix_len, max_suffix_len)
946                 } else {
947                     FixedLen(len)
948                 };
949                 smallvec![Slice(Slice { array_len, kind })]
950             }
951             None => {
952                 // `ctor` originally covered the range `(self_prefix +
953                 // self_suffix..infinity)`. We now split it into two: lengths smaller than
954                 // `max_prefix_len + max_suffix_len` are treated independently as
955                 // fixed-lengths slices, and lengths above are captured by a final VarLen
956                 // constructor.
957                 let smaller_lengths =
958                     (self_prefix + self_suffix..max_prefix_len + max_suffix_len).map(FixedLen);
959                 let final_slice = VarLen(max_prefix_len, max_suffix_len);
960                 smaller_lengths
961                     .chain(Some(final_slice))
962                     .map(|kind| Slice { array_len, kind })
963                     .map(Slice)
964                     .collect()
965             }
966         }
967     }
968 }
969
970 /// A value can be decomposed into a constructor applied to some fields. This struct represents
971 /// the constructor. See also `Fields`.
972 ///
973 /// `pat_constructor` retrieves the constructor corresponding to a pattern.
974 /// `specialize_constructor` returns the list of fields corresponding to a pattern, given a
975 /// constructor. `Constructor::apply` reconstructs the pattern from a pair of `Constructor` and
976 /// `Fields`.
977 #[derive(Clone, Debug, PartialEq)]
978 enum Constructor<'tcx> {
979     /// The constructor for patterns that have a single constructor, like tuples, struct patterns
980     /// and fixed-length arrays.
981     Single,
982     /// Enum variants.
983     Variant(DefId),
984     /// Ranges of integer literal values (`2`, `2..=5` or `2..5`).
985     IntRange(IntRange<'tcx>),
986     /// Ranges of floating-point literal values (`2.0..=5.2`).
987     FloatRange(&'tcx ty::Const<'tcx>, &'tcx ty::Const<'tcx>, RangeEnd),
988     /// String literals. Strings are not quite the same as `&[u8]` so we treat them separately.
989     Str(&'tcx ty::Const<'tcx>),
990     /// Array and slice patterns.
991     Slice(Slice),
992     /// Constants that must not be matched structurally. They are treated as black
993     /// boxes for the purposes of exhaustiveness: we must not inspect them, and they
994     /// don't count towards making a match exhaustive.
995     Opaque,
996     /// Fake extra constructor for enums that aren't allowed to be matched exhaustively.
997     NonExhaustive,
998     /// Wildcard pattern.
999     Wildcard,
1000 }
1001
1002 impl<'tcx> Constructor<'tcx> {
1003     fn is_wildcard(&self) -> bool {
1004         match self {
1005             Wildcard => true,
1006             _ => false,
1007         }
1008     }
1009
1010     fn variant_index_for_adt(&self, adt: &'tcx ty::AdtDef) -> VariantIdx {
1011         match *self {
1012             Variant(id) => adt.variant_index_with_id(id),
1013             Single => {
1014                 assert!(!adt.is_enum());
1015                 VariantIdx::new(0)
1016             }
1017             _ => bug!("bad constructor {:?} for adt {:?}", self, adt),
1018         }
1019     }
1020
1021     // Returns the set of constructors covered by `self` but not by
1022     // anything in `other_ctors`.
1023     fn subtract_ctors(&self, other_ctors: &Vec<Constructor<'tcx>>) -> Vec<Constructor<'tcx>> {
1024         if other_ctors.is_empty() {
1025             return vec![self.clone()];
1026         }
1027
1028         match self {
1029             // Those constructors can only match themselves.
1030             Single | Variant(_) | Str(..) | FloatRange(..) => {
1031                 if other_ctors.iter().any(|c| c == self) { vec![] } else { vec![self.clone()] }
1032             }
1033             &Slice(slice) => {
1034                 let mut other_slices = other_ctors
1035                     .iter()
1036                     .filter_map(|c: &Constructor<'_>| match c {
1037                         Slice(slice) => Some(*slice),
1038                         _ => bug!("bad slice pattern constructor {:?}", c),
1039                     })
1040                     .map(Slice::value_kind);
1041
1042                 match slice.value_kind() {
1043                     FixedLen(self_len) => {
1044                         if other_slices.any(|other_slice| other_slice.covers_length(self_len)) {
1045                             vec![]
1046                         } else {
1047                             vec![Slice(slice)]
1048                         }
1049                     }
1050                     kind @ VarLen(..) => {
1051                         let mut remaining_slices = vec![kind];
1052
1053                         // For each used slice, subtract from the current set of slices.
1054                         for other_slice in other_slices {
1055                             remaining_slices = remaining_slices
1056                                 .into_iter()
1057                                 .flat_map(|remaining_slice| remaining_slice.subtract(other_slice))
1058                                 .collect();
1059
1060                             // If the constructors that have been considered so far already cover
1061                             // the entire range of `self`, no need to look at more constructors.
1062                             if remaining_slices.is_empty() {
1063                                 break;
1064                             }
1065                         }
1066
1067                         remaining_slices
1068                             .into_iter()
1069                             .map(|kind| Slice { array_len: slice.array_len, kind })
1070                             .map(Slice)
1071                             .collect()
1072                     }
1073                 }
1074             }
1075             IntRange(self_range) => {
1076                 let mut remaining_ranges = vec![self_range.clone()];
1077                 for other_ctor in other_ctors {
1078                     if let IntRange(other_range) = other_ctor {
1079                         if other_range == self_range {
1080                             // If the `self` range appears directly in a `match` arm, we can
1081                             // eliminate it straight away.
1082                             remaining_ranges = vec![];
1083                         } else {
1084                             // Otherwise explicitly compute the remaining ranges.
1085                             remaining_ranges = other_range.subtract_from(remaining_ranges);
1086                         }
1087
1088                         // If the ranges that have been considered so far already cover the entire
1089                         // range of values, we can return early.
1090                         if remaining_ranges.is_empty() {
1091                             break;
1092                         }
1093                     }
1094                 }
1095
1096                 // Convert the ranges back into constructors.
1097                 remaining_ranges.into_iter().map(IntRange).collect()
1098             }
1099             // This constructor is never covered by anything else
1100             NonExhaustive => vec![NonExhaustive],
1101             Opaque => bug!("found unexpected opaque ctor in all_ctors"),
1102             Wildcard => bug!("found unexpected wildcard ctor in all_ctors"),
1103         }
1104     }
1105
1106     /// Some constructors (namely IntRange and Slice) actually stand for a set of actual
1107     /// constructors (integers and fixed-sized slices). When specializing for these
1108     /// constructors, we want to be specialising for the actual underlying constructors.
1109     /// Naively, we would simply return the list of constructors they correspond to. We instead are
1110     /// more clever: if there are constructors that we know will behave the same wrt the current
1111     /// matrix, we keep them grouped. For example, all slices of a sufficiently large length
1112     /// will either be all useful or all non-useful with a given matrix.
1113     ///
1114     /// See the branches for details on how the splitting is done.
1115     ///
1116     /// This function may discard some irrelevant constructors if this preserves behavior and
1117     /// diagnostics. Eg. for the `_` case, we ignore the constructors already present in the
1118     /// matrix, unless all of them are.
1119     ///
1120     /// `hir_id` is `None` when we're evaluating the wildcard pattern. In that case we do not want
1121     /// to lint for overlapping ranges.
1122     fn split<'p>(
1123         self,
1124         cx: &MatchCheckCtxt<'p, 'tcx>,
1125         pcx: PatCtxt<'tcx>,
1126         matrix: &Matrix<'p, 'tcx>,
1127         hir_id: Option<HirId>,
1128     ) -> SmallVec<[Self; 1]> {
1129         debug!("Constructor::split({:#?}, {:#?})", self, matrix);
1130
1131         match self {
1132             // Fast-track if the range is trivial. In particular, we don't do the overlapping
1133             // ranges check.
1134             IntRange(ctor_range)
1135                 if ctor_range.treat_exhaustively(cx.tcx) && !ctor_range.is_singleton() =>
1136             {
1137                 ctor_range.split(cx, pcx, matrix, hir_id)
1138             }
1139             Slice(slice @ Slice { kind: VarLen(..), .. }) => slice.split(cx, matrix),
1140             // Any other constructor can be used unchanged.
1141             _ => smallvec![self],
1142         }
1143     }
1144
1145     /// Returns whether `self` is covered by `other`, ie whether `self` is a subset of `other`. For
1146     /// the simple cases, this is simply checking for equality. For the "grouped" constructors,
1147     /// this checks for inclusion.
1148     fn is_covered_by<'p>(
1149         &self,
1150         cx: &MatchCheckCtxt<'p, 'tcx>,
1151         other: &Constructor<'tcx>,
1152         ty: Ty<'tcx>,
1153     ) -> bool {
1154         match (self, other) {
1155             // Wildcards cover anything
1156             (_, Wildcard) => true,
1157             // Wildcards are only covered by wildcards
1158             (Wildcard, _) => false,
1159
1160             (Single, Single) => true,
1161             (Variant(self_id), Variant(other_id)) => self_id == other_id,
1162
1163             (IntRange(self_range), IntRange(other_range)) => {
1164                 if self_range.intersection(cx.tcx, other_range).is_some() {
1165                     // Constructor splitting should ensure that all intersections we encounter
1166                     // are actually inclusions.
1167                     assert!(self_range.is_subrange(other_range));
1168                     true
1169                 } else {
1170                     false
1171                 }
1172             }
1173             (
1174                 FloatRange(self_from, self_to, self_end),
1175                 FloatRange(other_from, other_to, other_end),
1176             ) => {
1177                 match (
1178                     compare_const_vals(cx.tcx, self_to, other_to, cx.param_env, ty),
1179                     compare_const_vals(cx.tcx, self_from, other_from, cx.param_env, ty),
1180                 ) {
1181                     (Some(to), Some(from)) => {
1182                         (from == Ordering::Greater || from == Ordering::Equal)
1183                             && (to == Ordering::Less
1184                                 || (other_end == self_end && to == Ordering::Equal))
1185                     }
1186                     _ => false,
1187                 }
1188             }
1189             (Str(self_val), Str(other_val)) => {
1190                 // FIXME: there's probably a more direct way of comparing for equality
1191                 match compare_const_vals(cx.tcx, self_val, other_val, cx.param_env, ty) {
1192                     Some(comparison) => comparison == Ordering::Equal,
1193                     None => false,
1194                 }
1195             }
1196
1197             (Slice(self_slice), Slice(other_slice)) => {
1198                 other_slice.pattern_kind().covers_length(self_slice.arity())
1199             }
1200
1201             // We are trying to inspect an opaque constant. Thus we skip the row.
1202             (Opaque, _) | (_, Opaque) => false,
1203             // Only a wildcard pattern can match the special extra constructor.
1204             (NonExhaustive, _) => false,
1205
1206             _ => bug!("trying to compare incompatible constructors {:?} and {:?}", self, other),
1207         }
1208     }
1209
1210     /// Apply a constructor to a list of patterns, yielding a new pattern. `pats`
1211     /// must have as many elements as this constructor's arity.
1212     ///
1213     /// This is roughly the inverse of `specialize_constructor`.
1214     ///
1215     /// Examples:
1216     /// `self`: `Constructor::Single`
1217     /// `ty`: `(u32, u32, u32)`
1218     /// `pats`: `[10, 20, _]`
1219     /// returns `(10, 20, _)`
1220     ///
1221     /// `self`: `Constructor::Variant(Option::Some)`
1222     /// `ty`: `Option<bool>`
1223     /// `pats`: `[false]`
1224     /// returns `Some(false)`
1225     fn apply<'p>(
1226         &self,
1227         cx: &MatchCheckCtxt<'p, 'tcx>,
1228         ty: Ty<'tcx>,
1229         fields: Fields<'p, 'tcx>,
1230     ) -> Pat<'tcx> {
1231         let mut subpatterns = fields.all_patterns();
1232
1233         let pat = match self {
1234             Single | Variant(_) => match ty.kind() {
1235                 ty::Adt(..) | ty::Tuple(..) => {
1236                     let subpatterns = subpatterns
1237                         .enumerate()
1238                         .map(|(i, p)| FieldPat { field: Field::new(i), pattern: p })
1239                         .collect();
1240
1241                     if let ty::Adt(adt, substs) = ty.kind() {
1242                         if adt.is_enum() {
1243                             PatKind::Variant {
1244                                 adt_def: adt,
1245                                 substs,
1246                                 variant_index: self.variant_index_for_adt(adt),
1247                                 subpatterns,
1248                             }
1249                         } else {
1250                             PatKind::Leaf { subpatterns }
1251                         }
1252                     } else {
1253                         PatKind::Leaf { subpatterns }
1254                     }
1255                 }
1256                 ty::Ref(..) => PatKind::Deref { subpattern: subpatterns.next().unwrap() },
1257                 ty::Slice(_) | ty::Array(..) => bug!("bad slice pattern {:?} {:?}", self, ty),
1258                 _ => PatKind::Wild,
1259             },
1260             Slice(slice) => match slice.pattern_kind() {
1261                 FixedLen(_) => {
1262                     PatKind::Slice { prefix: subpatterns.collect(), slice: None, suffix: vec![] }
1263                 }
1264                 VarLen(prefix, _) => {
1265                     let mut prefix: Vec<_> = subpatterns.by_ref().take(prefix as usize).collect();
1266                     if slice.array_len.is_some() {
1267                         // Improves diagnostics a bit: if the type is a known-size array, instead
1268                         // of reporting `[x, _, .., _, y]`, we prefer to report `[x, .., y]`.
1269                         // This is incorrect if the size is not known, since `[_, ..]` captures
1270                         // arrays of lengths `>= 1` whereas `[..]` captures any length.
1271                         while !prefix.is_empty() && prefix.last().unwrap().is_wildcard() {
1272                             prefix.pop();
1273                         }
1274                     }
1275                     let suffix: Vec<_> = if slice.array_len.is_some() {
1276                         // Same as above.
1277                         subpatterns.skip_while(Pat::is_wildcard).collect()
1278                     } else {
1279                         subpatterns.collect()
1280                     };
1281                     let wild = Pat::wildcard_from_ty(ty);
1282                     PatKind::Slice { prefix, slice: Some(wild), suffix }
1283                 }
1284             },
1285             &Str(value) => PatKind::Constant { value },
1286             &FloatRange(lo, hi, end) => PatKind::Range(PatRange { lo, hi, end }),
1287             IntRange(range) => return range.to_pat(cx.tcx),
1288             NonExhaustive => PatKind::Wild,
1289             Opaque => bug!("we should not try to apply an opaque constructor"),
1290             Wildcard => bug!("we should not try to apply a wildcard constructor"),
1291         };
1292
1293         Pat { ty, span: DUMMY_SP, kind: Box::new(pat) }
1294     }
1295
1296     /// Like `apply`, but where all the subpatterns are wildcards `_`.
1297     fn apply_wildcards<'a>(&self, cx: &MatchCheckCtxt<'a, 'tcx>, ty: Ty<'tcx>) -> Pat<'tcx> {
1298         self.apply(cx, ty, Fields::wildcards(cx, self, ty))
1299     }
1300 }
1301
1302 /// Some fields need to be explicitly hidden away in certain cases; see the comment above the
1303 /// `Fields` struct. This struct represents such a potentially-hidden field. When a field is hidden
1304 /// we still keep its type around.
1305 #[derive(Debug, Copy, Clone)]
1306 enum FilteredField<'p, 'tcx> {
1307     Kept(&'p Pat<'tcx>),
1308     Hidden(Ty<'tcx>),
1309 }
1310
1311 impl<'p, 'tcx> FilteredField<'p, 'tcx> {
1312     fn kept(self) -> Option<&'p Pat<'tcx>> {
1313         match self {
1314             FilteredField::Kept(p) => Some(p),
1315             FilteredField::Hidden(_) => None,
1316         }
1317     }
1318
1319     fn to_pattern(self) -> Pat<'tcx> {
1320         match self {
1321             FilteredField::Kept(p) => p.clone(),
1322             FilteredField::Hidden(ty) => Pat::wildcard_from_ty(ty),
1323         }
1324     }
1325 }
1326
1327 /// A value can be decomposed into a constructor applied to some fields. This struct represents
1328 /// those fields, generalized to allow patterns in each field. See also `Constructor`.
1329 ///
1330 /// If a private or `non_exhaustive` field is uninhabited, the code mustn't observe that it is
1331 /// uninhabited. For that, we filter these fields out of the matrix. This is subtle because we
1332 /// still need to have those fields back when going to/from a `Pat`. Most of this is handled
1333 /// automatically in `Fields`, but when constructing or deconstructing `Fields` you need to be
1334 /// careful. As a rule, when going to/from the matrix, use the filtered field list; when going
1335 /// to/from `Pat`, use the full field list.
1336 /// This filtering is uncommon in practice, because uninhabited fields are rarely used, so we avoid
1337 /// it when possible to preserve performance.
1338 #[derive(Debug, Clone)]
1339 enum Fields<'p, 'tcx> {
1340     /// Lists of patterns that don't contain any filtered fields.
1341     /// `Slice` and `Vec` behave the same; the difference is only to avoid allocating and
1342     /// triple-dereferences when possible. Frankly this is premature optimization, I (Nadrieril)
1343     /// have not measured if it really made a difference.
1344     Slice(&'p [Pat<'tcx>]),
1345     Vec(SmallVec<[&'p Pat<'tcx>; 2]>),
1346     /// Patterns where some of the fields need to be hidden. `kept_count` caches the number of
1347     /// non-hidden fields.
1348     Filtered {
1349         fields: SmallVec<[FilteredField<'p, 'tcx>; 2]>,
1350         kept_count: usize,
1351     },
1352 }
1353
1354 impl<'p, 'tcx> Fields<'p, 'tcx> {
1355     fn empty() -> Self {
1356         Fields::Slice(&[])
1357     }
1358
1359     /// Construct a new `Fields` from the given pattern. Must not be used if the pattern is a field
1360     /// of a struct/tuple/variant.
1361     fn from_single_pattern(pat: &'p Pat<'tcx>) -> Self {
1362         Fields::Slice(std::slice::from_ref(pat))
1363     }
1364
1365     /// Convenience; internal use.
1366     fn wildcards_from_tys(
1367         cx: &MatchCheckCtxt<'p, 'tcx>,
1368         tys: impl IntoIterator<Item = Ty<'tcx>>,
1369     ) -> Self {
1370         let wilds = tys.into_iter().map(Pat::wildcard_from_ty);
1371         let pats = cx.pattern_arena.alloc_from_iter(wilds);
1372         Fields::Slice(pats)
1373     }
1374
1375     /// Creates a new list of wildcard fields for a given constructor.
1376     fn wildcards(
1377         cx: &MatchCheckCtxt<'p, 'tcx>,
1378         constructor: &Constructor<'tcx>,
1379         ty: Ty<'tcx>,
1380     ) -> Self {
1381         let wildcard_from_ty = |ty| &*cx.pattern_arena.alloc(Pat::wildcard_from_ty(ty));
1382
1383         let ret = match constructor {
1384             Single | Variant(_) => match ty.kind() {
1385                 ty::Tuple(ref fs) => {
1386                     Fields::wildcards_from_tys(cx, fs.into_iter().map(|ty| ty.expect_ty()))
1387                 }
1388                 ty::Ref(_, rty, _) => Fields::from_single_pattern(wildcard_from_ty(rty)),
1389                 ty::Adt(adt, substs) => {
1390                     if adt.is_box() {
1391                         // Use T as the sub pattern type of Box<T>.
1392                         Fields::from_single_pattern(wildcard_from_ty(substs.type_at(0)))
1393                     } else {
1394                         let variant = &adt.variants[constructor.variant_index_for_adt(adt)];
1395                         // Whether we must not match the fields of this variant exhaustively.
1396                         let is_non_exhaustive =
1397                             variant.is_field_list_non_exhaustive() && !adt.did.is_local();
1398                         let field_tys = variant.fields.iter().map(|field| field.ty(cx.tcx, substs));
1399                         // In the following cases, we don't need to filter out any fields. This is
1400                         // the vast majority of real cases, since uninhabited fields are uncommon.
1401                         let has_no_hidden_fields = (adt.is_enum() && !is_non_exhaustive)
1402                             || !field_tys.clone().any(|ty| cx.is_uninhabited(ty));
1403
1404                         if has_no_hidden_fields {
1405                             Fields::wildcards_from_tys(cx, field_tys)
1406                         } else {
1407                             let mut kept_count = 0;
1408                             let fields = variant
1409                                 .fields
1410                                 .iter()
1411                                 .map(|field| {
1412                                     let ty = field.ty(cx.tcx, substs);
1413                                     let is_visible = adt.is_enum()
1414                                         || field.vis.is_accessible_from(cx.module, cx.tcx);
1415                                     let is_uninhabited = cx.is_uninhabited(ty);
1416
1417                                     // In the cases of either a `#[non_exhaustive]` field list
1418                                     // or a non-public field, we hide uninhabited fields in
1419                                     // order not to reveal the uninhabitedness of the whole
1420                                     // variant.
1421                                     if is_uninhabited && (!is_visible || is_non_exhaustive) {
1422                                         FilteredField::Hidden(ty)
1423                                     } else {
1424                                         kept_count += 1;
1425                                         FilteredField::Kept(wildcard_from_ty(ty))
1426                                     }
1427                                 })
1428                                 .collect();
1429                             Fields::Filtered { fields, kept_count }
1430                         }
1431                     }
1432                 }
1433                 _ => Fields::empty(),
1434             },
1435             Slice(slice) => match *ty.kind() {
1436                 ty::Slice(ty) | ty::Array(ty, _) => {
1437                     let arity = slice.arity();
1438                     Fields::wildcards_from_tys(cx, (0..arity).map(|_| ty))
1439                 }
1440                 _ => bug!("bad slice pattern {:?} {:?}", constructor, ty),
1441             },
1442             Str(..) | FloatRange(..) | IntRange(..) | NonExhaustive | Opaque | Wildcard => {
1443                 Fields::empty()
1444             }
1445         };
1446         debug!("Fields::wildcards({:?}, {:?}) = {:#?}", constructor, ty, ret);
1447         ret
1448     }
1449
1450     /// Returns the number of patterns from the viewpoint of match-checking, i.e. excluding hidden
1451     /// fields. This is what we want in most cases in this file, the only exception being
1452     /// conversion to/from `Pat`.
1453     fn len(&self) -> usize {
1454         match self {
1455             Fields::Slice(pats) => pats.len(),
1456             Fields::Vec(pats) => pats.len(),
1457             Fields::Filtered { kept_count, .. } => *kept_count,
1458         }
1459     }
1460
1461     /// Returns the complete list of patterns, including hidden fields.
1462     fn all_patterns(self) -> impl Iterator<Item = Pat<'tcx>> {
1463         let pats: SmallVec<[_; 2]> = match self {
1464             Fields::Slice(pats) => pats.iter().cloned().collect(),
1465             Fields::Vec(pats) => pats.into_iter().cloned().collect(),
1466             Fields::Filtered { fields, .. } => {
1467                 // We don't skip any fields here.
1468                 fields.into_iter().map(|p| p.to_pattern()).collect()
1469             }
1470         };
1471         pats.into_iter()
1472     }
1473
1474     /// Overrides some of the fields with the provided patterns. Exactly like
1475     /// `replace_fields_indexed`, except that it takes `FieldPat`s as input.
1476     fn replace_with_fieldpats(
1477         &self,
1478         new_pats: impl IntoIterator<Item = &'p FieldPat<'tcx>>,
1479     ) -> Self {
1480         self.replace_fields_indexed(
1481             new_pats.into_iter().map(|pat| (pat.field.index(), &pat.pattern)),
1482         )
1483     }
1484
1485     /// Overrides some of the fields with the provided patterns. This is used when a pattern
1486     /// defines some fields but not all, for example `Foo { field1: Some(_), .. }`: here we start with a
1487     /// `Fields` that is just one wildcard per field of the `Foo` struct, and override the entry
1488     /// corresponding to `field1` with the pattern `Some(_)`. This is also used for slice patterns
1489     /// for the same reason.
1490     fn replace_fields_indexed(
1491         &self,
1492         new_pats: impl IntoIterator<Item = (usize, &'p Pat<'tcx>)>,
1493     ) -> Self {
1494         let mut fields = self.clone();
1495         if let Fields::Slice(pats) = fields {
1496             fields = Fields::Vec(pats.iter().collect());
1497         }
1498
1499         match &mut fields {
1500             Fields::Vec(pats) => {
1501                 for (i, pat) in new_pats {
1502                     pats[i] = pat
1503                 }
1504             }
1505             Fields::Filtered { fields, .. } => {
1506                 for (i, pat) in new_pats {
1507                     if let FilteredField::Kept(p) = &mut fields[i] {
1508                         *p = pat
1509                     }
1510                 }
1511             }
1512             Fields::Slice(_) => unreachable!(),
1513         }
1514         fields
1515     }
1516
1517     /// Replaces contained fields with the given filtered list of patterns, e.g. taken from the
1518     /// matrix. There must be `len()` patterns in `pats`.
1519     fn replace_fields(
1520         &self,
1521         cx: &MatchCheckCtxt<'p, 'tcx>,
1522         pats: impl IntoIterator<Item = Pat<'tcx>>,
1523     ) -> Self {
1524         let pats: &[_] = cx.pattern_arena.alloc_from_iter(pats);
1525
1526         match self {
1527             Fields::Filtered { fields, kept_count } => {
1528                 let mut pats = pats.iter();
1529                 let mut fields = fields.clone();
1530                 for f in &mut fields {
1531                     if let FilteredField::Kept(p) = f {
1532                         // We take one input pattern for each `Kept` field, in order.
1533                         *p = pats.next().unwrap();
1534                     }
1535                 }
1536                 Fields::Filtered { fields, kept_count: *kept_count }
1537             }
1538             _ => Fields::Slice(pats),
1539         }
1540     }
1541
1542     /// Replaces contained fields with the arguments of the given pattern. Only use on a pattern
1543     /// that is compatible with the constructor used to build `self`.
1544     /// This is meant to be used on the result of `Fields::wildcards()`. The idea is that
1545     /// `wildcards` constructs a list of fields where all entries are wildcards, and the pattern
1546     /// provided to this function fills some of the fields with non-wildcards.
1547     /// In the following example `Fields::wildcards` would return `[_, _, _, _]`. If we call
1548     /// `replace_with_pattern_arguments` on it with the pattern, the result will be `[Some(0), _,
1549     /// _, _]`.
1550     /// ```rust
1551     /// let x: [Option<u8>; 4] = foo();
1552     /// match x {
1553     ///     [Some(0), ..] => {}
1554     /// }
1555     /// ```
1556     fn replace_with_pattern_arguments(&self, pat: &'p Pat<'tcx>) -> Self {
1557         match pat.kind.as_ref() {
1558             PatKind::Deref { subpattern } => Self::from_single_pattern(subpattern),
1559             PatKind::Leaf { subpatterns } | PatKind::Variant { subpatterns, .. } => {
1560                 self.replace_with_fieldpats(subpatterns)
1561             }
1562             PatKind::Array { prefix, suffix, .. } | PatKind::Slice { prefix, suffix, .. } => {
1563                 // Number of subpatterns for the constructor
1564                 let ctor_arity = self.len();
1565
1566                 // Replace the prefix and the suffix with the given patterns, leaving wildcards in
1567                 // the middle if there was a subslice pattern `..`.
1568                 let prefix = prefix.iter().enumerate();
1569                 let suffix =
1570                     suffix.iter().enumerate().map(|(i, p)| (ctor_arity - suffix.len() + i, p));
1571                 self.replace_fields_indexed(prefix.chain(suffix))
1572             }
1573             _ => self.clone(),
1574         }
1575     }
1576
1577     fn push_on_patstack(self, stack: &[&'p Pat<'tcx>]) -> PatStack<'p, 'tcx> {
1578         let pats: SmallVec<_> = match self {
1579             Fields::Slice(pats) => pats.iter().chain(stack.iter().copied()).collect(),
1580             Fields::Vec(mut pats) => {
1581                 pats.extend_from_slice(stack);
1582                 pats
1583             }
1584             Fields::Filtered { fields, .. } => {
1585                 // We skip hidden fields here
1586                 fields.into_iter().filter_map(|p| p.kept()).chain(stack.iter().copied()).collect()
1587             }
1588         };
1589         PatStack::from_vec(pats)
1590     }
1591 }
1592
1593 #[derive(Clone, Debug)]
1594 crate enum Usefulness<'tcx> {
1595     /// Carries a list of unreachable subpatterns. Used only in the presence of or-patterns.
1596     Useful(Vec<Span>),
1597     /// Carries a list of witnesses of non-exhaustiveness.
1598     UsefulWithWitness(Vec<Witness<'tcx>>),
1599     NotUseful,
1600 }
1601
1602 impl<'tcx> Usefulness<'tcx> {
1603     fn new_useful(preference: WitnessPreference) -> Self {
1604         match preference {
1605             ConstructWitness => UsefulWithWitness(vec![Witness(vec![])]),
1606             LeaveOutWitness => Useful(vec![]),
1607         }
1608     }
1609
1610     fn is_useful(&self) -> bool {
1611         match *self {
1612             NotUseful => false,
1613             _ => true,
1614         }
1615     }
1616
1617     fn apply_constructor<'p>(
1618         self,
1619         cx: &MatchCheckCtxt<'p, 'tcx>,
1620         ctor: &Constructor<'tcx>,
1621         ty: Ty<'tcx>,
1622         ctor_wild_subpatterns: &Fields<'p, 'tcx>,
1623     ) -> Self {
1624         match self {
1625             UsefulWithWitness(witnesses) => UsefulWithWitness(
1626                 witnesses
1627                     .into_iter()
1628                     .map(|witness| witness.apply_constructor(cx, &ctor, ty, ctor_wild_subpatterns))
1629                     .collect(),
1630             ),
1631             x => x,
1632         }
1633     }
1634
1635     fn apply_wildcard(self, ty: Ty<'tcx>) -> Self {
1636         match self {
1637             UsefulWithWitness(witnesses) => {
1638                 let wild = Pat::wildcard_from_ty(ty);
1639                 UsefulWithWitness(
1640                     witnesses
1641                         .into_iter()
1642                         .map(|mut witness| {
1643                             witness.0.push(wild.clone());
1644                             witness
1645                         })
1646                         .collect(),
1647                 )
1648             }
1649             x => x,
1650         }
1651     }
1652
1653     fn apply_missing_ctors(
1654         self,
1655         cx: &MatchCheckCtxt<'_, 'tcx>,
1656         ty: Ty<'tcx>,
1657         missing_ctors: &MissingConstructors<'tcx>,
1658     ) -> Self {
1659         match self {
1660             UsefulWithWitness(witnesses) => {
1661                 let new_patterns: Vec<_> =
1662                     missing_ctors.iter().map(|ctor| ctor.apply_wildcards(cx, ty)).collect();
1663                 // Add the new patterns to each witness
1664                 UsefulWithWitness(
1665                     witnesses
1666                         .into_iter()
1667                         .flat_map(|witness| {
1668                             new_patterns.iter().map(move |pat| {
1669                                 let mut witness = witness.clone();
1670                                 witness.0.push(pat.clone());
1671                                 witness
1672                             })
1673                         })
1674                         .collect(),
1675                 )
1676             }
1677             x => x,
1678         }
1679     }
1680 }
1681
1682 #[derive(Copy, Clone, Debug)]
1683 crate enum WitnessPreference {
1684     ConstructWitness,
1685     LeaveOutWitness,
1686 }
1687
1688 #[derive(Copy, Clone, Debug)]
1689 struct PatCtxt<'tcx> {
1690     ty: Ty<'tcx>,
1691     span: Span,
1692 }
1693
1694 /// A witness of non-exhaustiveness for error reporting, represented
1695 /// as a list of patterns (in reverse order of construction) with
1696 /// wildcards inside to represent elements that can take any inhabitant
1697 /// of the type as a value.
1698 ///
1699 /// A witness against a list of patterns should have the same types
1700 /// and length as the pattern matched against. Because Rust `match`
1701 /// is always against a single pattern, at the end the witness will
1702 /// have length 1, but in the middle of the algorithm, it can contain
1703 /// multiple patterns.
1704 ///
1705 /// For example, if we are constructing a witness for the match against
1706 ///
1707 /// ```
1708 /// struct Pair(Option<(u32, u32)>, bool);
1709 ///
1710 /// match (p: Pair) {
1711 ///    Pair(None, _) => {}
1712 ///    Pair(_, false) => {}
1713 /// }
1714 /// ```
1715 ///
1716 /// We'll perform the following steps:
1717 /// 1. Start with an empty witness
1718 ///     `Witness(vec![])`
1719 /// 2. Push a witness `Some(_)` against the `None`
1720 ///     `Witness(vec![Some(_)])`
1721 /// 3. Push a witness `true` against the `false`
1722 ///     `Witness(vec![Some(_), true])`
1723 /// 4. Apply the `Pair` constructor to the witnesses
1724 ///     `Witness(vec![Pair(Some(_), true)])`
1725 ///
1726 /// The final `Pair(Some(_), true)` is then the resulting witness.
1727 #[derive(Clone, Debug)]
1728 crate struct Witness<'tcx>(Vec<Pat<'tcx>>);
1729
1730 impl<'tcx> Witness<'tcx> {
1731     crate fn single_pattern(self) -> Pat<'tcx> {
1732         assert_eq!(self.0.len(), 1);
1733         self.0.into_iter().next().unwrap()
1734     }
1735
1736     /// Constructs a partial witness for a pattern given a list of
1737     /// patterns expanded by the specialization step.
1738     ///
1739     /// When a pattern P is discovered to be useful, this function is used bottom-up
1740     /// to reconstruct a complete witness, e.g., a pattern P' that covers a subset
1741     /// of values, V, where each value in that set is not covered by any previously
1742     /// used patterns and is covered by the pattern P'. Examples:
1743     ///
1744     /// left_ty: tuple of 3 elements
1745     /// pats: [10, 20, _]           => (10, 20, _)
1746     ///
1747     /// left_ty: struct X { a: (bool, &'static str), b: usize}
1748     /// pats: [(false, "foo"), 42]  => X { a: (false, "foo"), b: 42 }
1749     fn apply_constructor<'p>(
1750         mut self,
1751         cx: &MatchCheckCtxt<'p, 'tcx>,
1752         ctor: &Constructor<'tcx>,
1753         ty: Ty<'tcx>,
1754         ctor_wild_subpatterns: &Fields<'p, 'tcx>,
1755     ) -> Self {
1756         let pat = {
1757             let len = self.0.len();
1758             let arity = ctor_wild_subpatterns.len();
1759             let pats = self.0.drain((len - arity)..).rev();
1760             let fields = ctor_wild_subpatterns.replace_fields(cx, pats);
1761             ctor.apply(cx, ty, fields)
1762         };
1763
1764         self.0.push(pat);
1765
1766         self
1767     }
1768 }
1769
1770 /// This determines the set of all possible constructors of a pattern matching
1771 /// values of type `left_ty`. For vectors, this would normally be an infinite set
1772 /// but is instead bounded by the maximum fixed length of slice patterns in
1773 /// the column of patterns being analyzed.
1774 ///
1775 /// We make sure to omit constructors that are statically impossible. E.g., for
1776 /// `Option<!>`, we do not include `Some(_)` in the returned list of constructors.
1777 /// Invariant: this returns an empty `Vec` if and only if the type is uninhabited (as determined by
1778 /// `cx.is_uninhabited()`).
1779 fn all_constructors<'a, 'tcx>(
1780     cx: &MatchCheckCtxt<'a, 'tcx>,
1781     pcx: PatCtxt<'tcx>,
1782 ) -> Vec<Constructor<'tcx>> {
1783     debug!("all_constructors({:?})", pcx.ty);
1784     let make_range = |start, end| {
1785         IntRange(
1786             // `unwrap()` is ok because we know the type is an integer.
1787             IntRange::from_range(cx.tcx, start, end, pcx.ty, &RangeEnd::Included, pcx.span)
1788                 .unwrap(),
1789         )
1790     };
1791     match *pcx.ty.kind() {
1792         ty::Bool => vec![make_range(0, 1)],
1793         ty::Array(ref sub_ty, len) if len.try_eval_usize(cx.tcx, cx.param_env).is_some() => {
1794             let len = len.eval_usize(cx.tcx, cx.param_env);
1795             if len != 0 && cx.is_uninhabited(sub_ty) {
1796                 vec![]
1797             } else {
1798                 vec![Slice(Slice { array_len: Some(len), kind: VarLen(0, 0) })]
1799             }
1800         }
1801         // Treat arrays of a constant but unknown length like slices.
1802         ty::Array(ref sub_ty, _) | ty::Slice(ref sub_ty) => {
1803             let kind = if cx.is_uninhabited(sub_ty) { FixedLen(0) } else { VarLen(0, 0) };
1804             vec![Slice(Slice { array_len: None, kind })]
1805         }
1806         ty::Adt(def, substs) if def.is_enum() => {
1807             let ctors: Vec<_> = if cx.tcx.features().exhaustive_patterns {
1808                 // If `exhaustive_patterns` is enabled, we exclude variants known to be
1809                 // uninhabited.
1810                 def.variants
1811                     .iter()
1812                     .filter(|v| {
1813                         !v.uninhabited_from(cx.tcx, substs, def.adt_kind(), cx.param_env)
1814                             .contains(cx.tcx, cx.module)
1815                     })
1816                     .map(|v| Variant(v.def_id))
1817                     .collect()
1818             } else {
1819                 def.variants.iter().map(|v| Variant(v.def_id)).collect()
1820             };
1821
1822             // If the enum is declared as `#[non_exhaustive]`, we treat it as if it had an
1823             // additional "unknown" constructor.
1824             // There is no point in enumerating all possible variants, because the user can't
1825             // actually match against them all themselves. So we always return only the fictitious
1826             // constructor.
1827             // E.g., in an example like:
1828             //
1829             // ```
1830             //     let err: io::ErrorKind = ...;
1831             //     match err {
1832             //         io::ErrorKind::NotFound => {},
1833             //     }
1834             // ```
1835             //
1836             // we don't want to show every possible IO error, but instead have only `_` as the
1837             // witness.
1838             let is_declared_nonexhaustive = cx.is_foreign_non_exhaustive_enum(pcx.ty);
1839
1840             // If `exhaustive_patterns` is disabled and our scrutinee is an empty enum, we treat it
1841             // as though it had an "unknown" constructor to avoid exposing its emptyness. Note that
1842             // an empty match will still be considered exhaustive because that case is handled
1843             // separately in `check_match`.
1844             let is_secretly_empty =
1845                 def.variants.is_empty() && !cx.tcx.features().exhaustive_patterns;
1846
1847             if is_secretly_empty || is_declared_nonexhaustive { vec![NonExhaustive] } else { ctors }
1848         }
1849         ty::Char => {
1850             vec![
1851                 // The valid Unicode Scalar Value ranges.
1852                 make_range('\u{0000}' as u128, '\u{D7FF}' as u128),
1853                 make_range('\u{E000}' as u128, '\u{10FFFF}' as u128),
1854             ]
1855         }
1856         ty::Int(_) | ty::Uint(_)
1857             if pcx.ty.is_ptr_sized_integral()
1858                 && !cx.tcx.features().precise_pointer_size_matching =>
1859         {
1860             // `usize`/`isize` are not allowed to be matched exhaustively unless the
1861             // `precise_pointer_size_matching` feature is enabled. So we treat those types like
1862             // `#[non_exhaustive]` enums by returning a special unmatcheable constructor.
1863             vec![NonExhaustive]
1864         }
1865         ty::Int(ity) => {
1866             let bits = Integer::from_attr(&cx.tcx, SignedInt(ity)).size().bits() as u128;
1867             let min = 1u128 << (bits - 1);
1868             let max = min - 1;
1869             vec![make_range(min, max)]
1870         }
1871         ty::Uint(uty) => {
1872             let size = Integer::from_attr(&cx.tcx, UnsignedInt(uty)).size();
1873             let max = truncate(u128::MAX, size);
1874             vec![make_range(0, max)]
1875         }
1876         _ => {
1877             if cx.is_uninhabited(pcx.ty) {
1878                 vec![]
1879             } else {
1880                 vec![Single]
1881             }
1882         }
1883     }
1884 }
1885
1886 /// An inclusive interval, used for precise integer exhaustiveness checking.
1887 /// `IntRange`s always store a contiguous range. This means that values are
1888 /// encoded such that `0` encodes the minimum value for the integer,
1889 /// regardless of the signedness.
1890 /// For example, the pattern `-128..=127i8` is encoded as `0..=255`.
1891 /// This makes comparisons and arithmetic on interval endpoints much more
1892 /// straightforward. See `signed_bias` for details.
1893 ///
1894 /// `IntRange` is never used to encode an empty range or a "range" that wraps
1895 /// around the (offset) space: i.e., `range.lo <= range.hi`.
1896 #[derive(Clone, Debug)]
1897 struct IntRange<'tcx> {
1898     range: RangeInclusive<u128>,
1899     ty: Ty<'tcx>,
1900     span: Span,
1901 }
1902
1903 impl<'tcx> IntRange<'tcx> {
1904     #[inline]
1905     fn is_integral(ty: Ty<'_>) -> bool {
1906         match ty.kind() {
1907             ty::Char | ty::Int(_) | ty::Uint(_) | ty::Bool => true,
1908             _ => false,
1909         }
1910     }
1911
1912     fn is_singleton(&self) -> bool {
1913         self.range.start() == self.range.end()
1914     }
1915
1916     fn boundaries(&self) -> (u128, u128) {
1917         (*self.range.start(), *self.range.end())
1918     }
1919
1920     /// Don't treat `usize`/`isize` exhaustively unless the `precise_pointer_size_matching` feature
1921     /// is enabled.
1922     fn treat_exhaustively(&self, tcx: TyCtxt<'tcx>) -> bool {
1923         !self.ty.is_ptr_sized_integral() || tcx.features().precise_pointer_size_matching
1924     }
1925
1926     #[inline]
1927     fn integral_size_and_signed_bias(tcx: TyCtxt<'tcx>, ty: Ty<'_>) -> Option<(Size, u128)> {
1928         match *ty.kind() {
1929             ty::Bool => Some((Size::from_bytes(1), 0)),
1930             ty::Char => Some((Size::from_bytes(4), 0)),
1931             ty::Int(ity) => {
1932                 let size = Integer::from_attr(&tcx, SignedInt(ity)).size();
1933                 Some((size, 1u128 << (size.bits() as u128 - 1)))
1934             }
1935             ty::Uint(uty) => Some((Integer::from_attr(&tcx, UnsignedInt(uty)).size(), 0)),
1936             _ => None,
1937         }
1938     }
1939
1940     #[inline]
1941     fn from_const(
1942         tcx: TyCtxt<'tcx>,
1943         param_env: ty::ParamEnv<'tcx>,
1944         value: &Const<'tcx>,
1945         span: Span,
1946     ) -> Option<IntRange<'tcx>> {
1947         if let Some((target_size, bias)) = Self::integral_size_and_signed_bias(tcx, value.ty) {
1948             let ty = value.ty;
1949             let val = (|| {
1950                 if let ty::ConstKind::Value(ConstValue::Scalar(scalar)) = value.val {
1951                     // For this specific pattern we can skip a lot of effort and go
1952                     // straight to the result, after doing a bit of checking. (We
1953                     // could remove this branch and just fall through, which
1954                     // is more general but much slower.)
1955                     if let Ok(bits) = scalar.to_bits_or_ptr(target_size, &tcx) {
1956                         return Some(bits);
1957                     }
1958                 }
1959                 // This is a more general form of the previous case.
1960                 value.try_eval_bits(tcx, param_env, ty)
1961             })()?;
1962             let val = val ^ bias;
1963             Some(IntRange { range: val..=val, ty, span })
1964         } else {
1965             None
1966         }
1967     }
1968
1969     #[inline]
1970     fn from_range(
1971         tcx: TyCtxt<'tcx>,
1972         lo: u128,
1973         hi: u128,
1974         ty: Ty<'tcx>,
1975         end: &RangeEnd,
1976         span: Span,
1977     ) -> Option<IntRange<'tcx>> {
1978         if Self::is_integral(ty) {
1979             // Perform a shift if the underlying types are signed,
1980             // which makes the interval arithmetic simpler.
1981             let bias = IntRange::signed_bias(tcx, ty);
1982             let (lo, hi) = (lo ^ bias, hi ^ bias);
1983             let offset = (*end == RangeEnd::Excluded) as u128;
1984             if lo > hi || (lo == hi && *end == RangeEnd::Excluded) {
1985                 // This should have been caught earlier by E0030.
1986                 bug!("malformed range pattern: {}..={}", lo, (hi - offset));
1987             }
1988             Some(IntRange { range: lo..=(hi - offset), ty, span })
1989         } else {
1990             None
1991         }
1992     }
1993
1994     fn from_pat(
1995         tcx: TyCtxt<'tcx>,
1996         param_env: ty::ParamEnv<'tcx>,
1997         pat: &Pat<'tcx>,
1998     ) -> Option<IntRange<'tcx>> {
1999         // This MUST be kept in sync with `pat_constructor`.
2000         match *pat.kind {
2001             PatKind::Constant { value } => Self::from_const(tcx, param_env, value, pat.span),
2002             PatKind::Range(PatRange { lo, hi, end }) => {
2003                 let ty = lo.ty;
2004                 Self::from_range(
2005                     tcx,
2006                     lo.eval_bits(tcx, param_env, lo.ty),
2007                     hi.eval_bits(tcx, param_env, hi.ty),
2008                     ty,
2009                     &end,
2010                     pat.span,
2011                 )
2012             }
2013             _ => None,
2014         }
2015     }
2016
2017     // The return value of `signed_bias` should be XORed with an endpoint to encode/decode it.
2018     fn signed_bias(tcx: TyCtxt<'tcx>, ty: Ty<'tcx>) -> u128 {
2019         match *ty.kind() {
2020             ty::Int(ity) => {
2021                 let bits = Integer::from_attr(&tcx, SignedInt(ity)).size().bits() as u128;
2022                 1u128 << (bits - 1)
2023             }
2024             _ => 0,
2025         }
2026     }
2027
2028     /// Returns a collection of ranges that spans the values covered by `ranges`, subtracted
2029     /// by the values covered by `self`: i.e., `ranges \ self` (in set notation).
2030     fn subtract_from(&self, ranges: Vec<IntRange<'tcx>>) -> Vec<IntRange<'tcx>> {
2031         let mut remaining_ranges = vec![];
2032         let ty = self.ty;
2033         let span = self.span;
2034         let (lo, hi) = self.boundaries();
2035         for subrange in ranges {
2036             let (subrange_lo, subrange_hi) = subrange.range.into_inner();
2037             if lo > subrange_hi || subrange_lo > hi {
2038                 // The pattern doesn't intersect with the subrange at all,
2039                 // so the subrange remains untouched.
2040                 remaining_ranges.push(IntRange { range: subrange_lo..=subrange_hi, ty, span });
2041             } else {
2042                 if lo > subrange_lo {
2043                     // The pattern intersects an upper section of the
2044                     // subrange, so a lower section will remain.
2045                     remaining_ranges.push(IntRange { range: subrange_lo..=(lo - 1), ty, span });
2046                 }
2047                 if hi < subrange_hi {
2048                     // The pattern intersects a lower section of the
2049                     // subrange, so an upper section will remain.
2050                     remaining_ranges.push(IntRange { range: (hi + 1)..=subrange_hi, ty, span });
2051                 }
2052             }
2053         }
2054         remaining_ranges
2055     }
2056
2057     fn is_subrange(&self, other: &Self) -> bool {
2058         other.range.start() <= self.range.start() && self.range.end() <= other.range.end()
2059     }
2060
2061     fn intersection(&self, tcx: TyCtxt<'tcx>, other: &Self) -> Option<Self> {
2062         let ty = self.ty;
2063         let (lo, hi) = self.boundaries();
2064         let (other_lo, other_hi) = other.boundaries();
2065         if self.treat_exhaustively(tcx) {
2066             if lo <= other_hi && other_lo <= hi {
2067                 let span = other.span;
2068                 Some(IntRange { range: max(lo, other_lo)..=min(hi, other_hi), ty, span })
2069             } else {
2070                 None
2071             }
2072         } else {
2073             // If the range should not be treated exhaustively, fallback to checking for inclusion.
2074             if self.is_subrange(other) { Some(self.clone()) } else { None }
2075         }
2076     }
2077
2078     fn suspicious_intersection(&self, other: &Self) -> bool {
2079         // `false` in the following cases:
2080         // 1     ----      // 1  ----------   // 1 ----        // 1       ----
2081         // 2  ----------   // 2     ----      // 2       ----  // 2 ----
2082         //
2083         // The following are currently `false`, but could be `true` in the future (#64007):
2084         // 1 ---------       // 1     ---------
2085         // 2     ----------  // 2 ----------
2086         //
2087         // `true` in the following cases:
2088         // 1 -------          // 1       -------
2089         // 2       --------   // 2 -------
2090         let (lo, hi) = self.boundaries();
2091         let (other_lo, other_hi) = other.boundaries();
2092         lo == other_hi || hi == other_lo
2093     }
2094
2095     fn to_pat(&self, tcx: TyCtxt<'tcx>) -> Pat<'tcx> {
2096         let (lo, hi) = self.boundaries();
2097
2098         let bias = IntRange::signed_bias(tcx, self.ty);
2099         let (lo, hi) = (lo ^ bias, hi ^ bias);
2100
2101         let ty = ty::ParamEnv::empty().and(self.ty);
2102         let lo_const = ty::Const::from_bits(tcx, lo, ty);
2103         let hi_const = ty::Const::from_bits(tcx, hi, ty);
2104
2105         let kind = if lo == hi {
2106             PatKind::Constant { value: lo_const }
2107         } else {
2108             PatKind::Range(PatRange { lo: lo_const, hi: hi_const, end: RangeEnd::Included })
2109         };
2110
2111         // This is a brand new pattern, so we don't reuse `self.span`.
2112         Pat { ty: self.ty, span: DUMMY_SP, kind: Box::new(kind) }
2113     }
2114
2115     /// For exhaustive integer matching, some constructors are grouped within other constructors
2116     /// (namely integer typed values are grouped within ranges). However, when specialising these
2117     /// constructors, we want to be specialising for the underlying constructors (the integers), not
2118     /// the groups (the ranges). Thus we need to split the groups up. Splitting them up naïvely would
2119     /// mean creating a separate constructor for every single value in the range, which is clearly
2120     /// impractical. However, observe that for some ranges of integers, the specialisation will be
2121     /// identical across all values in that range (i.e., there are equivalence classes of ranges of
2122     /// constructors based on their `U(S(c, P), S(c, p))` outcome). These classes are grouped by
2123     /// the patterns that apply to them (in the matrix `P`). We can split the range whenever the
2124     /// patterns that apply to that range (specifically: the patterns that *intersect* with that range)
2125     /// change.
2126     /// Our solution, therefore, is to split the range constructor into subranges at every single point
2127     /// the group of intersecting patterns changes (using the method described below).
2128     /// And voilà! We're testing precisely those ranges that we need to, without any exhaustive matching
2129     /// on actual integers. The nice thing about this is that the number of subranges is linear in the
2130     /// number of rows in the matrix (i.e., the number of cases in the `match` statement), so we don't
2131     /// need to be worried about matching over gargantuan ranges.
2132     ///
2133     /// Essentially, given the first column of a matrix representing ranges, looking like the following:
2134     ///
2135     /// |------|  |----------| |-------|    ||
2136     ///    |-------| |-------|            |----| ||
2137     ///       |---------|
2138     ///
2139     /// We split the ranges up into equivalence classes so the ranges are no longer overlapping:
2140     ///
2141     /// |--|--|||-||||--||---|||-------|  |-|||| ||
2142     ///
2143     /// The logic for determining how to split the ranges is fairly straightforward: we calculate
2144     /// boundaries for each interval range, sort them, then create constructors for each new interval
2145     /// between every pair of boundary points. (This essentially sums up to performing the intuitive
2146     /// merging operation depicted above.)
2147     fn split<'p>(
2148         self,
2149         cx: &MatchCheckCtxt<'p, 'tcx>,
2150         pcx: PatCtxt<'tcx>,
2151         matrix: &Matrix<'p, 'tcx>,
2152         hir_id: Option<HirId>,
2153     ) -> SmallVec<[Constructor<'tcx>; 1]> {
2154         let ty = pcx.ty;
2155
2156         /// Represents a border between 2 integers. Because the intervals spanning borders
2157         /// must be able to cover every integer, we need to be able to represent
2158         /// 2^128 + 1 such borders.
2159         #[derive(Clone, Copy, PartialEq, Eq, PartialOrd, Ord, Debug)]
2160         enum Border {
2161             JustBefore(u128),
2162             AfterMax,
2163         }
2164
2165         // A function for extracting the borders of an integer interval.
2166         fn range_borders(r: IntRange<'_>) -> impl Iterator<Item = Border> {
2167             let (lo, hi) = r.range.into_inner();
2168             let from = Border::JustBefore(lo);
2169             let to = match hi.checked_add(1) {
2170                 Some(m) => Border::JustBefore(m),
2171                 None => Border::AfterMax,
2172             };
2173             vec![from, to].into_iter()
2174         }
2175
2176         // Collect the span and range of all the intersecting ranges to lint on likely
2177         // incorrect range patterns. (#63987)
2178         let mut overlaps = vec![];
2179         // `borders` is the set of borders between equivalence classes: each equivalence
2180         // class lies between 2 borders.
2181         let row_borders = matrix
2182             .patterns
2183             .iter()
2184             .flat_map(|row| {
2185                 IntRange::from_pat(cx.tcx, cx.param_env, row.head()).map(|r| (r, row.len()))
2186             })
2187             .flat_map(|(range, row_len)| {
2188                 let intersection = self.intersection(cx.tcx, &range);
2189                 let should_lint = self.suspicious_intersection(&range);
2190                 if let (Some(range), 1, true) = (&intersection, row_len, should_lint) {
2191                     // FIXME: for now, only check for overlapping ranges on simple range
2192                     // patterns. Otherwise with the current logic the following is detected
2193                     // as overlapping:
2194                     //   match (10u8, true) {
2195                     //    (0 ..= 125, false) => {}
2196                     //    (126 ..= 255, false) => {}
2197                     //    (0 ..= 255, true) => {}
2198                     //  }
2199                     overlaps.push(range.clone());
2200                 }
2201                 intersection
2202             })
2203             .flat_map(range_borders);
2204         let self_borders = range_borders(self.clone());
2205         let mut borders: Vec<_> = row_borders.chain(self_borders).collect();
2206         borders.sort_unstable();
2207
2208         self.lint_overlapping_patterns(cx.tcx, hir_id, ty, overlaps);
2209
2210         // We're going to iterate through every adjacent pair of borders, making sure that
2211         // each represents an interval of nonnegative length, and convert each such
2212         // interval into a constructor.
2213         borders
2214             .array_windows()
2215             .filter_map(|&pair| match pair {
2216                 [Border::JustBefore(n), Border::JustBefore(m)] => {
2217                     if n < m {
2218                         Some(n..=(m - 1))
2219                     } else {
2220                         None
2221                     }
2222                 }
2223                 [Border::JustBefore(n), Border::AfterMax] => Some(n..=u128::MAX),
2224                 [Border::AfterMax, _] => None,
2225             })
2226             .map(|range| IntRange { range, ty, span: pcx.span })
2227             .map(IntRange)
2228             .collect()
2229     }
2230
2231     fn lint_overlapping_patterns(
2232         self,
2233         tcx: TyCtxt<'tcx>,
2234         hir_id: Option<HirId>,
2235         ty: Ty<'tcx>,
2236         overlaps: Vec<IntRange<'tcx>>,
2237     ) {
2238         if let (true, Some(hir_id)) = (!overlaps.is_empty(), hir_id) {
2239             tcx.struct_span_lint_hir(
2240                 lint::builtin::OVERLAPPING_PATTERNS,
2241                 hir_id,
2242                 self.span,
2243                 |lint| {
2244                     let mut err = lint.build("multiple patterns covering the same range");
2245                     err.span_label(self.span, "overlapping patterns");
2246                     for int_range in overlaps {
2247                         // Use the real type for user display of the ranges:
2248                         err.span_label(
2249                             int_range.span,
2250                             &format!(
2251                                 "this range overlaps on `{}`",
2252                                 IntRange { range: int_range.range, ty, span: DUMMY_SP }.to_pat(tcx),
2253                             ),
2254                         );
2255                     }
2256                     err.emit();
2257                 },
2258             );
2259         }
2260     }
2261 }
2262
2263 /// Ignore spans when comparing, they don't carry semantic information as they are only for lints.
2264 impl<'tcx> std::cmp::PartialEq for IntRange<'tcx> {
2265     fn eq(&self, other: &Self) -> bool {
2266         self.range == other.range && self.ty == other.ty
2267     }
2268 }
2269
2270 // A struct to compute a set of constructors equivalent to `all_ctors \ used_ctors`.
2271 struct MissingConstructors<'tcx> {
2272     all_ctors: Vec<Constructor<'tcx>>,
2273     used_ctors: Vec<Constructor<'tcx>>,
2274 }
2275
2276 impl<'tcx> MissingConstructors<'tcx> {
2277     fn new(all_ctors: Vec<Constructor<'tcx>>, used_ctors: Vec<Constructor<'tcx>>) -> Self {
2278         MissingConstructors { all_ctors, used_ctors }
2279     }
2280
2281     fn into_inner(self) -> (Vec<Constructor<'tcx>>, Vec<Constructor<'tcx>>) {
2282         (self.all_ctors, self.used_ctors)
2283     }
2284
2285     fn is_empty(&self) -> bool {
2286         self.iter().next().is_none()
2287     }
2288     /// Whether this contains all the constructors for the given type or only a
2289     /// subset.
2290     fn all_ctors_are_missing(&self) -> bool {
2291         self.used_ctors.is_empty()
2292     }
2293
2294     /// Iterate over all_ctors \ used_ctors
2295     fn iter<'a>(&'a self) -> impl Iterator<Item = Constructor<'tcx>> + Captures<'a> {
2296         self.all_ctors.iter().flat_map(move |req_ctor| req_ctor.subtract_ctors(&self.used_ctors))
2297     }
2298 }
2299
2300 impl<'tcx> fmt::Debug for MissingConstructors<'tcx> {
2301     fn fmt(&self, f: &mut fmt::Formatter<'_>) -> fmt::Result {
2302         let ctors: Vec<_> = self.iter().collect();
2303         write!(f, "{:?}", ctors)
2304     }
2305 }
2306
2307 /// Algorithm from http://moscova.inria.fr/~maranget/papers/warn/index.html.
2308 /// The algorithm from the paper has been modified to correctly handle empty
2309 /// types. The changes are:
2310 ///   (0) We don't exit early if the pattern matrix has zero rows. We just
2311 ///       continue to recurse over columns.
2312 ///   (1) all_constructors will only return constructors that are statically
2313 ///       possible. E.g., it will only return `Ok` for `Result<T, !>`.
2314 ///
2315 /// This finds whether a (row) vector `v` of patterns is 'useful' in relation
2316 /// to a set of such vectors `m` - this is defined as there being a set of
2317 /// inputs that will match `v` but not any of the sets in `m`.
2318 ///
2319 /// All the patterns at each column of the `matrix ++ v` matrix must have the same type.
2320 ///
2321 /// This is used both for reachability checking (if a pattern isn't useful in
2322 /// relation to preceding patterns, it is not reachable) and exhaustiveness
2323 /// checking (if a wildcard pattern is useful in relation to a matrix, the
2324 /// matrix isn't exhaustive).
2325 ///
2326 /// `is_under_guard` is used to inform if the pattern has a guard. If it
2327 /// has one it must not be inserted into the matrix. This shouldn't be
2328 /// relied on for soundness.
2329 crate fn is_useful<'p, 'tcx>(
2330     cx: &MatchCheckCtxt<'p, 'tcx>,
2331     matrix: &Matrix<'p, 'tcx>,
2332     v: &PatStack<'p, 'tcx>,
2333     witness_preference: WitnessPreference,
2334     hir_id: HirId,
2335     is_under_guard: bool,
2336     is_top_level: bool,
2337 ) -> Usefulness<'tcx> {
2338     let Matrix { patterns: rows, .. } = matrix;
2339     debug!("is_useful({:#?}, {:#?})", matrix, v);
2340
2341     // The base case. We are pattern-matching on () and the return value is
2342     // based on whether our matrix has a row or not.
2343     // NOTE: This could potentially be optimized by checking rows.is_empty()
2344     // first and then, if v is non-empty, the return value is based on whether
2345     // the type of the tuple we're checking is inhabited or not.
2346     if v.is_empty() {
2347         return if rows.is_empty() {
2348             Usefulness::new_useful(witness_preference)
2349         } else {
2350             NotUseful
2351         };
2352     };
2353
2354     assert!(rows.iter().all(|r| r.len() == v.len()));
2355
2356     // If the first pattern is an or-pattern, expand it.
2357     if let Some(vs) = v.expand_or_pat() {
2358         // We need to push the already-seen patterns into the matrix in order to detect redundant
2359         // branches like `Some(_) | Some(0)`. We also keep track of the unreachable subpatterns.
2360         let mut matrix = matrix.clone();
2361         // `Vec` of all the unreachable branches of the current or-pattern.
2362         let mut unreachable_branches = Vec::new();
2363         // Subpatterns that are unreachable from all branches. E.g. in the following case, the last
2364         // `true` is unreachable only from one branch, so it is overall reachable.
2365         //
2366         // ```
2367         // match (true, true) {
2368         //     (true, true) => {}
2369         //     (false | true, false | true) => {}
2370         // }
2371         // ```
2372         let mut unreachable_subpats = FxHashSet::default();
2373         // Whether any branch at all is useful.
2374         let mut any_is_useful = false;
2375
2376         for v in vs {
2377             let res = is_useful(cx, &matrix, &v, witness_preference, hir_id, is_under_guard, false);
2378             match res {
2379                 Useful(pats) => {
2380                     if !any_is_useful {
2381                         any_is_useful = true;
2382                         // Initialize with the first set of unreachable subpatterns encountered.
2383                         unreachable_subpats = pats.into_iter().collect();
2384                     } else {
2385                         // Keep the patterns unreachable from both this and previous branches.
2386                         unreachable_subpats =
2387                             pats.into_iter().filter(|p| unreachable_subpats.contains(p)).collect();
2388                     }
2389                 }
2390                 NotUseful => unreachable_branches.push(v.head().span),
2391                 UsefulWithWitness(_) => {
2392                     bug!("Encountered or-pat in `v` during exhaustiveness checking")
2393                 }
2394             }
2395             // If pattern has a guard don't add it to the matrix
2396             if !is_under_guard {
2397                 matrix.push(v);
2398             }
2399         }
2400         if any_is_useful {
2401             // Collect all the unreachable patterns.
2402             unreachable_branches.extend(unreachable_subpats);
2403             return Useful(unreachable_branches);
2404         } else {
2405             return NotUseful;
2406         }
2407     }
2408
2409     // FIXME(Nadrieril): Hack to work around type normalization issues (see #72476).
2410     let ty = matrix.heads().next().map(|r| r.ty).unwrap_or(v.head().ty);
2411     let pcx = PatCtxt { ty, span: v.head().span };
2412
2413     debug!("is_useful_expand_first_col: pcx={:#?}, expanding {:#?}", pcx, v.head());
2414
2415     let constructor = pat_constructor(cx.tcx, cx.param_env, v.head());
2416     let ret = if !constructor.is_wildcard() {
2417         debug!("is_useful - expanding constructor: {:#?}", constructor);
2418         constructor
2419             .split(cx, pcx, matrix, Some(hir_id))
2420             .into_iter()
2421             .map(|c| {
2422                 is_useful_specialized(
2423                     cx,
2424                     matrix,
2425                     v,
2426                     c,
2427                     pcx.ty,
2428                     witness_preference,
2429                     hir_id,
2430                     is_under_guard,
2431                 )
2432             })
2433             .find(|result| result.is_useful())
2434             .unwrap_or(NotUseful)
2435     } else {
2436         debug!("is_useful - expanding wildcard");
2437
2438         let used_ctors: Vec<Constructor<'_>> = matrix
2439             .heads()
2440             .map(|p| pat_constructor(cx.tcx, cx.param_env, p))
2441             .filter(|c| !c.is_wildcard())
2442             .collect();
2443         debug!("is_useful_used_ctors = {:#?}", used_ctors);
2444         // `all_ctors` are all the constructors for the given type, which
2445         // should all be represented (or caught with the wild pattern `_`).
2446         let all_ctors = all_constructors(cx, pcx);
2447         debug!("is_useful_all_ctors = {:#?}", all_ctors);
2448
2449         // `missing_ctors` is the set of constructors from the same type as the
2450         // first column of `matrix` that are matched only by wildcard patterns
2451         // from the first column.
2452         //
2453         // Therefore, if there is some pattern that is unmatched by `matrix`,
2454         // it will still be unmatched if the first constructor is replaced by
2455         // any of the constructors in `missing_ctors`
2456
2457         // Missing constructors are those that are not matched by any non-wildcard patterns in the
2458         // current column. We only fully construct them on-demand, because they're rarely used and
2459         // can be big.
2460         let missing_ctors = MissingConstructors::new(all_ctors, used_ctors);
2461
2462         debug!("is_useful_missing_ctors.empty()={:#?}", missing_ctors.is_empty(),);
2463
2464         if missing_ctors.is_empty() {
2465             let (all_ctors, _) = missing_ctors.into_inner();
2466             all_ctors
2467                 .into_iter()
2468                 .flat_map(|ctor| ctor.split(cx, pcx, matrix, None))
2469                 .map(|c| {
2470                     is_useful_specialized(
2471                         cx,
2472                         matrix,
2473                         v,
2474                         c,
2475                         pcx.ty,
2476                         witness_preference,
2477                         hir_id,
2478                         is_under_guard,
2479                     )
2480                 })
2481                 .find(|result| result.is_useful())
2482                 .unwrap_or(NotUseful)
2483         } else {
2484             let ctor_wild_subpatterns = Fields::empty();
2485             let matrix = matrix.specialize_constructor(cx, &constructor, &ctor_wild_subpatterns);
2486             // Unwrap is ok: v can always be specialized with its own constructor.
2487             let v =
2488                 v.specialize_constructor(cx, &constructor, &ctor_wild_subpatterns, true).unwrap();
2489             let usefulness =
2490                 is_useful(cx, &matrix, &v, witness_preference, hir_id, is_under_guard, false);
2491
2492             // In this case, there's at least one "free"
2493             // constructor that is only matched against by
2494             // wildcard patterns.
2495             //
2496             // There are 2 ways we can report a witness here.
2497             // Commonly, we can report all the "free"
2498             // constructors as witnesses, e.g., if we have:
2499             //
2500             // ```
2501             //     enum Direction { N, S, E, W }
2502             //     let Direction::N = ...;
2503             // ```
2504             //
2505             // we can report 3 witnesses: `S`, `E`, and `W`.
2506             //
2507             // However, there is a case where we don't want
2508             // to do this and instead report a single `_` witness:
2509             // if the user didn't actually specify a constructor
2510             // in this arm, e.g., in
2511             //
2512             // ```
2513             //     let x: (Direction, Direction, bool) = ...;
2514             //     let (_, _, false) = x;
2515             // ```
2516             //
2517             // we don't want to show all 16 possible witnesses
2518             // `(<direction-1>, <direction-2>, true)` - we are
2519             // satisfied with `(_, _, true)`. In this case,
2520             // `used_ctors` is empty.
2521             // The exception is: if we are at the top-level, for example in an empty match, we
2522             // sometimes prefer reporting the list of constructors instead of just `_`.
2523             let report_ctors_rather_than_wildcard = is_top_level && !IntRange::is_integral(pcx.ty);
2524             if missing_ctors.all_ctors_are_missing() && !report_ctors_rather_than_wildcard {
2525                 // All constructors are unused. Add a wild pattern
2526                 // rather than each individual constructor.
2527                 usefulness.apply_wildcard(pcx.ty)
2528             } else {
2529                 // Construct for each missing constructor a "wild" version of this
2530                 // constructor, that matches everything that can be built with
2531                 // it. For example, if `ctor` is a `Constructor::Variant` for
2532                 // `Option::Some`, we get the pattern `Some(_)`.
2533                 usefulness.apply_missing_ctors(cx, pcx.ty, &missing_ctors)
2534             }
2535         }
2536     };
2537     debug!("is_useful::returns({:#?}, {:#?}) = {:?}", matrix, v, ret);
2538     ret
2539 }
2540
2541 /// A shorthand for the `U(S(c, P), S(c, q))` operation from the paper. I.e., `is_useful` applied
2542 /// to the specialised version of both the pattern matrix `P` and the new pattern `q`.
2543 fn is_useful_specialized<'p, 'tcx>(
2544     cx: &MatchCheckCtxt<'p, 'tcx>,
2545     matrix: &Matrix<'p, 'tcx>,
2546     v: &PatStack<'p, 'tcx>,
2547     ctor: Constructor<'tcx>,
2548     ty: Ty<'tcx>,
2549     witness_preference: WitnessPreference,
2550     hir_id: HirId,
2551     is_under_guard: bool,
2552 ) -> Usefulness<'tcx> {
2553     debug!("is_useful_specialized({:#?}, {:#?}, {:?})", v, ctor, ty);
2554
2555     // We cache the result of `Fields::wildcards` because it is used a lot.
2556     let ctor_wild_subpatterns = Fields::wildcards(cx, &ctor, ty);
2557     let matrix = matrix.specialize_constructor(cx, &ctor, &ctor_wild_subpatterns);
2558     v.specialize_constructor(cx, &ctor, &ctor_wild_subpatterns, true)
2559         .map(|v| is_useful(cx, &matrix, &v, witness_preference, hir_id, is_under_guard, false))
2560         .map(|u| u.apply_constructor(cx, &ctor, ty, &ctor_wild_subpatterns))
2561         .unwrap_or(NotUseful)
2562 }
2563
2564 /// Determines the constructor that the given pattern can be specialized to.
2565 /// Returns `None` in case of a catch-all, which can't be specialized.
2566 fn pat_constructor<'tcx>(
2567     tcx: TyCtxt<'tcx>,
2568     param_env: ty::ParamEnv<'tcx>,
2569     pat: &Pat<'tcx>,
2570 ) -> Constructor<'tcx> {
2571     // This MUST be kept in sync with `IntRange::from_pat`.
2572     match *pat.kind {
2573         PatKind::AscribeUserType { .. } => bug!(), // Handled by `expand_pattern`
2574         PatKind::Binding { .. } | PatKind::Wild => Wildcard,
2575         PatKind::Leaf { .. } | PatKind::Deref { .. } => Single,
2576         PatKind::Variant { adt_def, variant_index, .. } => {
2577             Variant(adt_def.variants[variant_index].def_id)
2578         }
2579         PatKind::Constant { value } => {
2580             if let Some(int_range) = IntRange::from_const(tcx, param_env, value, pat.span) {
2581                 IntRange(int_range)
2582             } else {
2583                 match value.ty.kind() {
2584                     ty::Float(_) => FloatRange(value, value, RangeEnd::Included),
2585                     ty::Ref(_, t, _) if t.is_str() => Str(value),
2586                     // All constants that can be structurally matched have already been expanded
2587                     // into the corresponding `Pat`s by `const_to_pat`. Constants that remain are
2588                     // opaque.
2589                     _ => Opaque,
2590                 }
2591             }
2592         }
2593         PatKind::Range(PatRange { lo, hi, end }) => {
2594             let ty = lo.ty;
2595             if let Some(int_range) = IntRange::from_range(
2596                 tcx,
2597                 lo.eval_bits(tcx, param_env, lo.ty),
2598                 hi.eval_bits(tcx, param_env, hi.ty),
2599                 ty,
2600                 &end,
2601                 pat.span,
2602             ) {
2603                 IntRange(int_range)
2604             } else {
2605                 FloatRange(lo, hi, end)
2606             }
2607         }
2608         PatKind::Array { ref prefix, ref slice, ref suffix }
2609         | PatKind::Slice { ref prefix, ref slice, ref suffix } => {
2610             let array_len = match pat.ty.kind() {
2611                 ty::Array(_, length) => Some(length.eval_usize(tcx, param_env)),
2612                 ty::Slice(_) => None,
2613                 _ => span_bug!(pat.span, "bad ty {:?} for slice pattern", pat.ty),
2614             };
2615             let prefix = prefix.len() as u64;
2616             let suffix = suffix.len() as u64;
2617             let kind =
2618                 if slice.is_some() { VarLen(prefix, suffix) } else { FixedLen(prefix + suffix) };
2619             Slice(Slice { array_len, kind })
2620         }
2621         PatKind::Or { .. } => bug!("Or-pattern should have been expanded earlier on."),
2622     }
2623 }