]> git.lizzy.rs Git - rust.git/blob - library/alloc/src/raw_vec.rs
Auto merge of #77502 - varkor:const-generics-suggest-enclosing-braces, r=petrochenkov
[rust.git] / library / alloc / src / raw_vec.rs
1 #![unstable(feature = "raw_vec_internals", reason = "implementation detail", issue = "none")]
2 #![doc(hidden)]
3
4 use core::alloc::LayoutErr;
5 use core::cmp;
6 use core::intrinsics;
7 use core::mem::{self, ManuallyDrop, MaybeUninit};
8 use core::ops::Drop;
9 use core::ptr::{self, NonNull, Unique};
10 use core::slice;
11
12 use crate::alloc::{handle_alloc_error, AllocRef, Global, Layout};
13 use crate::boxed::Box;
14 use crate::collections::TryReserveError::{self, *};
15
16 #[cfg(test)]
17 mod tests;
18
19 enum AllocInit {
20     /// The contents of the new memory are uninitialized.
21     Uninitialized,
22     /// The new memory is guaranteed to be zeroed.
23     Zeroed,
24 }
25
26 /// A low-level utility for more ergonomically allocating, reallocating, and deallocating
27 /// a buffer of memory on the heap without having to worry about all the corner cases
28 /// involved. This type is excellent for building your own data structures like Vec and VecDeque.
29 /// In particular:
30 ///
31 /// * Produces `Unique::dangling()` on zero-sized types.
32 /// * Produces `Unique::dangling()` on zero-length allocations.
33 /// * Avoids freeing `Unique::dangling()`.
34 /// * Catches all overflows in capacity computations (promotes them to "capacity overflow" panics).
35 /// * Guards against 32-bit systems allocating more than isize::MAX bytes.
36 /// * Guards against overflowing your length.
37 /// * Calls `handle_alloc_error` for fallible allocations.
38 /// * Contains a `ptr::Unique` and thus endows the user with all related benefits.
39 /// * Uses the excess returned from the allocator to use the largest available capacity.
40 ///
41 /// This type does not in anyway inspect the memory that it manages. When dropped it *will*
42 /// free its memory, but it *won't* try to drop its contents. It is up to the user of `RawVec`
43 /// to handle the actual things *stored* inside of a `RawVec`.
44 ///
45 /// Note that the excess of a zero-sized types is always infinite, so `capacity()` always returns
46 /// `usize::MAX`. This means that you need to be careful when round-tripping this type with a
47 /// `Box<[T]>`, since `capacity()` won't yield the length.
48 #[allow(missing_debug_implementations)]
49 pub struct RawVec<T, A: AllocRef = Global> {
50     ptr: Unique<T>,
51     cap: usize,
52     alloc: A,
53 }
54
55 impl<T> RawVec<T, Global> {
56     /// HACK(Centril): This exists because `#[unstable]` `const fn`s needn't conform
57     /// to `min_const_fn` and so they cannot be called in `min_const_fn`s either.
58     ///
59     /// If you change `RawVec<T>::new` or dependencies, please take care to not
60     /// introduce anything that would truly violate `min_const_fn`.
61     ///
62     /// NOTE: We could avoid this hack and check conformance with some
63     /// `#[rustc_force_min_const_fn]` attribute which requires conformance
64     /// with `min_const_fn` but does not necessarily allow calling it in
65     /// `stable(...) const fn` / user code not enabling `foo` when
66     /// `#[rustc_const_unstable(feature = "foo", issue = "01234")]` is present.
67     pub const NEW: Self = Self::new();
68
69     /// Creates the biggest possible `RawVec` (on the system heap)
70     /// without allocating. If `T` has positive size, then this makes a
71     /// `RawVec` with capacity `0`. If `T` is zero-sized, then it makes a
72     /// `RawVec` with capacity `usize::MAX`. Useful for implementing
73     /// delayed allocation.
74     pub const fn new() -> Self {
75         Self::new_in(Global)
76     }
77
78     /// Creates a `RawVec` (on the system heap) with exactly the
79     /// capacity and alignment requirements for a `[T; capacity]`. This is
80     /// equivalent to calling `RawVec::new` when `capacity` is `0` or `T` is
81     /// zero-sized. Note that if `T` is zero-sized this means you will
82     /// *not* get a `RawVec` with the requested capacity.
83     ///
84     /// # Panics
85     ///
86     /// Panics if the requested capacity exceeds `isize::MAX` bytes.
87     ///
88     /// # Aborts
89     ///
90     /// Aborts on OOM.
91     #[inline]
92     pub fn with_capacity(capacity: usize) -> Self {
93         Self::with_capacity_in(capacity, Global)
94     }
95
96     /// Like `with_capacity`, but guarantees the buffer is zeroed.
97     #[inline]
98     pub fn with_capacity_zeroed(capacity: usize) -> Self {
99         Self::with_capacity_zeroed_in(capacity, Global)
100     }
101
102     /// Reconstitutes a `RawVec` from a pointer and capacity.
103     ///
104     /// # Safety
105     ///
106     /// The `ptr` must be allocated (on the system heap), and with the given `capacity`.
107     /// The `capacity` cannot exceed `isize::MAX` for sized types. (only a concern on 32-bit
108     /// systems). ZST vectors may have a capacity up to `usize::MAX`.
109     /// If the `ptr` and `capacity` come from a `RawVec`, then this is guaranteed.
110     #[inline]
111     pub unsafe fn from_raw_parts(ptr: *mut T, capacity: usize) -> Self {
112         unsafe { Self::from_raw_parts_in(ptr, capacity, Global) }
113     }
114 }
115
116 impl<T, A: AllocRef> RawVec<T, A> {
117     /// Like `new`, but parameterized over the choice of allocator for
118     /// the returned `RawVec`.
119     #[cfg_attr(not(bootstrap), rustc_allow_const_fn_unstable(const_fn))]
120     #[cfg_attr(bootstrap, allow_internal_unstable(const_fn))]
121     pub const fn new_in(alloc: A) -> Self {
122         // `cap: 0` means "unallocated". zero-sized types are ignored.
123         Self { ptr: Unique::dangling(), cap: 0, alloc }
124     }
125
126     /// Like `with_capacity`, but parameterized over the choice of
127     /// allocator for the returned `RawVec`.
128     #[inline]
129     pub fn with_capacity_in(capacity: usize, alloc: A) -> Self {
130         Self::allocate_in(capacity, AllocInit::Uninitialized, alloc)
131     }
132
133     /// Like `with_capacity_zeroed`, but parameterized over the choice
134     /// of allocator for the returned `RawVec`.
135     #[inline]
136     pub fn with_capacity_zeroed_in(capacity: usize, alloc: A) -> Self {
137         Self::allocate_in(capacity, AllocInit::Zeroed, alloc)
138     }
139
140     /// Converts a `Box<[T]>` into a `RawVec<T>`.
141     pub fn from_box(slice: Box<[T], A>) -> Self {
142         unsafe {
143             let (slice, alloc) = Box::into_raw_with_alloc(slice);
144             RawVec::from_raw_parts_in(slice.as_mut_ptr(), slice.len(), alloc)
145         }
146     }
147
148     /// Converts the entire buffer into `Box<[MaybeUninit<T>]>` with the specified `len`.
149     ///
150     /// Note that this will correctly reconstitute any `cap` changes
151     /// that may have been performed. (See description of type for details.)
152     ///
153     /// # Safety
154     ///
155     /// * `len` must be greater than or equal to the most recently requested capacity, and
156     /// * `len` must be less than or equal to `self.capacity()`.
157     ///
158     /// Note, that the requested capacity and `self.capacity()` could differ, as
159     /// an allocator could overallocate and return a greater memory block than requested.
160     pub unsafe fn into_box(self, len: usize) -> Box<[MaybeUninit<T>], A> {
161         // Sanity-check one half of the safety requirement (we cannot check the other half).
162         debug_assert!(
163             len <= self.capacity(),
164             "`len` must be smaller than or equal to `self.capacity()`"
165         );
166
167         let me = ManuallyDrop::new(self);
168         unsafe {
169             let slice = slice::from_raw_parts_mut(me.ptr() as *mut MaybeUninit<T>, len);
170             Box::from_raw_in(slice, ptr::read(&me.alloc))
171         }
172     }
173
174     fn allocate_in(capacity: usize, init: AllocInit, alloc: A) -> Self {
175         if mem::size_of::<T>() == 0 {
176             Self::new_in(alloc)
177         } else {
178             // We avoid `unwrap_or_else` here because it bloats the amount of
179             // LLVM IR generated.
180             let layout = match Layout::array::<T>(capacity) {
181                 Ok(layout) => layout,
182                 Err(_) => capacity_overflow(),
183             };
184             match alloc_guard(layout.size()) {
185                 Ok(_) => {}
186                 Err(_) => capacity_overflow(),
187             }
188             let result = match init {
189                 AllocInit::Uninitialized => alloc.alloc(layout),
190                 AllocInit::Zeroed => alloc.alloc_zeroed(layout),
191             };
192             let ptr = match result {
193                 Ok(ptr) => ptr,
194                 Err(_) => handle_alloc_error(layout),
195             };
196
197             Self {
198                 ptr: unsafe { Unique::new_unchecked(ptr.cast().as_ptr()) },
199                 cap: Self::capacity_from_bytes(ptr.len()),
200                 alloc,
201             }
202         }
203     }
204
205     /// Reconstitutes a `RawVec` from a pointer, capacity, and allocator.
206     ///
207     /// # Safety
208     ///
209     /// The `ptr` must be allocated (via the given allocator `alloc`), and with the given
210     /// `capacity`.
211     /// The `capacity` cannot exceed `isize::MAX` for sized types. (only a concern on 32-bit
212     /// systems). ZST vectors may have a capacity up to `usize::MAX`.
213     /// If the `ptr` and `capacity` come from a `RawVec` created via `alloc`, then this is
214     /// guaranteed.
215     #[inline]
216     pub unsafe fn from_raw_parts_in(ptr: *mut T, capacity: usize, alloc: A) -> Self {
217         Self { ptr: unsafe { Unique::new_unchecked(ptr) }, cap: capacity, alloc }
218     }
219
220     /// Gets a raw pointer to the start of the allocation. Note that this is
221     /// `Unique::dangling()` if `capacity == 0` or `T` is zero-sized. In the former case, you must
222     /// be careful.
223     pub fn ptr(&self) -> *mut T {
224         self.ptr.as_ptr()
225     }
226
227     /// Gets the capacity of the allocation.
228     ///
229     /// This will always be `usize::MAX` if `T` is zero-sized.
230     #[inline(always)]
231     pub fn capacity(&self) -> usize {
232         if mem::size_of::<T>() == 0 { usize::MAX } else { self.cap }
233     }
234
235     /// Returns a shared reference to the allocator backing this `RawVec`.
236     pub fn alloc(&self) -> &A {
237         &self.alloc
238     }
239
240     /// Returns a mutable reference to the allocator backing this `RawVec`.
241     pub fn alloc_mut(&mut self) -> &mut A {
242         &mut self.alloc
243     }
244
245     fn current_memory(&self) -> Option<(NonNull<u8>, Layout)> {
246         if mem::size_of::<T>() == 0 || self.cap == 0 {
247             None
248         } else {
249             // We have an allocated chunk of memory, so we can bypass runtime
250             // checks to get our current layout.
251             unsafe {
252                 let align = mem::align_of::<T>();
253                 let size = mem::size_of::<T>() * self.cap;
254                 let layout = Layout::from_size_align_unchecked(size, align);
255                 Some((self.ptr.cast().into(), layout))
256             }
257         }
258     }
259
260     /// Ensures that the buffer contains at least enough space to hold `len +
261     /// additional` elements. If it doesn't already have enough capacity, will
262     /// reallocate enough space plus comfortable slack space to get amortized
263     /// *O*(1) behavior. Will limit this behavior if it would needlessly cause
264     /// itself to panic.
265     ///
266     /// If `len` exceeds `self.capacity()`, this may fail to actually allocate
267     /// the requested space. This is not really unsafe, but the unsafe
268     /// code *you* write that relies on the behavior of this function may break.
269     ///
270     /// This is ideal for implementing a bulk-push operation like `extend`.
271     ///
272     /// # Panics
273     ///
274     /// Panics if the new capacity exceeds `isize::MAX` bytes.
275     ///
276     /// # Aborts
277     ///
278     /// Aborts on OOM.
279     ///
280     /// # Examples
281     ///
282     /// ```
283     /// # #![feature(raw_vec_internals)]
284     /// # extern crate alloc;
285     /// # use std::ptr;
286     /// # use alloc::raw_vec::RawVec;
287     /// struct MyVec<T> {
288     ///     buf: RawVec<T>,
289     ///     len: usize,
290     /// }
291     ///
292     /// impl<T: Clone> MyVec<T> {
293     ///     pub fn push_all(&mut self, elems: &[T]) {
294     ///         self.buf.reserve(self.len, elems.len());
295     ///         // reserve would have aborted or panicked if the len exceeded
296     ///         // `isize::MAX` so this is safe to do unchecked now.
297     ///         for x in elems {
298     ///             unsafe {
299     ///                 ptr::write(self.buf.ptr().add(self.len), x.clone());
300     ///             }
301     ///             self.len += 1;
302     ///         }
303     ///     }
304     /// }
305     /// # fn main() {
306     /// #   let mut vector = MyVec { buf: RawVec::new(), len: 0 };
307     /// #   vector.push_all(&[1, 3, 5, 7, 9]);
308     /// # }
309     /// ```
310     pub fn reserve(&mut self, len: usize, additional: usize) {
311         handle_reserve(self.try_reserve(len, additional));
312     }
313
314     /// The same as `reserve`, but returns on errors instead of panicking or aborting.
315     pub fn try_reserve(&mut self, len: usize, additional: usize) -> Result<(), TryReserveError> {
316         if self.needs_to_grow(len, additional) {
317             self.grow_amortized(len, additional)
318         } else {
319             Ok(())
320         }
321     }
322
323     /// Ensures that the buffer contains at least enough space to hold `len +
324     /// additional` elements. If it doesn't already, will reallocate the
325     /// minimum possible amount of memory necessary. Generally this will be
326     /// exactly the amount of memory necessary, but in principle the allocator
327     /// is free to give back more than we asked for.
328     ///
329     /// If `len` exceeds `self.capacity()`, this may fail to actually allocate
330     /// the requested space. This is not really unsafe, but the unsafe code
331     /// *you* write that relies on the behavior of this function may break.
332     ///
333     /// # Panics
334     ///
335     /// Panics if the new capacity exceeds `isize::MAX` bytes.
336     ///
337     /// # Aborts
338     ///
339     /// Aborts on OOM.
340     pub fn reserve_exact(&mut self, len: usize, additional: usize) {
341         handle_reserve(self.try_reserve_exact(len, additional));
342     }
343
344     /// The same as `reserve_exact`, but returns on errors instead of panicking or aborting.
345     pub fn try_reserve_exact(
346         &mut self,
347         len: usize,
348         additional: usize,
349     ) -> Result<(), TryReserveError> {
350         if self.needs_to_grow(len, additional) { self.grow_exact(len, additional) } else { Ok(()) }
351     }
352
353     /// Shrinks the allocation down to the specified amount. If the given amount
354     /// is 0, actually completely deallocates.
355     ///
356     /// # Panics
357     ///
358     /// Panics if the given amount is *larger* than the current capacity.
359     ///
360     /// # Aborts
361     ///
362     /// Aborts on OOM.
363     pub fn shrink_to_fit(&mut self, amount: usize) {
364         handle_reserve(self.shrink(amount));
365     }
366 }
367
368 impl<T, A: AllocRef> RawVec<T, A> {
369     /// Returns if the buffer needs to grow to fulfill the needed extra capacity.
370     /// Mainly used to make inlining reserve-calls possible without inlining `grow`.
371     fn needs_to_grow(&self, len: usize, additional: usize) -> bool {
372         additional > self.capacity().wrapping_sub(len)
373     }
374
375     fn capacity_from_bytes(excess: usize) -> usize {
376         debug_assert_ne!(mem::size_of::<T>(), 0);
377         excess / mem::size_of::<T>()
378     }
379
380     fn set_ptr(&mut self, ptr: NonNull<[u8]>) {
381         self.ptr = unsafe { Unique::new_unchecked(ptr.cast().as_ptr()) };
382         self.cap = Self::capacity_from_bytes(ptr.len());
383     }
384
385     // This method is usually instantiated many times. So we want it to be as
386     // small as possible, to improve compile times. But we also want as much of
387     // its contents to be statically computable as possible, to make the
388     // generated code run faster. Therefore, this method is carefully written
389     // so that all of the code that depends on `T` is within it, while as much
390     // of the code that doesn't depend on `T` as possible is in functions that
391     // are non-generic over `T`.
392     fn grow_amortized(&mut self, len: usize, additional: usize) -> Result<(), TryReserveError> {
393         // This is ensured by the calling contexts.
394         debug_assert!(additional > 0);
395
396         if mem::size_of::<T>() == 0 {
397             // Since we return a capacity of `usize::MAX` when `elem_size` is
398             // 0, getting to here necessarily means the `RawVec` is overfull.
399             return Err(CapacityOverflow);
400         }
401
402         // Nothing we can really do about these checks, sadly.
403         let required_cap = len.checked_add(additional).ok_or(CapacityOverflow)?;
404
405         // This guarantees exponential growth. The doubling cannot overflow
406         // because `cap <= isize::MAX` and the type of `cap` is `usize`.
407         let cap = cmp::max(self.cap * 2, required_cap);
408
409         // Tiny Vecs are dumb. Skip to:
410         // - 8 if the element size is 1, because any heap allocators is likely
411         //   to round up a request of less than 8 bytes to at least 8 bytes.
412         // - 4 if elements are moderate-sized (<= 1 KiB).
413         // - 1 otherwise, to avoid wasting too much space for very short Vecs.
414         // Note that `min_non_zero_cap` is computed statically.
415         let elem_size = mem::size_of::<T>();
416         let min_non_zero_cap = if elem_size == 1 {
417             8
418         } else if elem_size <= 1024 {
419             4
420         } else {
421             1
422         };
423         let cap = cmp::max(min_non_zero_cap, cap);
424
425         let new_layout = Layout::array::<T>(cap);
426
427         // `finish_grow` is non-generic over `T`.
428         let ptr = finish_grow(new_layout, self.current_memory(), &mut self.alloc)?;
429         self.set_ptr(ptr);
430         Ok(())
431     }
432
433     // The constraints on this method are much the same as those on
434     // `grow_amortized`, but this method is usually instantiated less often so
435     // it's less critical.
436     fn grow_exact(&mut self, len: usize, additional: usize) -> Result<(), TryReserveError> {
437         if mem::size_of::<T>() == 0 {
438             // Since we return a capacity of `usize::MAX` when the type size is
439             // 0, getting to here necessarily means the `RawVec` is overfull.
440             return Err(CapacityOverflow);
441         }
442
443         let cap = len.checked_add(additional).ok_or(CapacityOverflow)?;
444         let new_layout = Layout::array::<T>(cap);
445
446         // `finish_grow` is non-generic over `T`.
447         let ptr = finish_grow(new_layout, self.current_memory(), &mut self.alloc)?;
448         self.set_ptr(ptr);
449         Ok(())
450     }
451
452     fn shrink(&mut self, amount: usize) -> Result<(), TryReserveError> {
453         assert!(amount <= self.capacity(), "Tried to shrink to a larger capacity");
454
455         let (ptr, layout) = if let Some(mem) = self.current_memory() { mem } else { return Ok(()) };
456         let new_size = amount * mem::size_of::<T>();
457
458         let ptr = unsafe {
459             let new_layout = Layout::from_size_align_unchecked(new_size, layout.align());
460             self.alloc.shrink(ptr, layout, new_layout).map_err(|_| TryReserveError::AllocError {
461                 layout: new_layout,
462                 non_exhaustive: (),
463             })?
464         };
465         self.set_ptr(ptr);
466         Ok(())
467     }
468 }
469
470 // This function is outside `RawVec` to minimize compile times. See the comment
471 // above `RawVec::grow_amortized` for details. (The `A` parameter isn't
472 // significant, because the number of different `A` types seen in practice is
473 // much smaller than the number of `T` types.)
474 fn finish_grow<A>(
475     new_layout: Result<Layout, LayoutErr>,
476     current_memory: Option<(NonNull<u8>, Layout)>,
477     alloc: &mut A,
478 ) -> Result<NonNull<[u8]>, TryReserveError>
479 where
480     A: AllocRef,
481 {
482     // Check for the error here to minimize the size of `RawVec::grow_*`.
483     let new_layout = new_layout.map_err(|_| CapacityOverflow)?;
484
485     alloc_guard(new_layout.size())?;
486
487     let memory = if let Some((ptr, old_layout)) = current_memory {
488         debug_assert_eq!(old_layout.align(), new_layout.align());
489         unsafe {
490             // The allocator checks for alignment equality
491             intrinsics::assume(old_layout.align() == new_layout.align());
492             alloc.grow(ptr, old_layout, new_layout)
493         }
494     } else {
495         alloc.alloc(new_layout)
496     };
497
498     memory.map_err(|_| AllocError { layout: new_layout, non_exhaustive: () })
499 }
500
501 unsafe impl<#[may_dangle] T, A: AllocRef> Drop for RawVec<T, A> {
502     /// Frees the memory owned by the `RawVec` *without* trying to drop its contents.
503     fn drop(&mut self) {
504         if let Some((ptr, layout)) = self.current_memory() {
505             unsafe { self.alloc.dealloc(ptr, layout) }
506         }
507     }
508 }
509
510 // Central function for reserve error handling.
511 #[inline]
512 fn handle_reserve(result: Result<(), TryReserveError>) {
513     match result {
514         Err(CapacityOverflow) => capacity_overflow(),
515         Err(AllocError { layout, .. }) => handle_alloc_error(layout),
516         Ok(()) => { /* yay */ }
517     }
518 }
519
520 // We need to guarantee the following:
521 // * We don't ever allocate `> isize::MAX` byte-size objects.
522 // * We don't overflow `usize::MAX` and actually allocate too little.
523 //
524 // On 64-bit we just need to check for overflow since trying to allocate
525 // `> isize::MAX` bytes will surely fail. On 32-bit and 16-bit we need to add
526 // an extra guard for this in case we're running on a platform which can use
527 // all 4GB in user-space, e.g., PAE or x32.
528
529 #[inline]
530 fn alloc_guard(alloc_size: usize) -> Result<(), TryReserveError> {
531     if usize::BITS < 64 && alloc_size > isize::MAX as usize {
532         Err(CapacityOverflow)
533     } else {
534         Ok(())
535     }
536 }
537
538 // One central function responsible for reporting capacity overflows. This'll
539 // ensure that the code generation related to these panics is minimal as there's
540 // only one location which panics rather than a bunch throughout the module.
541 fn capacity_overflow() -> ! {
542     panic!("capacity overflow");
543 }