]> git.lizzy.rs Git - rust.git/blob - compiler/rustc_codegen_gcc/src/builder.rs
Auto merge of #107843 - bjorn3:sync_cg_clif-2023-02-09, r=bjorn3
[rust.git] / compiler / rustc_codegen_gcc / src / builder.rs
1 use std::borrow::Cow;
2 use std::cell::Cell;
3 use std::convert::TryFrom;
4 use std::ops::Deref;
5
6 use gccjit::{
7     BinaryOp,
8     Block,
9     ComparisonOp,
10     Context,
11     Function,
12     LValue,
13     RValue,
14     ToRValue,
15     Type,
16     UnaryOp,
17 };
18 use rustc_apfloat::{ieee, Float, Round, Status};
19 use rustc_codegen_ssa::MemFlags;
20 use rustc_codegen_ssa::common::{
21     AtomicOrdering, AtomicRmwBinOp, IntPredicate, RealPredicate, SynchronizationScope, TypeKind,
22 };
23 use rustc_codegen_ssa::mir::operand::{OperandRef, OperandValue};
24 use rustc_codegen_ssa::mir::place::PlaceRef;
25 use rustc_codegen_ssa::traits::{
26     BackendTypes,
27     BaseTypeMethods,
28     BuilderMethods,
29     ConstMethods,
30     DerivedTypeMethods,
31     LayoutTypeMethods,
32     HasCodegen,
33     OverflowOp,
34     StaticBuilderMethods,
35 };
36 use rustc_data_structures::fx::FxHashSet;
37 use rustc_middle::bug;
38 use rustc_middle::ty::{ParamEnv, Ty, TyCtxt};
39 use rustc_middle::ty::layout::{FnAbiError, FnAbiOfHelpers, FnAbiRequest, HasParamEnv, HasTyCtxt, LayoutError, LayoutOfHelpers, TyAndLayout};
40 use rustc_span::Span;
41 use rustc_span::def_id::DefId;
42 use rustc_target::abi::{
43     self,
44     call::FnAbi,
45     Align,
46     HasDataLayout,
47     Size,
48     TargetDataLayout,
49     WrappingRange,
50 };
51 use rustc_target::spec::{HasTargetSpec, Target};
52
53 use crate::common::{SignType, TypeReflection, type_is_pointer};
54 use crate::context::CodegenCx;
55 use crate::intrinsic::llvm;
56 use crate::type_of::LayoutGccExt;
57
58 // TODO(antoyo)
59 type Funclet = ();
60
61 // TODO(antoyo): remove this variable.
62 static mut RETURN_VALUE_COUNT: usize = 0;
63
64 enum ExtremumOperation {
65     Max,
66     Min,
67 }
68
69 pub struct Builder<'a: 'gcc, 'gcc, 'tcx> {
70     pub cx: &'a CodegenCx<'gcc, 'tcx>,
71     pub block: Block<'gcc>,
72     stack_var_count: Cell<usize>,
73 }
74
75 impl<'a, 'gcc, 'tcx> Builder<'a, 'gcc, 'tcx> {
76     fn with_cx(cx: &'a CodegenCx<'gcc, 'tcx>, block: Block<'gcc>) -> Self {
77         Builder {
78             cx,
79             block,
80             stack_var_count: Cell::new(0),
81         }
82     }
83
84     fn atomic_extremum(&mut self, operation: ExtremumOperation, dst: RValue<'gcc>, src: RValue<'gcc>, order: AtomicOrdering) -> RValue<'gcc> {
85         let size = src.get_type().get_size();
86
87         let func = self.current_func();
88
89         let load_ordering =
90             match order {
91                 // TODO(antoyo): does this make sense?
92                 AtomicOrdering::AcquireRelease | AtomicOrdering::Release => AtomicOrdering::Acquire,
93                 _ => order,
94             };
95         let previous_value = self.atomic_load(dst.get_type(), dst, load_ordering, Size::from_bytes(size));
96         let previous_var = func.new_local(None, previous_value.get_type(), "previous_value");
97         let return_value = func.new_local(None, previous_value.get_type(), "return_value");
98         self.llbb().add_assignment(None, previous_var, previous_value);
99         self.llbb().add_assignment(None, return_value, previous_var.to_rvalue());
100
101         let while_block = func.new_block("while");
102         let after_block = func.new_block("after_while");
103         self.llbb().end_with_jump(None, while_block);
104
105         // NOTE: since jumps were added and compare_exchange doesn't expect this, the current block in the
106         // state need to be updated.
107         self.switch_to_block(while_block);
108
109         let comparison_operator =
110             match operation {
111                 ExtremumOperation::Max => ComparisonOp::LessThan,
112                 ExtremumOperation::Min => ComparisonOp::GreaterThan,
113             };
114
115         let cond1 = self.context.new_comparison(None, comparison_operator, previous_var.to_rvalue(), self.context.new_cast(None, src, previous_value.get_type()));
116         let compare_exchange = self.compare_exchange(dst, previous_var, src, order, load_ordering, false);
117         let cond2 = self.cx.context.new_unary_op(None, UnaryOp::LogicalNegate, compare_exchange.get_type(), compare_exchange);
118         let cond = self.cx.context.new_binary_op(None, BinaryOp::LogicalAnd, self.cx.bool_type, cond1, cond2);
119
120         while_block.end_with_conditional(None, cond, while_block, after_block);
121
122         // NOTE: since jumps were added in a place rustc does not expect, the current block in the
123         // state need to be updated.
124         self.switch_to_block(after_block);
125
126         return_value.to_rvalue()
127     }
128
129     fn compare_exchange(&self, dst: RValue<'gcc>, cmp: LValue<'gcc>, src: RValue<'gcc>, order: AtomicOrdering, failure_order: AtomicOrdering, weak: bool) -> RValue<'gcc> {
130         let size = src.get_type().get_size();
131         let compare_exchange = self.context.get_builtin_function(&format!("__atomic_compare_exchange_{}", size));
132         let order = self.context.new_rvalue_from_int(self.i32_type, order.to_gcc());
133         let failure_order = self.context.new_rvalue_from_int(self.i32_type, failure_order.to_gcc());
134         let weak = self.context.new_rvalue_from_int(self.bool_type, weak as i32);
135
136         let void_ptr_type = self.context.new_type::<*mut ()>();
137         let volatile_void_ptr_type = void_ptr_type.make_volatile();
138         let dst = self.context.new_cast(None, dst, volatile_void_ptr_type);
139         let expected = self.context.new_cast(None, cmp.get_address(None), void_ptr_type);
140
141         // NOTE: not sure why, but we have the wrong type here.
142         let int_type = compare_exchange.get_param(2).to_rvalue().get_type();
143         let src = self.context.new_cast(None, src, int_type);
144         self.context.new_call(None, compare_exchange, &[dst, expected, src, weak, order, failure_order])
145     }
146
147     pub fn assign(&self, lvalue: LValue<'gcc>, value: RValue<'gcc>) {
148         self.llbb().add_assignment(None, lvalue, value);
149     }
150
151     fn check_call<'b>(&mut self, _typ: &str, func: Function<'gcc>, args: &'b [RValue<'gcc>]) -> Cow<'b, [RValue<'gcc>]> {
152         let mut all_args_match = true;
153         let mut param_types = vec![];
154         let param_count = func.get_param_count();
155         for (index, arg) in args.iter().enumerate().take(param_count) {
156             let param = func.get_param(index as i32);
157             let param = param.to_rvalue().get_type();
158             if param != arg.get_type() {
159                 all_args_match = false;
160             }
161             param_types.push(param);
162         }
163
164         if all_args_match {
165             return Cow::Borrowed(args);
166         }
167
168         let casted_args: Vec<_> = param_types
169             .into_iter()
170             .zip(args.iter())
171             .enumerate()
172             .map(|(_i, (expected_ty, &actual_val))| {
173                 let actual_ty = actual_val.get_type();
174                 if expected_ty != actual_ty {
175                     self.bitcast(actual_val, expected_ty)
176                 }
177                 else {
178                     actual_val
179                 }
180             })
181             .collect();
182
183         Cow::Owned(casted_args)
184     }
185
186     fn check_ptr_call<'b>(&mut self, _typ: &str, func_ptr: RValue<'gcc>, args: &'b [RValue<'gcc>]) -> Cow<'b, [RValue<'gcc>]> {
187         let mut all_args_match = true;
188         let mut param_types = vec![];
189         let gcc_func = func_ptr.get_type().dyncast_function_ptr_type().expect("function ptr");
190         for (index, arg) in args.iter().enumerate().take(gcc_func.get_param_count()) {
191             let param = gcc_func.get_param_type(index);
192             if param != arg.get_type() {
193                 all_args_match = false;
194             }
195             param_types.push(param);
196         }
197
198         let mut on_stack_param_indices = FxHashSet::default();
199         if let Some(indices) = self.on_stack_params.borrow().get(&gcc_func) {
200             on_stack_param_indices = indices.clone();
201         }
202
203         if all_args_match {
204             return Cow::Borrowed(args);
205         }
206
207         let func_name = format!("{:?}", func_ptr);
208
209         let casted_args: Vec<_> = param_types
210             .into_iter()
211             .zip(args.iter())
212             .enumerate()
213             .map(|(index, (expected_ty, &actual_val))| {
214                 if llvm::ignore_arg_cast(&func_name, index, args.len()) {
215                     return actual_val;
216                 }
217
218                 let actual_ty = actual_val.get_type();
219                 if expected_ty != actual_ty {
220                     if !actual_ty.is_vector() && !expected_ty.is_vector() && actual_ty.is_integral() && expected_ty.is_integral() && actual_ty.get_size() != expected_ty.get_size() {
221                         self.context.new_cast(None, actual_val, expected_ty)
222                     }
223                     else if on_stack_param_indices.contains(&index) {
224                         actual_val.dereference(None).to_rvalue()
225                     }
226                     else {
227                         assert!(!((actual_ty.is_vector() && !expected_ty.is_vector()) || (!actual_ty.is_vector() && expected_ty.is_vector())), "{:?} ({}) -> {:?} ({}), index: {:?}[{}]", actual_ty, actual_ty.is_vector(), expected_ty, expected_ty.is_vector(), func_ptr, index);
228                         // TODO(antoyo): perhaps use __builtin_convertvector for vector casting.
229                         self.bitcast(actual_val, expected_ty)
230                     }
231                 }
232                 else {
233                     actual_val
234                 }
235             })
236             .collect();
237
238         Cow::Owned(casted_args)
239     }
240
241     fn check_store(&mut self, val: RValue<'gcc>, ptr: RValue<'gcc>) -> RValue<'gcc> {
242         let dest_ptr_ty = self.cx.val_ty(ptr).make_pointer(); // TODO(antoyo): make sure make_pointer() is okay here.
243         let stored_ty = self.cx.val_ty(val);
244         let stored_ptr_ty = self.cx.type_ptr_to(stored_ty);
245
246         if dest_ptr_ty == stored_ptr_ty {
247             ptr
248         }
249         else {
250             self.bitcast(ptr, stored_ptr_ty)
251         }
252     }
253
254     pub fn current_func(&self) -> Function<'gcc> {
255         self.block.get_function()
256     }
257
258     fn function_call(&mut self, func: RValue<'gcc>, args: &[RValue<'gcc>], _funclet: Option<&Funclet>) -> RValue<'gcc> {
259         // TODO(antoyo): remove when the API supports a different type for functions.
260         let func: Function<'gcc> = self.cx.rvalue_as_function(func);
261         let args = self.check_call("call", func, args);
262
263         // gccjit requires to use the result of functions, even when it's not used.
264         // That's why we assign the result to a local or call add_eval().
265         let return_type = func.get_return_type();
266         let void_type = self.context.new_type::<()>();
267         let current_func = self.block.get_function();
268         if return_type != void_type {
269             unsafe { RETURN_VALUE_COUNT += 1 };
270             let result = current_func.new_local(None, return_type, &format!("returnValue{}", unsafe { RETURN_VALUE_COUNT }));
271             self.block.add_assignment(None, result, self.cx.context.new_call(None, func, &args));
272             result.to_rvalue()
273         }
274         else {
275             self.block.add_eval(None, self.cx.context.new_call(None, func, &args));
276             // Return dummy value when not having return value.
277             self.context.new_rvalue_from_long(self.isize_type, 0)
278         }
279     }
280
281     fn function_ptr_call(&mut self, func_ptr: RValue<'gcc>, args: &[RValue<'gcc>], _funclet: Option<&Funclet>) -> RValue<'gcc> {
282         let args = self.check_ptr_call("call", func_ptr, args);
283
284         // gccjit requires to use the result of functions, even when it's not used.
285         // That's why we assign the result to a local or call add_eval().
286         let gcc_func = func_ptr.get_type().dyncast_function_ptr_type().expect("function ptr");
287         let return_type = gcc_func.get_return_type();
288         let void_type = self.context.new_type::<()>();
289         let current_func = self.block.get_function();
290
291         if return_type != void_type {
292             unsafe { RETURN_VALUE_COUNT += 1 };
293             let result = current_func.new_local(None, return_type, &format!("ptrReturnValue{}", unsafe { RETURN_VALUE_COUNT }));
294             let func_name = format!("{:?}", func_ptr);
295             let args = llvm::adjust_intrinsic_arguments(&self, gcc_func, args, &func_name);
296             self.block.add_assignment(None, result, self.cx.context.new_call_through_ptr(None, func_ptr, &args));
297             result.to_rvalue()
298         }
299         else {
300             #[cfg(not(feature="master"))]
301             if gcc_func.get_param_count() == 0 {
302                 // FIXME(antoyo): As a temporary workaround for unsupported LLVM intrinsics.
303                 self.block.add_eval(None, self.cx.context.new_call_through_ptr(None, func_ptr, &[]));
304             }
305             else {
306                 self.block.add_eval(None, self.cx.context.new_call_through_ptr(None, func_ptr, &args));
307             }
308             #[cfg(feature="master")]
309             self.block.add_eval(None, self.cx.context.new_call_through_ptr(None, func_ptr, &args));
310             // Return dummy value when not having return value.
311             let result = current_func.new_local(None, self.isize_type, "dummyValueThatShouldNeverBeUsed");
312             self.block.add_assignment(None, result, self.context.new_rvalue_from_long(self.isize_type, 0));
313             result.to_rvalue()
314         }
315     }
316
317     pub fn overflow_call(&self, func: Function<'gcc>, args: &[RValue<'gcc>], _funclet: Option<&Funclet>) -> RValue<'gcc> {
318         // gccjit requires to use the result of functions, even when it's not used.
319         // That's why we assign the result to a local.
320         let return_type = self.context.new_type::<bool>();
321         let current_func = self.block.get_function();
322         // TODO(antoyo): return the new_call() directly? Since the overflow function has no side-effects.
323         unsafe { RETURN_VALUE_COUNT += 1 };
324         let result = current_func.new_local(None, return_type, &format!("overflowReturnValue{}", unsafe { RETURN_VALUE_COUNT }));
325         self.block.add_assignment(None, result, self.cx.context.new_call(None, func, &args));
326         result.to_rvalue()
327     }
328 }
329
330 impl<'gcc, 'tcx> HasCodegen<'tcx> for Builder<'_, 'gcc, 'tcx> {
331     type CodegenCx = CodegenCx<'gcc, 'tcx>;
332 }
333
334 impl<'tcx> HasTyCtxt<'tcx> for Builder<'_, '_, 'tcx> {
335     fn tcx(&self) -> TyCtxt<'tcx> {
336         self.cx.tcx()
337     }
338 }
339
340 impl HasDataLayout for Builder<'_, '_, '_> {
341     fn data_layout(&self) -> &TargetDataLayout {
342         self.cx.data_layout()
343     }
344 }
345
346 impl<'tcx> LayoutOfHelpers<'tcx> for Builder<'_, '_, 'tcx> {
347     type LayoutOfResult = TyAndLayout<'tcx>;
348
349     #[inline]
350     fn handle_layout_err(&self, err: LayoutError<'tcx>, span: Span, ty: Ty<'tcx>) -> ! {
351         self.cx.handle_layout_err(err, span, ty)
352     }
353 }
354
355 impl<'tcx> FnAbiOfHelpers<'tcx> for Builder<'_, '_, 'tcx> {
356     type FnAbiOfResult = &'tcx FnAbi<'tcx, Ty<'tcx>>;
357
358     #[inline]
359     fn handle_fn_abi_err(
360         &self,
361         err: FnAbiError<'tcx>,
362         span: Span,
363         fn_abi_request: FnAbiRequest<'tcx>,
364     ) -> ! {
365         self.cx.handle_fn_abi_err(err, span, fn_abi_request)
366     }
367 }
368
369 impl<'gcc, 'tcx> Deref for Builder<'_, 'gcc, 'tcx> {
370     type Target = CodegenCx<'gcc, 'tcx>;
371
372     fn deref(&self) -> &Self::Target {
373         self.cx
374     }
375 }
376
377 impl<'gcc, 'tcx> BackendTypes for Builder<'_, 'gcc, 'tcx> {
378     type Value = <CodegenCx<'gcc, 'tcx> as BackendTypes>::Value;
379     type Function = <CodegenCx<'gcc, 'tcx> as BackendTypes>::Function;
380     type BasicBlock = <CodegenCx<'gcc, 'tcx> as BackendTypes>::BasicBlock;
381     type Type = <CodegenCx<'gcc, 'tcx> as BackendTypes>::Type;
382     type Funclet = <CodegenCx<'gcc, 'tcx> as BackendTypes>::Funclet;
383
384     type DIScope = <CodegenCx<'gcc, 'tcx> as BackendTypes>::DIScope;
385     type DILocation = <CodegenCx<'gcc, 'tcx> as BackendTypes>::DILocation;
386     type DIVariable = <CodegenCx<'gcc, 'tcx> as BackendTypes>::DIVariable;
387 }
388
389 impl<'a, 'gcc, 'tcx> BuilderMethods<'a, 'tcx> for Builder<'a, 'gcc, 'tcx> {
390     fn build(cx: &'a CodegenCx<'gcc, 'tcx>, block: Block<'gcc>) -> Self {
391         Builder::with_cx(cx, block)
392     }
393
394     fn llbb(&self) -> Block<'gcc> {
395         self.block
396     }
397
398     fn append_block(cx: &'a CodegenCx<'gcc, 'tcx>, func: RValue<'gcc>, name: &str) -> Block<'gcc> {
399         let func = cx.rvalue_as_function(func);
400         func.new_block(name)
401     }
402
403     fn append_sibling_block(&mut self, name: &str) -> Block<'gcc> {
404         let func = self.current_func();
405         func.new_block(name)
406     }
407
408     fn switch_to_block(&mut self, block: Self::BasicBlock) {
409         self.block = block;
410     }
411
412     fn ret_void(&mut self) {
413         self.llbb().end_with_void_return(None)
414     }
415
416     fn ret(&mut self, value: RValue<'gcc>) {
417         let value =
418             if self.structs_as_pointer.borrow().contains(&value) {
419                 // NOTE: hack to workaround a limitation of the rustc API: see comment on
420                 // CodegenCx.structs_as_pointer
421                 value.dereference(None).to_rvalue()
422             }
423             else {
424                 value
425             };
426         self.llbb().end_with_return(None, value);
427     }
428
429     fn br(&mut self, dest: Block<'gcc>) {
430         self.llbb().end_with_jump(None, dest)
431     }
432
433     fn cond_br(&mut self, cond: RValue<'gcc>, then_block: Block<'gcc>, else_block: Block<'gcc>) {
434         self.llbb().end_with_conditional(None, cond, then_block, else_block)
435     }
436
437     fn switch(&mut self, value: RValue<'gcc>, default_block: Block<'gcc>, cases: impl ExactSizeIterator<Item = (u128, Block<'gcc>)>) {
438         let mut gcc_cases = vec![];
439         let typ = self.val_ty(value);
440         for (on_val, dest) in cases {
441             let on_val = self.const_uint_big(typ, on_val);
442             gcc_cases.push(self.context.new_case(on_val, on_val, dest));
443         }
444         self.block.end_with_switch(None, value, default_block, &gcc_cases);
445     }
446
447     fn invoke(
448         &mut self,
449         typ: Type<'gcc>,
450         fn_abi: Option<&FnAbi<'tcx, Ty<'tcx>>>,
451         func: RValue<'gcc>,
452         args: &[RValue<'gcc>],
453         then: Block<'gcc>,
454         catch: Block<'gcc>,
455         _funclet: Option<&Funclet>,
456     ) -> RValue<'gcc> {
457         // TODO(bjorn3): Properly implement unwinding.
458         let call_site = self.call(typ, None, func, args, None);
459         let condition = self.context.new_rvalue_from_int(self.bool_type, 1);
460         self.llbb().end_with_conditional(None, condition, then, catch);
461         if let Some(_fn_abi) = fn_abi {
462             // TODO(bjorn3): Apply function attributes
463         }
464         call_site
465     }
466
467     fn unreachable(&mut self) {
468         let func = self.context.get_builtin_function("__builtin_unreachable");
469         self.block.add_eval(None, self.context.new_call(None, func, &[]));
470         let return_type = self.block.get_function().get_return_type();
471         let void_type = self.context.new_type::<()>();
472         if return_type == void_type {
473             self.block.end_with_void_return(None)
474         }
475         else {
476             let return_value = self.current_func()
477                 .new_local(None, return_type, "unreachableReturn");
478             self.block.end_with_return(None, return_value)
479         }
480     }
481
482     fn add(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
483         self.gcc_add(a, b)
484     }
485
486     fn fadd(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
487         a + b
488     }
489
490     fn sub(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
491         self.gcc_sub(a, b)
492     }
493
494     fn fsub(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
495         a - b
496     }
497
498     fn mul(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
499         self.gcc_mul(a, b)
500     }
501
502     fn fmul(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
503         a * b
504     }
505
506     fn udiv(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
507         self.gcc_udiv(a, b)
508     }
509
510     fn exactudiv(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
511         // TODO(antoyo): poison if not exact.
512         let a_type = a.get_type().to_unsigned(self);
513         let a = self.gcc_int_cast(a, a_type);
514         let b_type = b.get_type().to_unsigned(self);
515         let b = self.gcc_int_cast(b, b_type);
516         a / b
517     }
518
519     fn sdiv(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
520         self.gcc_sdiv(a, b)
521     }
522
523     fn exactsdiv(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
524         // TODO(antoyo): poison if not exact.
525         // FIXME(antoyo): rustc_codegen_ssa::mir::intrinsic uses different types for a and b but they
526         // should be the same.
527         let typ = a.get_type().to_signed(self);
528         let b = self.context.new_cast(None, b, typ);
529         a / b
530     }
531
532     fn fdiv(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
533         a / b
534     }
535
536     fn urem(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
537         self.gcc_urem(a, b)
538     }
539
540     fn srem(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
541         self.gcc_srem(a, b)
542     }
543
544     fn frem(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
545         if a.get_type().is_compatible_with(self.cx.float_type) {
546             let fmodf = self.context.get_builtin_function("fmodf");
547             // FIXME(antoyo): this seems to produce the wrong result.
548             return self.context.new_call(None, fmodf, &[a, b]);
549         }
550         assert_eq!(a.get_type().unqualified(), self.cx.double_type);
551
552         let fmod = self.context.get_builtin_function("fmod");
553         return self.context.new_call(None, fmod, &[a, b]);
554     }
555
556     fn shl(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
557         self.gcc_shl(a, b)
558     }
559
560     fn lshr(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
561         self.gcc_lshr(a, b)
562     }
563
564     fn ashr(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
565         // TODO(antoyo): check whether behavior is an arithmetic shift for >> .
566         // It seems to be if the value is signed.
567         self.gcc_lshr(a, b)
568     }
569
570     fn and(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
571         self.gcc_and(a, b)
572     }
573
574     fn or(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
575         self.cx.gcc_or(a, b)
576     }
577
578     fn xor(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
579         self.gcc_xor(a, b)
580     }
581
582     fn neg(&mut self, a: RValue<'gcc>) -> RValue<'gcc> {
583         self.gcc_neg(a)
584     }
585
586     fn fneg(&mut self, a: RValue<'gcc>) -> RValue<'gcc> {
587         self.cx.context.new_unary_op(None, UnaryOp::Minus, a.get_type(), a)
588     }
589
590     fn not(&mut self, a: RValue<'gcc>) -> RValue<'gcc> {
591         self.gcc_not(a)
592     }
593
594     fn unchecked_sadd(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
595         a + b
596     }
597
598     fn unchecked_uadd(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
599         self.gcc_add(a, b)
600     }
601
602     fn unchecked_ssub(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
603         a - b
604     }
605
606     fn unchecked_usub(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
607         // TODO(antoyo): should generate poison value?
608         self.gcc_sub(a, b)
609     }
610
611     fn unchecked_smul(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
612         a * b
613     }
614
615     fn unchecked_umul(&mut self, a: RValue<'gcc>, b: RValue<'gcc>) -> RValue<'gcc> {
616         a * b
617     }
618
619     fn fadd_fast(&mut self, _lhs: RValue<'gcc>, _rhs: RValue<'gcc>) -> RValue<'gcc> {
620         unimplemented!();
621     }
622
623     fn fsub_fast(&mut self, _lhs: RValue<'gcc>, _rhs: RValue<'gcc>) -> RValue<'gcc> {
624         unimplemented!();
625     }
626
627     fn fmul_fast(&mut self, _lhs: RValue<'gcc>, _rhs: RValue<'gcc>) -> RValue<'gcc> {
628         unimplemented!();
629     }
630
631     fn fdiv_fast(&mut self, _lhs: RValue<'gcc>, _rhs: RValue<'gcc>) -> RValue<'gcc> {
632         unimplemented!();
633     }
634
635     fn frem_fast(&mut self, _lhs: RValue<'gcc>, _rhs: RValue<'gcc>) -> RValue<'gcc> {
636         unimplemented!();
637     }
638
639     fn checked_binop(&mut self, oop: OverflowOp, typ: Ty<'_>, lhs: Self::Value, rhs: Self::Value) -> (Self::Value, Self::Value) {
640         self.gcc_checked_binop(oop, typ, lhs, rhs)
641     }
642
643     fn alloca(&mut self, ty: Type<'gcc>, align: Align) -> RValue<'gcc> {
644         // FIXME(antoyo): this check that we don't call get_aligned() a second time on a type.
645         // Ideally, we shouldn't need to do this check.
646         let aligned_type =
647             if ty == self.cx.u128_type || ty == self.cx.i128_type {
648                 ty
649             }
650             else {
651                 ty.get_aligned(align.bytes())
652             };
653         // TODO(antoyo): It might be better to return a LValue, but fixing the rustc API is non-trivial.
654         self.stack_var_count.set(self.stack_var_count.get() + 1);
655         self.current_func().new_local(None, aligned_type, &format!("stack_var_{}", self.stack_var_count.get())).get_address(None)
656     }
657
658     fn byte_array_alloca(&mut self, _len: RValue<'gcc>, _align: Align) -> RValue<'gcc> {
659         unimplemented!();
660     }
661
662     fn load(&mut self, pointee_ty: Type<'gcc>, ptr: RValue<'gcc>, _align: Align) -> RValue<'gcc> {
663         let block = self.llbb();
664         let function = block.get_function();
665         // NOTE: instead of returning the dereference here, we have to assign it to a variable in
666         // the current basic block. Otherwise, it could be used in another basic block, causing a
667         // dereference after a drop, for instance.
668         // TODO(antoyo): handle align of the load instruction.
669         let ptr = self.context.new_cast(None, ptr, pointee_ty.make_pointer());
670         let deref = ptr.dereference(None).to_rvalue();
671         unsafe { RETURN_VALUE_COUNT += 1 };
672         let loaded_value = function.new_local(None, pointee_ty, &format!("loadedValue{}", unsafe { RETURN_VALUE_COUNT }));
673         block.add_assignment(None, loaded_value, deref);
674         loaded_value.to_rvalue()
675     }
676
677     fn volatile_load(&mut self, _ty: Type<'gcc>, ptr: RValue<'gcc>) -> RValue<'gcc> {
678         // TODO(antoyo): use ty.
679         let ptr = self.context.new_cast(None, ptr, ptr.get_type().make_volatile());
680         ptr.dereference(None).to_rvalue()
681     }
682
683     fn atomic_load(&mut self, _ty: Type<'gcc>, ptr: RValue<'gcc>, order: AtomicOrdering, size: Size) -> RValue<'gcc> {
684         // TODO(antoyo): use ty.
685         // TODO(antoyo): handle alignment.
686         let atomic_load = self.context.get_builtin_function(&format!("__atomic_load_{}", size.bytes()));
687         let ordering = self.context.new_rvalue_from_int(self.i32_type, order.to_gcc());
688
689         let volatile_const_void_ptr_type = self.context.new_type::<()>()
690             .make_const()
691             .make_volatile()
692             .make_pointer();
693         let ptr = self.context.new_cast(None, ptr, volatile_const_void_ptr_type);
694         self.context.new_call(None, atomic_load, &[ptr, ordering])
695     }
696
697     fn load_operand(&mut self, place: PlaceRef<'tcx, RValue<'gcc>>) -> OperandRef<'tcx, RValue<'gcc>> {
698         assert_eq!(place.llextra.is_some(), place.layout.is_unsized());
699
700         if place.layout.is_zst() {
701             return OperandRef::new_zst(self, place.layout);
702         }
703
704         fn scalar_load_metadata<'a, 'gcc, 'tcx>(bx: &mut Builder<'a, 'gcc, 'tcx>, load: RValue<'gcc>, scalar: &abi::Scalar) {
705             let vr = scalar.valid_range(bx);
706             match scalar.primitive() {
707                 abi::Int(..) => {
708                     if !scalar.is_always_valid(bx) {
709                         bx.range_metadata(load, vr);
710                     }
711                 }
712                 abi::Pointer(_) if vr.start < vr.end && !vr.contains(0) => {
713                     bx.nonnull_metadata(load);
714                 }
715                 _ => {}
716             }
717         }
718
719         let val =
720             if let Some(llextra) = place.llextra {
721                 OperandValue::Ref(place.llval, Some(llextra), place.align)
722             }
723             else if place.layout.is_gcc_immediate() {
724                 let load = self.load(
725                     place.layout.gcc_type(self, false),
726                     place.llval,
727                     place.align,
728                 );
729                 if let abi::Abi::Scalar(ref scalar) = place.layout.abi {
730                     scalar_load_metadata(self, load, scalar);
731                 }
732                 OperandValue::Immediate(self.to_immediate(load, place.layout))
733             }
734             else if let abi::Abi::ScalarPair(ref a, ref b) = place.layout.abi {
735                 let b_offset = a.size(self).align_to(b.align(self).abi);
736                 let pair_type = place.layout.gcc_type(self, false);
737
738                 let mut load = |i, scalar: &abi::Scalar, align| {
739                     let llptr = self.struct_gep(pair_type, place.llval, i as u64);
740                     let llty = place.layout.scalar_pair_element_gcc_type(self, i, false);
741                     let load = self.load(llty, llptr, align);
742                     scalar_load_metadata(self, load, scalar);
743                     if scalar.is_bool() { self.trunc(load, self.type_i1()) } else { load }
744                 };
745
746                 OperandValue::Pair(
747                     load(0, a, place.align),
748                     load(1, b, place.align.restrict_for_offset(b_offset)),
749                 )
750             }
751             else {
752                 OperandValue::Ref(place.llval, None, place.align)
753             };
754
755         OperandRef { val, layout: place.layout }
756     }
757
758     fn write_operand_repeatedly(&mut self, cg_elem: OperandRef<'tcx, RValue<'gcc>>, count: u64, dest: PlaceRef<'tcx, RValue<'gcc>>) {
759         let zero = self.const_usize(0);
760         let count = self.const_usize(count);
761         let start = dest.project_index(self, zero).llval;
762         let end = dest.project_index(self, count).llval;
763
764         let header_bb = self.append_sibling_block("repeat_loop_header");
765         let body_bb = self.append_sibling_block("repeat_loop_body");
766         let next_bb = self.append_sibling_block("repeat_loop_next");
767
768         let ptr_type = start.get_type();
769         let current = self.llbb().get_function().new_local(None, ptr_type, "loop_var");
770         let current_val = current.to_rvalue();
771         self.assign(current, start);
772
773         self.br(header_bb);
774
775         self.switch_to_block(header_bb);
776         let keep_going = self.icmp(IntPredicate::IntNE, current_val, end);
777         self.cond_br(keep_going, body_bb, next_bb);
778
779         self.switch_to_block(body_bb);
780         let align = dest.align.restrict_for_offset(dest.layout.field(self.cx(), 0).size);
781         cg_elem.val.store(self, PlaceRef::new_sized_aligned(current_val, cg_elem.layout, align));
782
783         let next = self.inbounds_gep(self.backend_type(cg_elem.layout), current.to_rvalue(), &[self.const_usize(1)]);
784         self.llbb().add_assignment(None, current, next);
785         self.br(header_bb);
786
787         self.switch_to_block(next_bb);
788     }
789
790     fn range_metadata(&mut self, _load: RValue<'gcc>, _range: WrappingRange) {
791         // TODO(antoyo)
792     }
793
794     fn nonnull_metadata(&mut self, _load: RValue<'gcc>) {
795         // TODO(antoyo)
796     }
797
798     fn store(&mut self, val: RValue<'gcc>, ptr: RValue<'gcc>, align: Align) -> RValue<'gcc> {
799         self.store_with_flags(val, ptr, align, MemFlags::empty())
800     }
801
802     fn store_with_flags(&mut self, val: RValue<'gcc>, ptr: RValue<'gcc>, align: Align, _flags: MemFlags) -> RValue<'gcc> {
803         let ptr = self.check_store(val, ptr);
804         let destination = ptr.dereference(None);
805         // NOTE: libgccjit does not support specifying the alignment on the assignment, so we cast
806         // to type so it gets the proper alignment.
807         let destination_type = destination.to_rvalue().get_type().unqualified();
808         let aligned_type = destination_type.get_aligned(align.bytes()).make_pointer();
809         let aligned_destination = self.cx.context.new_bitcast(None, ptr, aligned_type);
810         let aligned_destination = aligned_destination.dereference(None);
811         self.llbb().add_assignment(None, aligned_destination, val);
812         // TODO(antoyo): handle align and flags.
813         // NOTE: dummy value here since it's never used. FIXME(antoyo): API should not return a value here?
814         self.cx.context.new_rvalue_zero(self.type_i32())
815     }
816
817     fn atomic_store(&mut self, value: RValue<'gcc>, ptr: RValue<'gcc>, order: AtomicOrdering, size: Size) {
818         // TODO(antoyo): handle alignment.
819         let atomic_store = self.context.get_builtin_function(&format!("__atomic_store_{}", size.bytes()));
820         let ordering = self.context.new_rvalue_from_int(self.i32_type, order.to_gcc());
821         let volatile_const_void_ptr_type = self.context.new_type::<()>()
822             .make_volatile()
823             .make_pointer();
824         let ptr = self.context.new_cast(None, ptr, volatile_const_void_ptr_type);
825
826         // FIXME(antoyo): fix libgccjit to allow comparing an integer type with an aligned integer type because
827         // the following cast is required to avoid this error:
828         // gcc_jit_context_new_call: mismatching types for argument 2 of function "__atomic_store_4": assignment to param arg1 (type: int) from loadedValue3577 (type: unsigned int  __attribute__((aligned(4))))
829         let int_type = atomic_store.get_param(1).to_rvalue().get_type();
830         let value = self.context.new_cast(None, value, int_type);
831         self.llbb()
832             .add_eval(None, self.context.new_call(None, atomic_store, &[ptr, value, ordering]));
833     }
834
835     fn gep(&mut self, _typ: Type<'gcc>, ptr: RValue<'gcc>, indices: &[RValue<'gcc>]) -> RValue<'gcc> {
836         let mut result = ptr;
837         for index in indices {
838             result = self.context.new_array_access(None, result, *index).get_address(None).to_rvalue();
839         }
840         result
841     }
842
843     fn inbounds_gep(&mut self, _typ: Type<'gcc>, ptr: RValue<'gcc>, indices: &[RValue<'gcc>]) -> RValue<'gcc> {
844         // FIXME(antoyo): would be safer if doing the same thing (loop) as gep.
845         // TODO(antoyo): specify inbounds somehow.
846         match indices.len() {
847             1 => {
848                 self.context.new_array_access(None, ptr, indices[0]).get_address(None)
849             },
850             2 => {
851                 let array = ptr.dereference(None); // TODO(antoyo): assert that first index is 0?
852                 self.context.new_array_access(None, array, indices[1]).get_address(None)
853             },
854             _ => unimplemented!(),
855         }
856     }
857
858     fn struct_gep(&mut self, value_type: Type<'gcc>, ptr: RValue<'gcc>, idx: u64) -> RValue<'gcc> {
859         // FIXME(antoyo): it would be better if the API only called this on struct, not on arrays.
860         assert_eq!(idx as usize as u64, idx);
861         let value = ptr.dereference(None).to_rvalue();
862
863         if value_type.dyncast_array().is_some() {
864             let index = self.context.new_rvalue_from_long(self.u64_type, i64::try_from(idx).expect("i64::try_from"));
865             let element = self.context.new_array_access(None, value, index);
866             element.get_address(None)
867         }
868         else if let Some(vector_type) = value_type.dyncast_vector() {
869             let array_type = vector_type.get_element_type().make_pointer();
870             let array = self.bitcast(ptr, array_type);
871             let index = self.context.new_rvalue_from_long(self.u64_type, i64::try_from(idx).expect("i64::try_from"));
872             let element = self.context.new_array_access(None, array, index);
873             element.get_address(None)
874         }
875         else if let Some(struct_type) = value_type.is_struct() {
876             ptr.dereference_field(None, struct_type.get_field(idx as i32)).get_address(None)
877         }
878         else {
879             panic!("Unexpected type {:?}", value_type);
880         }
881     }
882
883     /* Casts */
884     fn trunc(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
885         // TODO(antoyo): check that it indeed truncate the value.
886         self.gcc_int_cast(value, dest_ty)
887     }
888
889     fn sext(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
890         // TODO(antoyo): check that it indeed sign extend the value.
891         if dest_ty.dyncast_vector().is_some() {
892             // TODO(antoyo): nothing to do as it is only for LLVM?
893             return value;
894         }
895         self.context.new_cast(None, value, dest_ty)
896     }
897
898     fn fptoui(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
899         self.gcc_float_to_uint_cast(value, dest_ty)
900     }
901
902     fn fptosi(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
903         self.gcc_float_to_int_cast(value, dest_ty)
904     }
905
906     fn uitofp(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
907         self.gcc_uint_to_float_cast(value, dest_ty)
908     }
909
910     fn sitofp(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
911         self.gcc_int_to_float_cast(value, dest_ty)
912     }
913
914     fn fptrunc(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
915         // TODO(antoyo): make sure it truncates.
916         self.context.new_cast(None, value, dest_ty)
917     }
918
919     fn fpext(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
920         self.context.new_cast(None, value, dest_ty)
921     }
922
923     fn ptrtoint(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
924         let usize_value = self.cx.const_bitcast(value, self.cx.type_isize());
925         self.intcast(usize_value, dest_ty, false)
926     }
927
928     fn inttoptr(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
929         let usize_value = self.intcast(value, self.cx.type_isize(), false);
930         self.cx.const_bitcast(usize_value, dest_ty)
931     }
932
933     fn bitcast(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
934         self.cx.const_bitcast(value, dest_ty)
935     }
936
937     fn intcast(&mut self, value: RValue<'gcc>, dest_typ: Type<'gcc>, _is_signed: bool) -> RValue<'gcc> {
938         // NOTE: is_signed is for value, not dest_typ.
939         self.gcc_int_cast(value, dest_typ)
940     }
941
942     fn pointercast(&mut self, value: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
943         let val_type = value.get_type();
944         match (type_is_pointer(val_type), type_is_pointer(dest_ty)) {
945             (false, true) => {
946                 // NOTE: Projecting a field of a pointer type will attempt a cast from a signed char to
947                 // a pointer, which is not supported by gccjit.
948                 return self.cx.context.new_cast(None, self.inttoptr(value, val_type.make_pointer()), dest_ty);
949             },
950             (false, false) => {
951                 // When they are not pointers, we want a transmute (or reinterpret_cast).
952                 self.bitcast(value, dest_ty)
953             },
954             (true, true) => self.cx.context.new_cast(None, value, dest_ty),
955             (true, false) => unimplemented!(),
956         }
957     }
958
959     /* Comparisons */
960     fn icmp(&mut self, op: IntPredicate, lhs: RValue<'gcc>, rhs: RValue<'gcc>) -> RValue<'gcc> {
961         self.gcc_icmp(op, lhs, rhs)
962     }
963
964     fn fcmp(&mut self, op: RealPredicate, lhs: RValue<'gcc>, rhs: RValue<'gcc>) -> RValue<'gcc> {
965         self.context.new_comparison(None, op.to_gcc_comparison(), lhs, rhs)
966     }
967
968     /* Miscellaneous instructions */
969     fn memcpy(&mut self, dst: RValue<'gcc>, _dst_align: Align, src: RValue<'gcc>, _src_align: Align, size: RValue<'gcc>, flags: MemFlags) {
970         assert!(!flags.contains(MemFlags::NONTEMPORAL), "non-temporal memcpy not supported");
971         let size = self.intcast(size, self.type_size_t(), false);
972         let _is_volatile = flags.contains(MemFlags::VOLATILE);
973         let dst = self.pointercast(dst, self.type_i8p());
974         let src = self.pointercast(src, self.type_ptr_to(self.type_void()));
975         let memcpy = self.context.get_builtin_function("memcpy");
976         // TODO(antoyo): handle aligns and is_volatile.
977         self.block.add_eval(None, self.context.new_call(None, memcpy, &[dst, src, size]));
978     }
979
980     fn memmove(&mut self, dst: RValue<'gcc>, dst_align: Align, src: RValue<'gcc>, src_align: Align, size: RValue<'gcc>, flags: MemFlags) {
981         if flags.contains(MemFlags::NONTEMPORAL) {
982             // HACK(nox): This is inefficient but there is no nontemporal memmove.
983             let val = self.load(src.get_type().get_pointee().expect("get_pointee"), src, src_align);
984             let ptr = self.pointercast(dst, self.type_ptr_to(self.val_ty(val)));
985             self.store_with_flags(val, ptr, dst_align, flags);
986             return;
987         }
988         let size = self.intcast(size, self.type_size_t(), false);
989         let _is_volatile = flags.contains(MemFlags::VOLATILE);
990         let dst = self.pointercast(dst, self.type_i8p());
991         let src = self.pointercast(src, self.type_ptr_to(self.type_void()));
992
993         let memmove = self.context.get_builtin_function("memmove");
994         // TODO(antoyo): handle is_volatile.
995         self.block.add_eval(None, self.context.new_call(None, memmove, &[dst, src, size]));
996     }
997
998     fn memset(&mut self, ptr: RValue<'gcc>, fill_byte: RValue<'gcc>, size: RValue<'gcc>, _align: Align, flags: MemFlags) {
999         let _is_volatile = flags.contains(MemFlags::VOLATILE);
1000         let ptr = self.pointercast(ptr, self.type_i8p());
1001         let memset = self.context.get_builtin_function("memset");
1002         // TODO(antoyo): handle align and is_volatile.
1003         let fill_byte = self.context.new_cast(None, fill_byte, self.i32_type);
1004         let size = self.intcast(size, self.type_size_t(), false);
1005         self.block.add_eval(None, self.context.new_call(None, memset, &[ptr, fill_byte, size]));
1006     }
1007
1008     fn select(&mut self, cond: RValue<'gcc>, then_val: RValue<'gcc>, mut else_val: RValue<'gcc>) -> RValue<'gcc> {
1009         let func = self.current_func();
1010         let variable = func.new_local(None, then_val.get_type(), "selectVar");
1011         let then_block = func.new_block("then");
1012         let else_block = func.new_block("else");
1013         let after_block = func.new_block("after");
1014         self.llbb().end_with_conditional(None, cond, then_block, else_block);
1015
1016         then_block.add_assignment(None, variable, then_val);
1017         then_block.end_with_jump(None, after_block);
1018
1019         if !then_val.get_type().is_compatible_with(else_val.get_type()) {
1020             else_val = self.context.new_cast(None, else_val, then_val.get_type());
1021         }
1022         else_block.add_assignment(None, variable, else_val);
1023         else_block.end_with_jump(None, after_block);
1024
1025         // NOTE: since jumps were added in a place rustc does not expect, the current block in the
1026         // state need to be updated.
1027         self.switch_to_block(after_block);
1028
1029         variable.to_rvalue()
1030     }
1031
1032     #[allow(dead_code)]
1033     fn va_arg(&mut self, _list: RValue<'gcc>, _ty: Type<'gcc>) -> RValue<'gcc> {
1034         unimplemented!();
1035     }
1036
1037     fn extract_element(&mut self, _vec: RValue<'gcc>, _idx: RValue<'gcc>) -> RValue<'gcc> {
1038         unimplemented!();
1039     }
1040
1041     fn vector_splat(&mut self, _num_elts: usize, _elt: RValue<'gcc>) -> RValue<'gcc> {
1042         unimplemented!();
1043     }
1044
1045     fn extract_value(&mut self, aggregate_value: RValue<'gcc>, idx: u64) -> RValue<'gcc> {
1046         // FIXME(antoyo): it would be better if the API only called this on struct, not on arrays.
1047         assert_eq!(idx as usize as u64, idx);
1048         let value_type = aggregate_value.get_type();
1049
1050         if value_type.dyncast_array().is_some() {
1051             let index = self.context.new_rvalue_from_long(self.u64_type, i64::try_from(idx).expect("i64::try_from"));
1052             let element = self.context.new_array_access(None, aggregate_value, index);
1053             element.get_address(None)
1054         }
1055         else if value_type.dyncast_vector().is_some() {
1056             panic!();
1057         }
1058         else if let Some(pointer_type) = value_type.get_pointee() {
1059             if let Some(struct_type) = pointer_type.is_struct() {
1060                 // NOTE: hack to workaround a limitation of the rustc API: see comment on
1061                 // CodegenCx.structs_as_pointer
1062                 aggregate_value.dereference_field(None, struct_type.get_field(idx as i32)).to_rvalue()
1063             }
1064             else {
1065                 panic!("Unexpected type {:?}", value_type);
1066             }
1067         }
1068         else if let Some(struct_type) = value_type.is_struct() {
1069             aggregate_value.access_field(None, struct_type.get_field(idx as i32)).to_rvalue()
1070         }
1071         else {
1072             panic!("Unexpected type {:?}", value_type);
1073         }
1074     }
1075
1076     fn insert_value(&mut self, aggregate_value: RValue<'gcc>, value: RValue<'gcc>, idx: u64) -> RValue<'gcc> {
1077         // FIXME(antoyo): it would be better if the API only called this on struct, not on arrays.
1078         assert_eq!(idx as usize as u64, idx);
1079         let value_type = aggregate_value.get_type();
1080
1081         let lvalue =
1082             if value_type.dyncast_array().is_some() {
1083                 let index = self.context.new_rvalue_from_long(self.u64_type, i64::try_from(idx).expect("i64::try_from"));
1084                 self.context.new_array_access(None, aggregate_value, index)
1085             }
1086             else if value_type.dyncast_vector().is_some() {
1087                 panic!();
1088             }
1089             else if let Some(pointer_type) = value_type.get_pointee() {
1090                 if let Some(struct_type) = pointer_type.is_struct() {
1091                     // NOTE: hack to workaround a limitation of the rustc API: see comment on
1092                     // CodegenCx.structs_as_pointer
1093                     aggregate_value.dereference_field(None, struct_type.get_field(idx as i32))
1094                 }
1095                 else {
1096                     panic!("Unexpected type {:?}", value_type);
1097                 }
1098             }
1099             else {
1100                 panic!("Unexpected type {:?}", value_type);
1101             };
1102
1103         let lvalue_type = lvalue.to_rvalue().get_type();
1104         let value =
1105             // NOTE: sometimes, rustc will create a value with the wrong type.
1106             if lvalue_type != value.get_type() {
1107                 self.context.new_cast(None, value, lvalue_type)
1108             }
1109             else {
1110                 value
1111             };
1112
1113         self.llbb().add_assignment(None, lvalue, value);
1114
1115         aggregate_value
1116     }
1117
1118     fn set_personality_fn(&mut self, _personality: RValue<'gcc>) {
1119         // TODO(antoyo)
1120     }
1121
1122     fn cleanup_landing_pad(&mut self, _pers_fn: RValue<'gcc>) -> (RValue<'gcc>, RValue<'gcc>) {
1123         (
1124             self.current_func().new_local(None, self.u8_type.make_pointer(), "landing_pad0")
1125                 .to_rvalue(),
1126             self.current_func().new_local(None, self.i32_type, "landing_pad1").to_rvalue(),
1127         )
1128         // TODO(antoyo): Properly implement unwinding.
1129         // the above is just to make the compilation work as it seems
1130         // rustc_codegen_ssa now calls the unwinding builder methods even on panic=abort.
1131     }
1132
1133     fn resume(&mut self, _exn0: RValue<'gcc>, _exn1: RValue<'gcc>) {
1134         // TODO(bjorn3): Properly implement unwinding.
1135         self.unreachable();
1136     }
1137
1138     fn cleanup_pad(&mut self, _parent: Option<RValue<'gcc>>, _args: &[RValue<'gcc>]) -> Funclet {
1139         unimplemented!();
1140     }
1141
1142     fn cleanup_ret(&mut self, _funclet: &Funclet, _unwind: Option<Block<'gcc>>) {
1143         unimplemented!();
1144     }
1145
1146     fn catch_pad(&mut self, _parent: RValue<'gcc>, _args: &[RValue<'gcc>]) -> Funclet {
1147         unimplemented!();
1148     }
1149
1150     fn catch_switch(
1151         &mut self,
1152         _parent: Option<RValue<'gcc>>,
1153         _unwind: Option<Block<'gcc>>,
1154         _handlers: &[Block<'gcc>],
1155     ) -> RValue<'gcc> {
1156         unimplemented!();
1157     }
1158
1159     // Atomic Operations
1160     fn atomic_cmpxchg(&mut self, dst: RValue<'gcc>, cmp: RValue<'gcc>, src: RValue<'gcc>, order: AtomicOrdering, failure_order: AtomicOrdering, weak: bool) -> RValue<'gcc> {
1161         let expected = self.current_func().new_local(None, cmp.get_type(), "expected");
1162         self.llbb().add_assignment(None, expected, cmp);
1163         let success = self.compare_exchange(dst, expected, src, order, failure_order, weak);
1164
1165         let pair_type = self.cx.type_struct(&[src.get_type(), self.bool_type], false);
1166         let result = self.current_func().new_local(None, pair_type, "atomic_cmpxchg_result");
1167         let align = Align::from_bits(64).expect("align"); // TODO(antoyo): use good align.
1168
1169         let value_type = result.to_rvalue().get_type();
1170         if let Some(struct_type) = value_type.is_struct() {
1171             self.store(success, result.access_field(None, struct_type.get_field(1)).get_address(None), align);
1172             // NOTE: since success contains the call to the intrinsic, it must be stored before
1173             // expected so that we store expected after the call.
1174             self.store(expected.to_rvalue(), result.access_field(None, struct_type.get_field(0)).get_address(None), align);
1175         }
1176         // TODO(antoyo): handle when value is not a struct.
1177
1178         result.to_rvalue()
1179     }
1180
1181     fn atomic_rmw(&mut self, op: AtomicRmwBinOp, dst: RValue<'gcc>, src: RValue<'gcc>, order: AtomicOrdering) -> RValue<'gcc> {
1182         let size = src.get_type().get_size();
1183         let name =
1184             match op {
1185                 AtomicRmwBinOp::AtomicXchg => format!("__atomic_exchange_{}", size),
1186                 AtomicRmwBinOp::AtomicAdd => format!("__atomic_fetch_add_{}", size),
1187                 AtomicRmwBinOp::AtomicSub => format!("__atomic_fetch_sub_{}", size),
1188                 AtomicRmwBinOp::AtomicAnd => format!("__atomic_fetch_and_{}", size),
1189                 AtomicRmwBinOp::AtomicNand => format!("__atomic_fetch_nand_{}", size),
1190                 AtomicRmwBinOp::AtomicOr => format!("__atomic_fetch_or_{}", size),
1191                 AtomicRmwBinOp::AtomicXor => format!("__atomic_fetch_xor_{}", size),
1192                 AtomicRmwBinOp::AtomicMax => return self.atomic_extremum(ExtremumOperation::Max, dst, src, order),
1193                 AtomicRmwBinOp::AtomicMin => return self.atomic_extremum(ExtremumOperation::Min, dst, src, order),
1194                 AtomicRmwBinOp::AtomicUMax => return self.atomic_extremum(ExtremumOperation::Max, dst, src, order),
1195                 AtomicRmwBinOp::AtomicUMin => return self.atomic_extremum(ExtremumOperation::Min, dst, src, order),
1196             };
1197
1198
1199         let atomic_function = self.context.get_builtin_function(name);
1200         let order = self.context.new_rvalue_from_int(self.i32_type, order.to_gcc());
1201
1202         let void_ptr_type = self.context.new_type::<*mut ()>();
1203         let volatile_void_ptr_type = void_ptr_type.make_volatile();
1204         let dst = self.context.new_cast(None, dst, volatile_void_ptr_type);
1205         // FIXME(antoyo): not sure why, but we have the wrong type here.
1206         let new_src_type = atomic_function.get_param(1).to_rvalue().get_type();
1207         let src = self.context.new_cast(None, src, new_src_type);
1208         let res = self.context.new_call(None, atomic_function, &[dst, src, order]);
1209         self.context.new_cast(None, res, src.get_type())
1210     }
1211
1212     fn atomic_fence(&mut self, order: AtomicOrdering, scope: SynchronizationScope) {
1213         let name =
1214             match scope {
1215                 SynchronizationScope::SingleThread => "__atomic_signal_fence",
1216                 SynchronizationScope::CrossThread => "__atomic_thread_fence",
1217             };
1218         let thread_fence = self.context.get_builtin_function(name);
1219         let order = self.context.new_rvalue_from_int(self.i32_type, order.to_gcc());
1220         self.llbb().add_eval(None, self.context.new_call(None, thread_fence, &[order]));
1221     }
1222
1223     fn set_invariant_load(&mut self, load: RValue<'gcc>) {
1224         // NOTE: Hack to consider vtable function pointer as non-global-variable function pointer.
1225         self.normal_function_addresses.borrow_mut().insert(load);
1226         // TODO(antoyo)
1227     }
1228
1229     fn lifetime_start(&mut self, _ptr: RValue<'gcc>, _size: Size) {
1230         // TODO(antoyo)
1231     }
1232
1233     fn lifetime_end(&mut self, _ptr: RValue<'gcc>, _size: Size) {
1234         // TODO(antoyo)
1235     }
1236
1237     fn call(
1238         &mut self,
1239         _typ: Type<'gcc>,
1240         fn_abi: Option<&FnAbi<'tcx, Ty<'tcx>>>,
1241         func: RValue<'gcc>,
1242         args: &[RValue<'gcc>],
1243         funclet: Option<&Funclet>,
1244     ) -> RValue<'gcc> {
1245         // FIXME(antoyo): remove when having a proper API.
1246         let gcc_func = unsafe { std::mem::transmute(func) };
1247         let call = if self.functions.borrow().values().any(|value| *value == gcc_func) {
1248             self.function_call(func, args, funclet)
1249         }
1250         else {
1251             // If it's a not function that was defined, it's a function pointer.
1252             self.function_ptr_call(func, args, funclet)
1253         };
1254         if let Some(_fn_abi) = fn_abi {
1255             // TODO(bjorn3): Apply function attributes
1256         }
1257         call
1258     }
1259
1260     fn zext(&mut self, value: RValue<'gcc>, dest_typ: Type<'gcc>) -> RValue<'gcc> {
1261         // FIXME(antoyo): this does not zero-extend.
1262         if value.get_type().is_bool() && dest_typ.is_i8(&self.cx) {
1263             // FIXME(antoyo): hack because base::from_immediate converts i1 to i8.
1264             // Fix the code in codegen_ssa::base::from_immediate.
1265             return value;
1266         }
1267         self.gcc_int_cast(value, dest_typ)
1268     }
1269
1270     fn cx(&self) -> &CodegenCx<'gcc, 'tcx> {
1271         self.cx
1272     }
1273
1274     fn do_not_inline(&mut self, _llret: RValue<'gcc>) {
1275         // FIXME(bjorn3): implement
1276     }
1277
1278     fn set_span(&mut self, _span: Span) {}
1279
1280     fn from_immediate(&mut self, val: Self::Value) -> Self::Value {
1281         if self.cx().val_ty(val) == self.cx().type_i1() {
1282             self.zext(val, self.cx().type_i8())
1283         }
1284         else {
1285             val
1286         }
1287     }
1288
1289     fn to_immediate_scalar(&mut self, val: Self::Value, scalar: abi::Scalar) -> Self::Value {
1290         if scalar.is_bool() {
1291             return self.trunc(val, self.cx().type_i1());
1292         }
1293         val
1294     }
1295
1296     fn fptoui_sat(&mut self, val: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
1297         self.fptoint_sat(false, val, dest_ty)
1298     }
1299
1300     fn fptosi_sat(&mut self, val: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
1301         self.fptoint_sat(true, val, dest_ty)
1302     }
1303
1304     fn instrprof_increment(&mut self, _fn_name: RValue<'gcc>, _hash: RValue<'gcc>, _num_counters: RValue<'gcc>, _index: RValue<'gcc>) {
1305         unimplemented!();
1306     }
1307 }
1308
1309 impl<'a, 'gcc, 'tcx> Builder<'a, 'gcc, 'tcx> {
1310     fn fptoint_sat(&mut self, signed: bool, val: RValue<'gcc>, dest_ty: Type<'gcc>) -> RValue<'gcc> {
1311         let src_ty = self.cx.val_ty(val);
1312         let (float_ty, int_ty) = if self.cx.type_kind(src_ty) == TypeKind::Vector {
1313             assert_eq!(self.cx.vector_length(src_ty), self.cx.vector_length(dest_ty));
1314             (self.cx.element_type(src_ty), self.cx.element_type(dest_ty))
1315         } else {
1316             (src_ty, dest_ty)
1317         };
1318
1319         // FIXME(jistone): the following was originally the fallback SSA implementation, before LLVM 13
1320         // added native `fptosi.sat` and `fptoui.sat` conversions, but it was used by GCC as well.
1321         // Now that LLVM always relies on its own, the code has been moved to GCC, but the comments are
1322         // still LLVM-specific. This should be updated, and use better GCC specifics if possible.
1323
1324         let int_width = self.cx.int_width(int_ty);
1325         let float_width = self.cx.float_width(float_ty);
1326         // LLVM's fpto[su]i returns undef when the input val is infinite, NaN, or does not fit into the
1327         // destination integer type after rounding towards zero. This `undef` value can cause UB in
1328         // safe code (see issue #10184), so we implement a saturating conversion on top of it:
1329         // Semantically, the mathematical value of the input is rounded towards zero to the next
1330         // mathematical integer, and then the result is clamped into the range of the destination
1331         // integer type. Positive and negative infinity are mapped to the maximum and minimum value of
1332         // the destination integer type. NaN is mapped to 0.
1333         //
1334         // Define f_min and f_max as the largest and smallest (finite) floats that are exactly equal to
1335         // a value representable in int_ty.
1336         // They are exactly equal to int_ty::{MIN,MAX} if float_ty has enough significand bits.
1337         // Otherwise, int_ty::MAX must be rounded towards zero, as it is one less than a power of two.
1338         // int_ty::MIN, however, is either zero or a negative power of two and is thus exactly
1339         // representable. Note that this only works if float_ty's exponent range is sufficiently large.
1340         // f16 or 256 bit integers would break this property. Right now the smallest float type is f32
1341         // with exponents ranging up to 127, which is barely enough for i128::MIN = -2^127.
1342         // On the other hand, f_max works even if int_ty::MAX is greater than float_ty::MAX. Because
1343         // we're rounding towards zero, we just get float_ty::MAX (which is always an integer).
1344         // This already happens today with u128::MAX = 2^128 - 1 > f32::MAX.
1345         let int_max = |signed: bool, int_width: u64| -> u128 {
1346             let shift_amount = 128 - int_width;
1347             if signed { i128::MAX as u128 >> shift_amount } else { u128::MAX >> shift_amount }
1348         };
1349         let int_min = |signed: bool, int_width: u64| -> i128 {
1350             if signed { i128::MIN >> (128 - int_width) } else { 0 }
1351         };
1352
1353         let compute_clamp_bounds_single = |signed: bool, int_width: u64| -> (u128, u128) {
1354             let rounded_min =
1355                 ieee::Single::from_i128_r(int_min(signed, int_width), Round::TowardZero);
1356             assert_eq!(rounded_min.status, Status::OK);
1357             let rounded_max =
1358                 ieee::Single::from_u128_r(int_max(signed, int_width), Round::TowardZero);
1359             assert!(rounded_max.value.is_finite());
1360             (rounded_min.value.to_bits(), rounded_max.value.to_bits())
1361         };
1362         let compute_clamp_bounds_double = |signed: bool, int_width: u64| -> (u128, u128) {
1363             let rounded_min =
1364                 ieee::Double::from_i128_r(int_min(signed, int_width), Round::TowardZero);
1365             assert_eq!(rounded_min.status, Status::OK);
1366             let rounded_max =
1367                 ieee::Double::from_u128_r(int_max(signed, int_width), Round::TowardZero);
1368             assert!(rounded_max.value.is_finite());
1369             (rounded_min.value.to_bits(), rounded_max.value.to_bits())
1370         };
1371         // To implement saturation, we perform the following steps:
1372         //
1373         // 1. Cast val to an integer with fpto[su]i. This may result in undef.
1374         // 2. Compare val to f_min and f_max, and use the comparison results to select:
1375         //  a) int_ty::MIN if val < f_min or val is NaN
1376         //  b) int_ty::MAX if val > f_max
1377         //  c) the result of fpto[su]i otherwise
1378         // 3. If val is NaN, return 0.0, otherwise return the result of step 2.
1379         //
1380         // This avoids resulting undef because values in range [f_min, f_max] by definition fit into the
1381         // destination type. It creates an undef temporary, but *producing* undef is not UB. Our use of
1382         // undef does not introduce any non-determinism either.
1383         // More importantly, the above procedure correctly implements saturating conversion.
1384         // Proof (sketch):
1385         // If val is NaN, 0 is returned by definition.
1386         // Otherwise, val is finite or infinite and thus can be compared with f_min and f_max.
1387         // This yields three cases to consider:
1388         // (1) if val in [f_min, f_max], the result of fpto[su]i is returned, which agrees with
1389         //     saturating conversion for inputs in that range.
1390         // (2) if val > f_max, then val is larger than int_ty::MAX. This holds even if f_max is rounded
1391         //     (i.e., if f_max < int_ty::MAX) because in those cases, nextUp(f_max) is already larger
1392         //     than int_ty::MAX. Because val is larger than int_ty::MAX, the return value of int_ty::MAX
1393         //     is correct.
1394         // (3) if val < f_min, then val is smaller than int_ty::MIN. As shown earlier, f_min exactly equals
1395         //     int_ty::MIN and therefore the return value of int_ty::MIN is correct.
1396         // QED.
1397
1398         let float_bits_to_llval = |bx: &mut Self, bits| {
1399             let bits_llval = match float_width {
1400                 32 => bx.cx().const_u32(bits as u32),
1401                 64 => bx.cx().const_u64(bits as u64),
1402                 n => bug!("unsupported float width {}", n),
1403             };
1404             bx.bitcast(bits_llval, float_ty)
1405         };
1406         let (f_min, f_max) = match float_width {
1407             32 => compute_clamp_bounds_single(signed, int_width),
1408             64 => compute_clamp_bounds_double(signed, int_width),
1409             n => bug!("unsupported float width {}", n),
1410         };
1411         let f_min = float_bits_to_llval(self, f_min);
1412         let f_max = float_bits_to_llval(self, f_max);
1413         let int_max = self.cx.const_uint_big(int_ty, int_max(signed, int_width));
1414         let int_min = self.cx.const_uint_big(int_ty, int_min(signed, int_width) as u128);
1415         let zero = self.cx.const_uint(int_ty, 0);
1416
1417         // If we're working with vectors, constants must be "splatted": the constant is duplicated
1418         // into each lane of the vector.  The algorithm stays the same, we are just using the
1419         // same constant across all lanes.
1420         let maybe_splat = |bx: &mut Self, val| {
1421             if bx.cx().type_kind(dest_ty) == TypeKind::Vector {
1422                 bx.vector_splat(bx.vector_length(dest_ty), val)
1423             } else {
1424                 val
1425             }
1426         };
1427         let f_min = maybe_splat(self, f_min);
1428         let f_max = maybe_splat(self, f_max);
1429         let int_max = maybe_splat(self, int_max);
1430         let int_min = maybe_splat(self, int_min);
1431         let zero = maybe_splat(self, zero);
1432
1433         // Step 1 ...
1434         let fptosui_result = if signed { self.fptosi(val, dest_ty) } else { self.fptoui(val, dest_ty) };
1435         let less_or_nan = self.fcmp(RealPredicate::RealULT, val, f_min);
1436         let greater = self.fcmp(RealPredicate::RealOGT, val, f_max);
1437
1438         // Step 2: We use two comparisons and two selects, with %s1 being the
1439         // result:
1440         //     %less_or_nan = fcmp ult %val, %f_min
1441         //     %greater = fcmp olt %val, %f_max
1442         //     %s0 = select %less_or_nan, int_ty::MIN, %fptosi_result
1443         //     %s1 = select %greater, int_ty::MAX, %s0
1444         // Note that %less_or_nan uses an *unordered* comparison. This
1445         // comparison is true if the operands are not comparable (i.e., if val is
1446         // NaN). The unordered comparison ensures that s1 becomes int_ty::MIN if
1447         // val is NaN.
1448         //
1449         // Performance note: Unordered comparison can be lowered to a "flipped"
1450         // comparison and a negation, and the negation can be merged into the
1451         // select. Therefore, it not necessarily any more expensive than an
1452         // ordered ("normal") comparison. Whether these optimizations will be
1453         // performed is ultimately up to the backend, but at least x86 does
1454         // perform them.
1455         let s0 = self.select(less_or_nan, int_min, fptosui_result);
1456         let s1 = self.select(greater, int_max, s0);
1457
1458         // Step 3: NaN replacement.
1459         // For unsigned types, the above step already yielded int_ty::MIN == 0 if val is NaN.
1460         // Therefore we only need to execute this step for signed integer types.
1461         if signed {
1462             // LLVM has no isNaN predicate, so we use (val == val) instead
1463             let cmp = self.fcmp(RealPredicate::RealOEQ, val, val);
1464             self.select(cmp, s1, zero)
1465         } else {
1466             s1
1467         }
1468     }
1469
1470     #[cfg(feature="master")]
1471     pub fn shuffle_vector(&mut self, v1: RValue<'gcc>, v2: RValue<'gcc>, mask: RValue<'gcc>) -> RValue<'gcc> {
1472         let struct_type = mask.get_type().is_struct().expect("mask of struct type");
1473
1474         // TODO(antoyo): use a recursive unqualified() here.
1475         let vector_type = v1.get_type().unqualified().dyncast_vector().expect("vector type");
1476         let element_type = vector_type.get_element_type();
1477         let vec_num_units = vector_type.get_num_units();
1478
1479         let mask_num_units = struct_type.get_field_count();
1480         let mut vector_elements = vec![];
1481         let mask_element_type =
1482             if element_type.is_integral() {
1483                 element_type
1484             }
1485             else {
1486                 #[cfg(feature="master")]
1487                 {
1488                     self.cx.type_ix(element_type.get_size() as u64 * 8)
1489                 }
1490                 #[cfg(not(feature="master"))]
1491                 self.int_type
1492             };
1493         for i in 0..mask_num_units {
1494             let field = struct_type.get_field(i as i32);
1495             vector_elements.push(self.context.new_cast(None, mask.access_field(None, field).to_rvalue(), mask_element_type));
1496         }
1497
1498         // NOTE: the mask needs to be the same length as the input vectors, so add the missing
1499         // elements in the mask if needed.
1500         for _ in mask_num_units..vec_num_units {
1501             vector_elements.push(self.context.new_rvalue_zero(mask_element_type));
1502         }
1503
1504         let array_type = self.context.new_array_type(None, element_type, vec_num_units as i32);
1505         let result_type = self.context.new_vector_type(element_type, mask_num_units as u64);
1506         let (v1, v2) =
1507             if vec_num_units < mask_num_units {
1508                 // NOTE: the mask needs to be the same length as the input vectors, so join the 2
1509                 // vectors and create a dummy second vector.
1510                 // TODO(antoyo): switch to using new_vector_access.
1511                 let array = self.context.new_bitcast(None, v1, array_type);
1512                 let mut elements = vec![];
1513                 for i in 0..vec_num_units {
1514                     elements.push(self.context.new_array_access(None, array, self.context.new_rvalue_from_int(self.int_type, i as i32)).to_rvalue());
1515                 }
1516                 // TODO(antoyo): switch to using new_vector_access.
1517                 let array = self.context.new_bitcast(None, v2, array_type);
1518                 for i in 0..(mask_num_units - vec_num_units) {
1519                     elements.push(self.context.new_array_access(None, array, self.context.new_rvalue_from_int(self.int_type, i as i32)).to_rvalue());
1520                 }
1521                 let v1 = self.context.new_rvalue_from_vector(None, result_type, &elements);
1522                 let zero = self.context.new_rvalue_zero(element_type);
1523                 let v2 = self.context.new_rvalue_from_vector(None, result_type, &vec![zero; mask_num_units]);
1524                 (v1, v2)
1525             }
1526             else {
1527                 (v1, v2)
1528             };
1529
1530         let new_mask_num_units = std::cmp::max(mask_num_units, vec_num_units);
1531         let mask_type = self.context.new_vector_type(mask_element_type, new_mask_num_units as u64);
1532         let mask = self.context.new_rvalue_from_vector(None, mask_type, &vector_elements);
1533         let result = self.context.new_rvalue_vector_perm(None, v1, v2, mask);
1534
1535         if vec_num_units != mask_num_units {
1536             // NOTE: if padding was added, only select the number of elements of the masks to
1537             // remove that padding in the result.
1538             let mut elements = vec![];
1539             // TODO(antoyo): switch to using new_vector_access.
1540             let array = self.context.new_bitcast(None, result, array_type);
1541             for i in 0..mask_num_units {
1542                 elements.push(self.context.new_array_access(None, array, self.context.new_rvalue_from_int(self.int_type, i as i32)).to_rvalue());
1543             }
1544             self.context.new_rvalue_from_vector(None, result_type, &elements)
1545         }
1546         else {
1547             result
1548         }
1549     }
1550
1551     #[cfg(not(feature="master"))]
1552     pub fn shuffle_vector(&mut self, _v1: RValue<'gcc>, _v2: RValue<'gcc>, _mask: RValue<'gcc>) -> RValue<'gcc> {
1553         unimplemented!();
1554     }
1555
1556     #[cfg(feature="master")]
1557     pub fn vector_reduce<F>(&mut self, src: RValue<'gcc>, op: F) -> RValue<'gcc>
1558     where F: Fn(RValue<'gcc>, RValue<'gcc>, &'gcc Context<'gcc>) -> RValue<'gcc>
1559     {
1560         let vector_type = src.get_type().unqualified().dyncast_vector().expect("vector type");
1561         let element_count = vector_type.get_num_units();
1562         let mut vector_elements = vec![];
1563         for i in 0..element_count {
1564             vector_elements.push(i);
1565         }
1566         let mask_type = self.context.new_vector_type(self.int_type, element_count as u64);
1567         let mut shift = 1;
1568         let mut res = src;
1569         while shift < element_count {
1570             let vector_elements: Vec<_> =
1571                 vector_elements.iter()
1572                     .map(|i| self.context.new_rvalue_from_int(self.int_type, ((i + shift) % element_count) as i32))
1573                     .collect();
1574             let mask = self.context.new_rvalue_from_vector(None, mask_type, &vector_elements);
1575             let shifted = self.context.new_rvalue_vector_perm(None, res, res, mask);
1576             shift *= 2;
1577             res = op(res, shifted, &self.context);
1578         }
1579         self.context.new_vector_access(None, res, self.context.new_rvalue_zero(self.int_type))
1580             .to_rvalue()
1581     }
1582
1583     #[cfg(not(feature="master"))]
1584     pub fn vector_reduce<F>(&mut self, src: RValue<'gcc>, op: F) -> RValue<'gcc>
1585     where F: Fn(RValue<'gcc>, RValue<'gcc>, &'gcc Context<'gcc>) -> RValue<'gcc>
1586     {
1587         unimplemented!();
1588     }
1589
1590     pub fn vector_reduce_op(&mut self, src: RValue<'gcc>, op: BinaryOp) -> RValue<'gcc> {
1591         self.vector_reduce(src, |a, b, context| context.new_binary_op(None, op, a.get_type(), a, b))
1592     }
1593
1594     pub fn vector_reduce_fadd_fast(&mut self, _acc: RValue<'gcc>, _src: RValue<'gcc>) -> RValue<'gcc> {
1595         unimplemented!();
1596     }
1597
1598     pub fn vector_reduce_fmul_fast(&mut self, _acc: RValue<'gcc>, _src: RValue<'gcc>) -> RValue<'gcc> {
1599         unimplemented!();
1600     }
1601
1602     // Inspired by Hacker's Delight min implementation.
1603     pub fn vector_reduce_min(&mut self, src: RValue<'gcc>) -> RValue<'gcc> {
1604         self.vector_reduce(src, |a, b, context| {
1605             let differences_or_zeros = difference_or_zero(a, b, context);
1606             context.new_binary_op(None, BinaryOp::Minus, a.get_type(), a, differences_or_zeros)
1607         })
1608     }
1609
1610     // Inspired by Hacker's Delight max implementation.
1611     pub fn vector_reduce_max(&mut self, src: RValue<'gcc>) -> RValue<'gcc> {
1612         self.vector_reduce(src, |a, b, context| {
1613             let differences_or_zeros = difference_or_zero(a, b, context);
1614             context.new_binary_op(None, BinaryOp::Plus, b.get_type(), b, differences_or_zeros)
1615         })
1616     }
1617
1618     pub fn vector_select(&mut self, cond: RValue<'gcc>, then_val: RValue<'gcc>, else_val: RValue<'gcc>) -> RValue<'gcc> {
1619         // cond is a vector of integers, not of bools.
1620         let cond_type = cond.get_type();
1621         let vector_type = cond_type.unqualified().dyncast_vector().expect("vector type");
1622         let num_units = vector_type.get_num_units();
1623         let element_type = vector_type.get_element_type();
1624         let zeros = vec![self.context.new_rvalue_zero(element_type); num_units];
1625         let zeros = self.context.new_rvalue_from_vector(None, cond_type, &zeros);
1626
1627         let masks = self.context.new_comparison(None, ComparisonOp::NotEquals, cond, zeros);
1628         let then_vals = masks & then_val;
1629
1630         let ones = vec![self.context.new_rvalue_one(element_type); num_units];
1631         let ones = self.context.new_rvalue_from_vector(None, cond_type, &ones);
1632         let inverted_masks = masks + ones;
1633         // NOTE: sometimes, the type of else_val can be different than the type of then_val in
1634         // libgccjit (vector of int vs vector of int32_t), but they should be the same for the AND
1635         // operation to work.
1636         let else_val = self.context.new_bitcast(None, else_val, then_val.get_type());
1637         let else_vals = inverted_masks & else_val;
1638
1639         then_vals | else_vals
1640     }
1641 }
1642
1643 fn difference_or_zero<'gcc>(a: RValue<'gcc>, b: RValue<'gcc>, context: &'gcc Context<'gcc>) -> RValue<'gcc> {
1644     let difference = a - b;
1645     let masks = context.new_comparison(None, ComparisonOp::GreaterThanEquals, b, a);
1646     difference & masks
1647 }
1648
1649 impl<'a, 'gcc, 'tcx> StaticBuilderMethods for Builder<'a, 'gcc, 'tcx> {
1650     fn get_static(&mut self, def_id: DefId) -> RValue<'gcc> {
1651         // Forward to the `get_static` method of `CodegenCx`
1652         self.cx().get_static(def_id).get_address(None)
1653     }
1654 }
1655
1656 impl<'tcx> HasParamEnv<'tcx> for Builder<'_, '_, 'tcx> {
1657     fn param_env(&self) -> ParamEnv<'tcx> {
1658         self.cx.param_env()
1659     }
1660 }
1661
1662 impl<'tcx> HasTargetSpec for Builder<'_, '_, 'tcx> {
1663     fn target_spec(&self) -> &Target {
1664         &self.cx.target_spec()
1665     }
1666 }
1667
1668 pub trait ToGccComp {
1669     fn to_gcc_comparison(&self) -> ComparisonOp;
1670 }
1671
1672 impl ToGccComp for IntPredicate {
1673     fn to_gcc_comparison(&self) -> ComparisonOp {
1674         match *self {
1675             IntPredicate::IntEQ => ComparisonOp::Equals,
1676             IntPredicate::IntNE => ComparisonOp::NotEquals,
1677             IntPredicate::IntUGT => ComparisonOp::GreaterThan,
1678             IntPredicate::IntUGE => ComparisonOp::GreaterThanEquals,
1679             IntPredicate::IntULT => ComparisonOp::LessThan,
1680             IntPredicate::IntULE => ComparisonOp::LessThanEquals,
1681             IntPredicate::IntSGT => ComparisonOp::GreaterThan,
1682             IntPredicate::IntSGE => ComparisonOp::GreaterThanEquals,
1683             IntPredicate::IntSLT => ComparisonOp::LessThan,
1684             IntPredicate::IntSLE => ComparisonOp::LessThanEquals,
1685         }
1686     }
1687 }
1688
1689 impl ToGccComp for RealPredicate {
1690     fn to_gcc_comparison(&self) -> ComparisonOp {
1691         // TODO(antoyo): check that ordered vs non-ordered is respected.
1692         match *self {
1693             RealPredicate::RealPredicateFalse => unreachable!(),
1694             RealPredicate::RealOEQ => ComparisonOp::Equals,
1695             RealPredicate::RealOGT => ComparisonOp::GreaterThan,
1696             RealPredicate::RealOGE => ComparisonOp::GreaterThanEquals,
1697             RealPredicate::RealOLT => ComparisonOp::LessThan,
1698             RealPredicate::RealOLE => ComparisonOp::LessThanEquals,
1699             RealPredicate::RealONE => ComparisonOp::NotEquals,
1700             RealPredicate::RealORD => unreachable!(),
1701             RealPredicate::RealUNO => unreachable!(),
1702             RealPredicate::RealUEQ => ComparisonOp::Equals,
1703             RealPredicate::RealUGT => ComparisonOp::GreaterThan,
1704             RealPredicate::RealUGE => ComparisonOp::GreaterThan,
1705             RealPredicate::RealULT => ComparisonOp::LessThan,
1706             RealPredicate::RealULE => ComparisonOp::LessThan,
1707             RealPredicate::RealUNE => ComparisonOp::NotEquals,
1708             RealPredicate::RealPredicateTrue => unreachable!(),
1709         }
1710     }
1711 }
1712
1713 #[repr(C)]
1714 #[allow(non_camel_case_types)]
1715 enum MemOrdering {
1716     __ATOMIC_RELAXED,
1717     __ATOMIC_CONSUME,
1718     __ATOMIC_ACQUIRE,
1719     __ATOMIC_RELEASE,
1720     __ATOMIC_ACQ_REL,
1721     __ATOMIC_SEQ_CST,
1722 }
1723
1724 trait ToGccOrdering {
1725     fn to_gcc(self) -> i32;
1726 }
1727
1728 impl ToGccOrdering for AtomicOrdering {
1729     fn to_gcc(self) -> i32 {
1730         use MemOrdering::*;
1731
1732         let ordering =
1733             match self {
1734                 AtomicOrdering::Unordered => __ATOMIC_RELAXED,
1735                 AtomicOrdering::Relaxed => __ATOMIC_RELAXED, // TODO(antoyo): check if that's the same.
1736                 AtomicOrdering::Acquire => __ATOMIC_ACQUIRE,
1737                 AtomicOrdering::Release => __ATOMIC_RELEASE,
1738                 AtomicOrdering::AcquireRelease => __ATOMIC_ACQ_REL,
1739                 AtomicOrdering::SequentiallyConsistent => __ATOMIC_SEQ_CST,
1740             };
1741         ordering as i32
1742     }
1743 }