]> git.lizzy.rs Git - rust.git/blob - src/doc/tutorial.md
Rename variable in tutorial
[rust.git] / src / doc / tutorial.md
1 % The Rust Language Tutorial
2
3 # Introduction
4
5 Rust is a programming language with a focus on type safety, memory
6 safety, concurrency and performance. It is intended for writing
7 large-scale, high-performance software that is free from several
8 classes of common errors. Rust has a sophisticated memory model that
9 encourages efficient data structures and safe concurrency patterns,
10 forbidding invalid memory accesses that would otherwise cause
11 segmentation faults. It is statically typed and compiled ahead of
12 time.
13
14 As a multi-paradigm language, Rust supports writing code in
15 procedural, functional and object-oriented styles. Some of its
16 pleasant high-level features include:
17
18 * **Type inference.** Type annotations on local variable declarations
19   are optional.
20 * **Safe task-based concurrency.** Rust's lightweight tasks do not share
21   memory, instead communicating through messages.
22 * **Higher-order functions.** Efficient and flexible closures provide
23   iteration and other control structures
24 * **Pattern matching and algebraic data types.** Pattern matching on
25   Rust's enumeration types (a more powerful version of C's enums,
26   similar to algebraic data types in functional languages) is a
27   compact and expressive way to encode program logic.
28 * **Polymorphism.** Rust has type-parametric functions and
29   types, type classes and OO-style interfaces.
30
31 ## Scope
32
33 This is an introductory tutorial for the Rust programming language. It
34 covers the fundamentals of the language, including the syntax, the
35 type system and memory model, generics, and modules. [Additional
36 tutorials](#what-next?) cover specific language features in greater
37 depth.
38
39 This tutorial assumes that the reader is already familiar with one or
40 more languages in the C family. Understanding of pointers and general
41 memory management techniques will help.
42
43 ## Conventions
44
45 Throughout the tutorial, language keywords and identifiers defined in
46 example code are displayed in `code font`.
47
48 Code snippets are indented, and also shown in a monospaced font. Not
49 all snippets constitute whole programs. For brevity, we'll often show
50 fragments of programs that don't compile on their own. To try them
51 out, you might have to wrap them in `fn main() { ... }`, and make sure
52 they don't contain references to names that aren't actually defined.
53
54 > *Warning:* Rust is a language under ongoing development. Notes
55 > about potential changes to the language, implementation
56 > deficiencies, and other caveats appear offset in blockquotes.
57
58 # Getting started
59
60 There are two ways to install the Rust compiler: by building from source or
61 by downloading prebuilt binaries or installers for your platform. The
62 [install page][rust-install] contains links to download binaries for both
63 the nightly build and the most current Rust major release. For Windows and
64 OS X, the install page provides links to native installers.
65
66 > *Note:* Windows users should read the detailed
67 > [Getting started][wiki-start] notes on the wiki. Even when using
68 > the binary installer, the Windows build requires a MinGW installation,
69 > the precise details of which are not discussed here.
70
71 For Linux and OS X, the install page provides links to binary tarballs.
72 To install the Rust compiler from the from a binary tarball, download
73 the binary package, extract it, and execute the `install.sh` script in
74 the root directory of the package.
75
76 To build the Rust compiler from source, you will need to obtain the source through
77 [Git][git] or by downloading the source package from the [install page][rust-install].
78
79 Since the Rust compiler is written in Rust, it must be built by
80 a precompiled "snapshot" version of itself (made in an earlier state
81 of development). The source build automatically fetches these snapshots
82 from the Internet on our supported platforms.
83
84 Snapshot binaries are currently built and tested on several platforms:
85
86 * Windows (7, 8, Server 2008 R2), x86 only
87 * Linux (2.6.18 or later, various distributions), x86 and x86-64
88 * OSX 10.7 (Lion) or greater, x86 and x86-64
89
90 You may find that other platforms work, but these are our "tier 1"
91 supported build environments that are most likely to work.
92
93 [wiki-start]: https://github.com/mozilla/rust/wiki/Note-getting-started-developing-Rust
94 [git]: https://github.com/mozilla/rust.git
95 [rust-install]: http://www.rust-lang.org/install.html
96
97 To build from source you will also need the following prerequisite
98 packages:
99
100 * g++ 4.7 or clang++ 3.x
101 * python 2.6 or later (but not 3.x)
102 * perl 5.0 or later
103 * gnu make 3.81 or later
104 * curl
105
106 If you've fulfilled those prerequisites, something along these lines
107 should work.
108
109 ~~~~ {.notrust}
110 $ curl -O http://static.rust-lang.org/dist/rust-nightly.tar.gz
111 $ tar -xzf rust-nightly.tar.gz
112 $ cd rust-nightly
113 $ ./configure
114 $ make && make install
115 ~~~~
116
117 You may need to use `sudo make install` if you do not normally have
118 permission to modify the destination directory. The install locations
119 can be adjusted by passing a `--prefix` argument to
120 `configure`. Various other options are also supported: pass `--help`
121 for more information on them.
122
123 When complete, `make install` will place several programs into
124 `/usr/local/bin`: `rustc`, the Rust compiler, and `rustdoc`, the
125 API-documentation tool.
126
127 [tarball]: http://static.rust-lang.org/dist/rust-nightly.tar.gz
128 [win-exe]: http://static.rust-lang.org/dist/rust-nightly-install.exe
129
130 ## Compiling your first program
131
132 Rust program files are, by convention, given the extension `.rs`. Say
133 we have a file `hello.rs` containing this program:
134
135 ~~~~
136 fn main() {
137     println!("hello?");
138 }
139 ~~~~
140 > *Note:* An identifier followed by an exclamation point, like
141 > `println!`, is a macro invocation.  Macros are explained
142 > [later](#syntax-extensions); for now just remember to include the
143 > exclamation point.
144
145 If the Rust compiler was installed successfully, running `rustc
146 hello.rs` will produce an executable called `hello` (or `hello.exe` on
147 Windows) which, upon running, will likely do exactly what you expect.
148
149 The Rust compiler tries to provide useful information when it encounters an
150 error. If you introduce an error into the program (for example, by changing
151 `println!` to some nonexistent macro), and then compile it, you'll see
152 an error message like this:
153
154 ~~~~ {.notrust}
155 hello.rs:2:5: 2:24 error: macro undefined: 'print_with_unicorns'
156 hello.rs:2     print_with_unicorns!("hello?");
157                ^~~~~~~~~~~~~~~~~~~
158 ~~~~
159
160 In its simplest form, a Rust program is a `.rs` file with some types
161 and functions defined in it. If it has a `main` function, it can be
162 compiled to an executable. Rust does not allow code that's not a
163 declaration to appear at the top level of the file: all statements must
164 live inside a function.  Rust programs can also be compiled as
165 libraries, and included in other programs, even ones not written in Rust.
166
167 ## Editing Rust code
168
169 There are vim highlighting and indentation scripts in the Rust source
170 distribution under `src/etc/vim/`. There is an emacs mode under
171 `src/etc/emacs/` called `rust-mode`, but do read the instructions
172 included in that directory. In particular, if you are running emacs
173 24, then using emacs's internal package manager to install `rust-mode`
174 is the easiest way to keep it up to date. There is also a package for
175 Sublime Text 2, available both [standalone][sublime] and through
176 [Sublime Package Control][sublime-pkg], and support for Kate
177 under `src/etc/kate`.
178
179 A community-maintained list of available Rust tooling is [on the
180 wiki][wiki-packages].
181
182 There is ctags support via `src/etc/ctags.rust`, but many other
183 tools and editors are not yet supported. If you end up writing a Rust
184 mode for your favorite editor, let us know so that we can link to it.
185
186 [sublime]: http://github.com/dbp/sublime-rust
187 [sublime-pkg]: http://wbond.net/sublime_packages/package_control
188
189 # Syntax basics
190
191 Assuming you've programmed in any C-family language (C++, Java,
192 JavaScript, C#, or PHP), Rust will feel familiar. Code is arranged
193 in blocks delineated by curly braces; there are control structures
194 for branching and looping, like the familiar `if` and `while`; function
195 calls are written `myfunc(arg1, arg2)`; operators are written the same
196 and mostly have the same precedence as in C; comments are again like C;
197 module names are separated with double-colon (`::`) as with C++.
198
199 The main surface difference to be aware of is that the condition at
200 the head of control structures like `if` and `while` does not require
201 parentheses, while their bodies *must* be wrapped in
202 braces. Single-statement, unbraced bodies are not allowed.
203
204 ~~~~
205 # mod universe { pub fn recalibrate() -> bool { true } }
206 fn main() {
207     /* A simple loop */
208     loop {
209         // A tricky calculation
210         if universe::recalibrate() {
211             return;
212         }
213     }
214 }
215 ~~~~
216
217 The `let` keyword introduces a local variable. Variables are immutable by
218 default. To introduce a local variable that you can re-assign later, use `let
219 mut` instead.
220
221 ~~~~
222 let hi = "hi";
223 let mut count = 0;
224
225 while count < 10 {
226     println!("count is {}", count);
227     count += 1;
228 }
229 ~~~~
230
231 Although Rust can almost always infer the types of local variables, you can
232 specify a variable's type by following it in the `let` with a colon, then the
233 type name. Static items, on the other hand, always require a type annotation.
234
235
236 ~~~~
237 static MONSTER_FACTOR: f64 = 57.8;
238 let monster_size = MONSTER_FACTOR * 10.0;
239 let monster_size: int = 50;
240 ~~~~
241
242 Local variables may shadow earlier declarations, as in the previous example:
243 `monster_size` was first declared as a `f64`, and then a second
244 `monster_size` was declared as an `int`. If you were to actually compile this
245 example, though, the compiler would determine that the first `monster_size` is
246 unused and issue a warning (because this situation is likely to indicate a
247 programmer error). For occasions where unused variables are intentional, their
248 names may be prefixed with an underscore to silence the warning, like `let
249 _monster_size = 50;`.
250
251 Rust identifiers start with an alphabetic
252 character or an underscore, and after that may contain any sequence of
253 alphabetic characters, numbers, or underscores. The preferred style is to
254 write function, variable, and module names with lowercase letters, using
255 underscores where they help readability, while writing types in camel case.
256
257 ~~~
258 let my_variable = 100;
259 type MyType = int;     // primitive types are _not_ camel case
260 ~~~
261
262 ## Expressions and semicolons
263
264 Though it isn't apparent in all code, there is a fundamental
265 difference between Rust's syntax and predecessors like C.
266 Many constructs that are statements in C are expressions
267 in Rust, allowing code to be more concise. For example, you might
268 write a piece of code like this:
269
270 ~~~~
271 # let item = "salad";
272 let price;
273 if item == "salad" {
274     price = 3.50;
275 } else if item == "muffin" {
276     price = 2.25;
277 } else {
278     price = 2.00;
279 }
280 ~~~~
281
282 But, in Rust, you don't have to repeat the name `price`:
283
284 ~~~~
285 # let item = "salad";
286 let price =
287     if item == "salad" {
288         3.50
289     } else if item == "muffin" {
290         2.25
291     } else {
292         2.00
293     };
294 ~~~~
295
296 Both pieces of code are exactly equivalent: they assign a value to
297 `price` depending on the condition that holds. Note that there
298 are no semicolons in the blocks of the second snippet. This is
299 important: the lack of a semicolon after the last statement in a
300 braced block gives the whole block the value of that last expression.
301
302 Put another way, the semicolon in Rust *ignores the value of an expression*.
303 Thus, if the branches of the `if` had looked like `{ 4; }`, the above example
304 would simply assign `()` (unit or void) to `price`. But without the semicolon, each
305 branch has a different value, and `price` gets the value of the branch that
306 was taken.
307
308 In short, everything that's not a declaration (declarations are `let` for
309 variables; `fn` for functions; and any top-level named items such as
310 [traits](#traits), [enum types](#enums), and static items) is an
311 expression, including function bodies.
312
313 ~~~~
314 fn is_four(x: int) -> bool {
315    // No need for a return statement. The result of the expression
316    // is used as the return value.
317    x == 4
318 }
319 ~~~~
320
321 ## Primitive types and literals
322
323 There are general signed and unsigned integer types, `int` and `uint`,
324 as well as 8-, 16-, 32-, and 64-bit variants, `i8`, `u16`, etc.
325 Integers can be written in decimal (`144`), hexadecimal (`0x90`), octal (`0o70`), or
326 binary (`0b10010000`) base. Each integral type has a corresponding literal
327 suffix that can be used to indicate the type of a literal: `i` for `int`,
328 `u` for `uint`, `i8` for the `i8` type.
329
330 In the absence of an integer literal suffix, Rust will infer the
331 integer type based on type annotations and function signatures in the
332 surrounding program. In the absence of any type information at all,
333 Rust will assume that an unsuffixed integer literal has type
334 `int`.
335
336 ~~~~
337 let a = 1;       // `a` is an `int`
338 let b = 10i;     // `b` is an `int`, due to the `i` suffix
339 let c = 100u;    // `c` is a `uint`
340 let d = 1000i32; // `d` is an `i32`
341 ~~~~
342
343 There are two floating-point types: `f32`, and `f64`.
344 Floating-point numbers are written `0.0`, `1e6`, or `2.1e-4`.
345 Like integers, floating-point literals are inferred to the correct type.
346 Suffixes `f32`, and `f64` can be used to create literals of a specific type.
347
348 The keywords `true` and `false` produce literals of type `bool`.
349
350 Characters, the `char` type, are four-byte Unicode codepoints,
351 whose literals are written between single quotes, as in `'x'`.
352 Just like C, Rust understands a number of character escapes, using the backslash
353 character, such as `\n`, `\r`, and `\t`. String literals,
354 written between double quotes, allow the same escape sequences, and do no
355 other processing, unlike languages such as PHP or shell.
356
357 On the other hand, raw string literals do not process any escape sequences.
358 They are written as `r##"blah"##`, with a matching number of zero or more `#`
359 before the opening and after the closing quote, and can contain any sequence of
360 characters except their closing delimiter.  More on strings
361 [later](#vectors-and-strings).
362
363 The unit type, written `()`, has a single value, also written `()`.
364
365 ## Operators
366
367 Rust's set of operators contains very few surprises. Arithmetic is done with
368 `*`, `/`, `%`, `+`, and `-` (multiply, quotient, remainder, add, and subtract). `-` is
369 also a unary prefix operator that negates numbers. As in C, the bitwise operators
370 `>>`, `<<`, `&`, `|`, and `^` are also supported.
371
372 Note that, if applied to an integer value, `!` flips all the bits (bitwise
373 NOT, like `~` in C).
374
375 The comparison operators are the traditional `==`, `!=`, `<`, `>`,
376 `<=`, and `>=`. Short-circuiting (lazy) boolean operators are written
377 `&&` (and) and `||` (or).
378
379 For compile-time type casting, Rust uses the binary `as` operator.  It takes
380 an expression on the left side and a type on the right side and will, if a
381 meaningful conversion exists, convert the result of the expression to the
382 given type. Generally, `as` is only used with the primitive numeric types or
383 pointers, and is not overloadable.  [`transmute`][transmute] can be used for
384 unsafe C-like casting of same-sized types.
385
386 ~~~~
387 let x: f64 = 4.0;
388 let y: uint = x as uint;
389 assert!(y == 4u);
390 ~~~~
391
392 [transmute]: http://doc.rust-lang.org/std/mem/fn.transmute.html
393
394 ## Syntax extensions
395
396 *Syntax extensions* are special forms that are not built into the language,
397 but are instead provided by the libraries. To make it clear to the reader when
398 a name refers to a syntax extension, the names of all syntax extensions end
399 with `!`. The standard library defines a few syntax extensions, the most
400 useful of which is [`format!`][fmt], a `sprintf`-like text formatter that you
401 will often see in examples, and its related family of macros: `print!`,
402 `println!`, and `write!`.
403
404 `format!` draws syntax from Python, but contains many of the same principles
405 that [printf][pf] has. Unlike printf, `format!` will give you a compile-time
406 error when the types of the directives don't match the types of the arguments.
407
408 ~~~
409 // `{}` will print the "default format" of a type
410 println!("{} is {}", "the answer", 43);
411 ~~~
412
413 ~~~~
414 extern crate debug;
415
416 # fn main() {
417 # let mystery_object = ();
418 // `{:?}` will conveniently print any type,
419 // but requires the `debug` crate to be linked in
420 println!("what is this thing: {:?}", mystery_object);
421 # }
422 ~~~~
423
424 [pf]: http://en.cppreference.com/w/cpp/io/c/fprintf
425 [fmt]: http://doc.rust-lang.org/std/fmt/
426
427 You can define your own syntax extensions with the macro system. For details,
428 see the [macro tutorial][macros]. Note that macro definition is currently
429 considered an unstable feature.
430
431 # Control structures
432
433 ## Conditionals
434
435 We've seen `if` expressions a few times already. To recap, braces are
436 compulsory, an `if` can have an optional `else` clause, and multiple
437 `if`/`else` constructs can be chained together:
438
439 ~~~~
440 if false {
441     println!("that's odd");
442 } else if true {
443     println!("right");
444 } else {
445     println!("neither true nor false");
446 }
447 ~~~~
448
449 The condition given to an `if` construct *must* be of type `bool` (no
450 implicit conversion happens). If the arms are blocks that have a
451 value, this value must be of the same type for every arm in which
452 control reaches the end of the block:
453
454 ~~~~
455 fn signum(x: int) -> int {
456     if x < 0 { -1 }
457     else if x > 0 { 1 }
458     else { 0 }
459 }
460 ~~~~
461
462 ## Pattern matching
463
464 Rust's `match` construct is a generalized, cleaned-up version of C's
465 `switch` construct. You provide it with a value and a number of
466 *arms*, each labelled with a pattern, and the code compares the value
467 against each pattern in order until one matches. The matching pattern
468 executes its corresponding arm.
469
470 ~~~~
471 let my_number = 1;
472 match my_number {
473   0     => println!("zero"),
474   1 | 2 => println!("one or two"),
475   3..10 => println!("three to ten"),
476   _     => println!("something else")
477 }
478 ~~~~
479
480 Unlike in C, there is no "falling through" between arms: only one arm
481 executes, and it doesn't have to explicitly `break` out of the
482 construct when it is finished.
483
484 A `match` arm consists of a *pattern*, then a fat arrow `=>`, followed
485 by an *action* (expression). Each case is separated by commas. It is
486 often convenient to use a block expression for each case, in which case
487 the commas are optional as shown below. Literals are valid patterns and
488 match only their own value. A single arm may match multiple different
489 patterns by combining them with the pipe operator (`|`), so long as every
490 pattern binds the same set of variables. Ranges of numeric literal
491 patterns can be expressed with two dots, as in `M..N`. The underscore
492 (`_`) is a wildcard pattern that matches any single value. (`..`) is a
493 different wildcard that can match one or more fields in an `enum` variant.
494
495 ~~~
496 # let my_number = 1;
497 match my_number {
498   0 => { println!("zero") }
499   _ => { println!("something else") }
500 }
501 ~~~
502
503 `match` constructs must be *exhaustive*: they must have an arm
504 covering every possible case. For example, the typechecker would
505 reject the previous example if the arm with the wildcard pattern was
506 omitted.
507
508 A powerful application of pattern matching is *destructuring*:
509 matching in order to bind names to the contents of data types.
510
511 > *Note:* The following code makes use of tuples (`(f64, f64)`) which
512 > are explained in section 5.3. For now you can think of tuples as a list of
513 > items.
514
515 ~~~~
516 use std::f64;
517 fn angle(vector: (f64, f64)) -> f64 {
518     let pi = f64::consts::PI;
519     match vector {
520       (0.0, y) if y < 0.0 => 1.5 * pi,
521       (0.0, _) => 0.5 * pi,
522       (x, y) => (y / x).atan()
523     }
524 }
525 ~~~~
526
527 A variable name in a pattern matches any value, *and* binds that name
528 to the value of the matched value inside of the arm's action. Thus, `(0.0,
529 y)` matches any tuple whose first element is zero, and binds `y` to
530 the second element. `(x, y)` matches any two-element tuple, and binds both
531 elements to variables. `(0.0,_)` matches any tuple whose first element is zero
532 and does not bind anything to the second element.
533
534 A subpattern can also be bound to a variable, using `variable @ pattern`. For
535 example:
536
537 ~~~~
538 # let age = 23;
539 match age {
540     a @ 0..20 => println!("{} years old", a),
541     _ => println!("older than 21")
542 }
543 ~~~~
544
545 Any `match` arm can have a guard clause (written `if EXPR`), called a
546 *pattern guard*, which is an expression of type `bool` that
547 determines, after the pattern is found to match, whether the arm is
548 taken or not. The variables bound by the pattern are in scope in this
549 guard expression. The first arm in the `angle` example shows an
550 example of a pattern guard.
551
552 You've already seen simple `let` bindings, but `let` is a little
553 fancier than you've been led to believe. It, too, supports destructuring
554 patterns. For example, you can write this to extract the fields from a
555 tuple, introducing two variables at once: `a` and `b`.
556
557 ~~~~
558 # fn get_tuple_of_two_ints() -> (int, int) { (1, 1) }
559 let (a, b) = get_tuple_of_two_ints();
560 ~~~~
561
562 Let bindings only work with _irrefutable_ patterns: that is, patterns
563 that can never fail to match. This excludes `let` from matching
564 literals and most `enum` variants.
565
566 ## Loops
567
568 `while` denotes a loop that iterates as long as its given condition
569 (which must have type `bool`) evaluates to `true`. Inside a loop, the
570 keyword `break` aborts the loop, and `continue` aborts the current
571 iteration and continues with the next.
572
573 ~~~~
574 let mut cake_amount = 8;
575 while cake_amount > 0 {
576     cake_amount -= 1;
577 }
578 ~~~~
579
580 `loop` denotes an infinite loop, and is the preferred way of writing `while true`:
581
582 ~~~~
583 let mut x = 5u;
584 loop {
585     x += x - 3;
586     if x % 5 == 0 { break; }
587     println!("{}", x);
588 }
589 ~~~~
590
591 This code prints out a weird sequence of numbers and stops as soon as
592 it finds one that can be divided by five.
593
594 There is also a for-loop that can be used to iterate over a range of numbers:
595
596 ~~~~
597 for n in range(0, 5) {
598     println!("{}", n);
599 }
600 ~~~~
601
602 The snippet above prints integer numbers under 5 starting at 0.
603
604 More generally, a for loop works with anything implementing the `Iterator` trait.
605 Data structures can provide one or more methods that return iterators over
606 their contents. For example, strings support iteration over their contents in
607 various ways:
608
609 ~~~~
610 let s = "Hello";
611 for c in s.chars() {
612     println!("{}", c);
613 }
614 ~~~~
615
616 The snippet above prints the characters in "Hello" vertically, adding a new
617 line after each character.
618
619
620 # Data structures
621
622 ## Structs
623
624 Rust struct types must be declared before they are used using the `struct`
625 syntax: `struct Name { field1: T1, field2: T2 [, ...] }`, where `T1`, `T2`,
626 ... denote types. To construct a struct, use the same syntax, but leave off
627 the `struct`: for example: `Point { x: 1.0, y: 2.0 }`.
628
629 Structs are quite similar to C structs and are even laid out the same way in
630 memory (so you can read from a Rust struct in C, and vice-versa). Use the dot
631 operator to access struct fields, as in `mypoint.x`.
632
633 ~~~~
634 struct Point {
635     x: f64,
636     y: f64
637 }
638 ~~~~
639
640 Structs have "inherited mutability", which means that any field of a struct
641 may be mutable, if the struct is in a mutable slot.
642
643 With a value (say, `mypoint`) of such a type in a mutable location, you can do
644 `mypoint.y += 1.0`. But in an immutable location, such an assignment to a
645 struct without inherited mutability would result in a type error.
646
647 ~~~~ {.ignore}
648 # struct Point { x: f64, y: f64 }
649 let mut mypoint = Point { x: 1.0, y: 1.0 };
650 let origin = Point { x: 0.0, y: 0.0 };
651
652 mypoint.y += 1.0; // `mypoint` is mutable, and its fields as well
653 origin.y += 1.0; // ERROR: assigning to immutable field
654 ~~~~
655
656 `match` patterns destructure structs. The basic syntax is
657 `Name { fieldname: pattern, ... }`:
658
659 ~~~~
660 # struct Point { x: f64, y: f64 }
661 # let mypoint = Point { x: 0.0, y: 0.0 };
662 match mypoint {
663     Point { x: 0.0, y: yy } => println!("{}", yy),
664     Point { x: xx,  y: yy } => println!("{} {}", xx, yy)
665 }
666 ~~~~
667
668 In general, the field names of a struct do not have to appear in the same
669 order they appear in the type. When you are not interested in all
670 the fields of a struct, a struct pattern may end with `, ..` (as in
671 `Name { field1, .. }`) to indicate that you're ignoring all other fields.
672 Additionally, struct fields have a shorthand matching form that simply
673 reuses the field name as the binding name.
674
675 ~~~
676 # struct Point { x: f64, y: f64 }
677 # let mypoint = Point { x: 0.0, y: 0.0 };
678 match mypoint {
679     Point { x, .. } => println!("{}", x)
680 }
681 ~~~
682
683 ## Enums
684
685 Enums are datatypes with several alternate representations. A simple `enum`
686 defines one or more constants, all of which have the same type:
687
688 ~~~~
689 enum Direction {
690     North,
691     East,
692     South,
693     West
694 }
695 ~~~~
696
697 Each variant of this enum has a unique and constant integral discriminator
698 value. If no explicit discriminator is specified for a variant, the value
699 defaults to the value of the previous variant plus one. If the first variant
700 does not have a discriminator, it defaults to 0. For example, the value of
701 `North` is 0, `East` is 1, `South` is 2, and `West` is 3.
702
703 When an enum has simple integer discriminators, you can apply the `as` cast
704 operator to convert a variant to its discriminator value as an `int`:
705
706 ~~~~
707 # #[deriving(Show)] enum Direction { North }
708 println!( "{} => {}", North, North as int );
709 ~~~~
710
711 It is possible to set the discriminator values to chosen constant values:
712
713 ~~~~
714 enum Color {
715   Red = 0xff0000,
716   Green = 0x00ff00,
717   Blue = 0x0000ff
718 }
719 ~~~~
720
721 Variants do not have to be simple values; they may be more complex:
722
723 ~~~~
724 # struct Point { x: f64, y: f64 }
725 enum Shape {
726     Circle(Point, f64),
727     Rectangle(Point, Point)
728 }
729 ~~~~
730
731 A value of this type is either a `Circle`, in which case it contains a
732 `Point` struct and a f64, or a `Rectangle`, in which case it contains
733 two `Point` structs. The run-time representation of such a value
734 includes an identifier of the actual form that it holds, much like the
735 "tagged union" pattern in C, but with better static guarantees.
736
737 This declaration defines a type `Shape` that can refer to such shapes, and two
738 functions, `Circle` and `Rectangle`, which can be used to construct values of
739 the type. To create a new Circle, write `Circle(Point { x: 0.0, y: 0.0 },
740 10.0)`.
741
742 All of these variant constructors may be used as patterns. The only way to
743 access the contents of an enum instance is the destructuring of a match. For
744 example:
745
746 ~~~~
747 use std::f64;
748 # struct Point {x: f64, y: f64}
749 # enum Shape { Circle(Point, f64), Rectangle(Point, Point) }
750 fn area(sh: Shape) -> f64 {
751     match sh {
752         Circle(_, size) => f64::consts::PI * size * size,
753         Rectangle(Point { x, y }, Point { x: x2, y: y2 }) => (x2 - x) * (y2 - y)
754     }
755 }
756 ~~~~
757
758 Use a lone `_` to ignore an individual field. Ignore all fields of a variant
759 like: `Circle(..)`. Nullary enum patterns are written without parentheses:
760
761 ~~~~
762 # struct Point { x: f64, y: f64 }
763 # enum Direction { North, East, South, West }
764 fn point_from_direction(dir: Direction) -> Point {
765     match dir {
766         North => Point { x:  0.0, y:  1.0 },
767         East  => Point { x:  1.0, y:  0.0 },
768         South => Point { x:  0.0, y: -1.0 },
769         West  => Point { x: -1.0, y:  0.0 }
770     }
771 }
772 ~~~~
773
774 Enum variants may also be structs. For example:
775
776 ~~~~
777 use std::f64;
778 # struct Point { x: f64, y: f64 }
779 # fn square(x: f64) -> f64 { x * x }
780 enum Shape {
781     Circle { center: Point, radius: f64 },
782     Rectangle { top_left: Point, bottom_right: Point }
783 }
784 fn area(sh: Shape) -> f64 {
785     match sh {
786         Circle { radius: radius, .. } => f64::consts::PI * square(radius),
787         Rectangle { top_left: top_left, bottom_right: bottom_right } => {
788             (bottom_right.x - top_left.x) * (top_left.y - bottom_right.y)
789         }
790     }
791 }
792 ~~~~
793
794 > *Note:* This feature of the compiler is currently gated behind the
795 > `#[feature(struct_variant)]` directive. More about these directives can be
796 > found in the manual.
797
798 ## Tuples
799
800 Tuples in Rust behave exactly like structs, except that their fields do not
801 have names. Thus, you cannot access their fields with dot notation.  Tuples
802 can have any arity (number of elements) except for 0 (though you may consider
803 unit, `()`, as the empty tuple if you like).
804
805 ~~~~
806 let mytup: (int, int, f64) = (10, 20, 30.0);
807 match mytup {
808   (a, b, c) => println!("{}", a + b + (c as int))
809 }
810 ~~~~
811
812 ## Tuple structs
813
814 Rust also has _tuple structs_, which behave like both structs and tuples,
815 except that, unlike tuples, tuple structs have names (so `Foo(1, 2)` has a
816 different type from `Bar(1, 2)`), and tuple structs' _fields_ do not have
817 names.
818
819 For example:
820
821 ~~~~
822 struct MyTup(int, int, f64);
823 let mytup: MyTup = MyTup(10, 20, 30.0);
824 match mytup {
825   MyTup(a, b, c) => println!("{}", a + b + (c as int))
826 }
827 ~~~~
828
829 <a name="newtype"></a>
830
831 There is a special case for tuple structs with a single field, which are
832 sometimes called "newtypes" (after Haskell's "newtype" feature). These are
833 used to define new types in such a way that the new name is not just a
834 synonym for an existing type but is rather its own distinct type.
835
836 ~~~~
837 struct GizmoId(int);
838 ~~~~
839
840 Types like this can be useful to differentiate between data that have
841 the same underlying type but must be used in different ways.
842
843 ~~~~
844 struct Inches(int);
845 struct Centimeters(int);
846 ~~~~
847
848 The above definitions allow for a simple way for programs to avoid
849 confusing numbers that correspond to different units. Their integer
850 values can be extracted with pattern matching:
851
852 ~~~
853 # struct Inches(int);
854 let length_with_unit = Inches(10);
855 let Inches(integer_length) = length_with_unit;
856 println!("length is {} inches", integer_length);
857 ~~~
858
859 # Functions
860
861 We've already seen several function definitions. Like all other static
862 declarations, such as `type`, functions can be declared both at the
863 top level and inside other functions (or in modules, which we'll come
864 back to [later](#crates-and-the-module-system)). The `fn` keyword introduces a
865 function. A function has an argument list, which is a parenthesized
866 list of `name: type` pairs separated by commas. An arrow `->`
867 separates the argument list and the function's return type.
868
869 ~~~~
870 fn line(a: int, b: int, x: int) -> int {
871     return a * x + b;
872 }
873 ~~~~
874
875 The `return` keyword immediately returns from the body of a function. It
876 is optionally followed by an expression to return. A function can
877 also return a value by having its top-level block produce an
878 expression.
879
880 ~~~~
881 fn line(a: int, b: int, x: int) -> int {
882     a * x + b
883 }
884 ~~~~
885
886 It's better Rust style to write a return value this way instead of
887 writing an explicit `return`. The utility of `return` comes in when
888 returning early from a function. Functions that do not return a value
889 are said to return unit, `()`, and both the return type and the return
890 value may be omitted from the definition. The following two functions
891 are equivalent.
892
893 ~~~~
894 fn do_nothing_the_hard_way() -> () { return (); }
895
896 fn do_nothing_the_easy_way() { }
897 ~~~~
898
899 Ending the function with a semicolon like so is equivalent to returning `()`.
900
901 ~~~~
902 fn line(a: int, b: int, x: int) -> int { a * x + b  }
903 fn oops(a: int, b: int, x: int) -> ()  { a * x + b; }
904
905 assert!(8 == line(5, 3, 1));
906 assert!(() == oops(5, 3, 1));
907 ~~~~
908
909 As with `match` expressions and `let` bindings, function arguments support
910 pattern destructuring. Like `let`, argument patterns must be irrefutable,
911 as in this example that unpacks the first value from a tuple and returns it.
912
913 ~~~
914 fn first((value, _): (int, f64)) -> int { value }
915 ~~~
916
917 # Destructors
918
919 A *destructor* is a function responsible for cleaning up the resources used by
920 an object when it is no longer accessible. Destructors can be defined to handle
921 the release of resources like files, sockets and heap memory.
922
923 Objects are never accessible after their destructor has been called, so no
924 dynamic failures are possible from accessing freed resources. When a task
925 fails, destructors of all objects in the task are called.
926
927 The `box` operator performs memory allocation on the heap:
928
929 ~~~~
930 {
931     // an integer allocated on the heap
932     let y = box 10;
933 }
934 // the destructor frees the heap memory as soon as `y` goes out of scope
935 ~~~~
936
937 Rust includes syntax for heap memory allocation in the language since it's
938 commonly used, but the same semantics can be implemented by a type with a
939 custom destructor.
940
941 # Ownership
942
943 Rust formalizes the concept of object ownership to delegate management of an
944 object's lifetime to either a variable or a task-local garbage collector. An
945 object's owner is responsible for managing the lifetime of the object by
946 calling the destructor, and the owner determines whether the object is mutable.
947
948 Ownership is recursive, so mutability is inherited recursively and a destructor
949 destroys the contained tree of owned objects. Variables are top-level owners
950 and destroy the contained object when they go out of scope.
951
952 ~~~~
953 // the struct owns the objects contained in the `x` and `y` fields
954 struct Foo { x: int, y: Box<int> }
955
956 {
957     // `a` is the owner of the struct, and thus the owner of the struct's fields
958     let a = Foo { x: 5, y: box 10 };
959 }
960 // when `a` goes out of scope, the destructor for the `Box<int>` in the struct's
961 // field is called
962
963 // `b` is mutable, and the mutability is inherited by the objects it owns
964 let mut b = Foo { x: 5, y: box 10 };
965 b.x = 10;
966 ~~~~
967
968 If an object doesn't contain any non-Send types, it consists of a single
969 ownership tree and is itself given the `Send` trait which allows it to be sent
970 between tasks. Custom destructors can only be implemented directly on types
971 that are `Send`, but non-`Send` types can still *contain* types with custom
972 destructors. Example of types which are not `Send` are [`Gc<T>`][gc] and
973 [`Rc<T>`][rc], the shared-ownership types.
974
975 [gc]: http://doc.rust-lang.org/std/gc/struct.Gc.html
976 [rc]: http://doc.rust-lang.org/std/rc/struct.Rc.html
977
978 # Implementing a linked list
979
980 An `enum` is a natural fit for describing a linked list, because it can express
981 a `List` type as being *either* the end of the list (`Nil`) or another node
982 (`Cons`). The full definition of the `Cons` variant will require some thought.
983
984 ~~~ {.ignore}
985 enum List {
986     Cons(...), // an incomplete definition of the next element in a List
987     Nil        // the end of a List
988 }
989 ~~~
990
991 The obvious approach is to define `Cons` as containing an element in the list
992 along with the next `List` node. However, this will generate a compiler error.
993
994 ~~~ {.ignore}
995 // error: illegal recursive enum type; wrap the inner value in a box to make it
996 // representable
997 enum List {
998     Cons(u32, List), // an element (`u32`) and the next node in the list
999     Nil
1000 }
1001 ~~~
1002
1003 This error message is related to Rust's precise control over memory layout, and
1004 solving it will require introducing the concept of *boxing*.
1005
1006 ## Boxes
1007
1008 A value in Rust is stored directly inside the owner. If a `struct` contains
1009 four `u32` fields, it will be four times as large as a single `u32`.
1010
1011 ~~~
1012 use std::mem::size_of; // bring `size_of` into the current scope, for convenience
1013
1014 struct Foo {
1015     a: u32,
1016     b: u32,
1017     c: u32,
1018     d: u32
1019 }
1020
1021 assert_eq!(size_of::<Foo>(), size_of::<u32>() * 4);
1022
1023 struct Bar {
1024     a: Foo,
1025     b: Foo,
1026     c: Foo,
1027     d: Foo
1028 }
1029
1030 assert_eq!(size_of::<Bar>(), size_of::<u32>() * 16);
1031 ~~~
1032
1033 Our previous attempt at defining the `List` type included an `u32` and a `List`
1034 directly inside `Cons`, making it at least as big as the sum of both types. The
1035 type was invalid because the size was infinite!
1036
1037 An *owned box* (`Box`, located in the `std::owned` module) uses a dynamic memory
1038 allocation to provide the invariant of always being the size of a pointer,
1039 regardless of the contained type. This can be leveraged to create a valid `List`
1040 definition:
1041
1042 ~~~
1043
1044 enum List {
1045     Cons(u32, Box<List>),
1046     Nil
1047 }
1048 ~~~
1049
1050 Defining a recursive data structure like this is the canonical example of an
1051 owned box. Much like an unboxed value, an owned box has a single owner and is
1052 therefore limited to expressing a tree-like data structure.
1053
1054 Consider an instance of our `List` type:
1055
1056 ~~~
1057 # enum List {
1058 #     Cons(u32, Box<List>),
1059 #     Nil
1060 # }
1061 let list = Cons(1, box Cons(2, box Cons(3, box Nil)));
1062 ~~~
1063
1064 It represents an owned tree of values, inheriting mutability down the tree and
1065 being destroyed along with the owner. Since the `list` variable above is
1066 immutable, the whole list is immutable. The memory allocation itself is the
1067 box, while the owner holds onto a pointer to it:
1068
1069 ~~~ {.notrust}
1070             List box            List box            List box          List box
1071         +--------------+    +--------------+    +--------------+    +----------+
1072 list -> | Cons | 1 |   | -> | Cons | 2 |   | -> | Cons | 3 |   | -> | Nil      |
1073         +--------------+    +--------------+    +--------------+    +----------+
1074 ~~~
1075
1076 > *Note:* the above diagram shows the logical contents of the enum. The actual
1077 > memory layout of the enum may vary. For example, for the `List` enum shown
1078 > above, Rust guarantees that there will be no enum tag field in the actual
1079 > structure. See the language reference for more details.
1080
1081 An owned box is a common example of a type with a destructor. The allocated
1082 memory is cleaned up when the box is destroyed.
1083
1084 ## Move semantics
1085
1086 Rust uses a shallow copy for parameter passing, assignment and returning from
1087 functions. Passing around the `List` will copy only as deep as the pointer to
1088 the box rather than doing an implicit heap allocation.
1089
1090 ~~~
1091 # enum List {
1092 #     Cons(u32, Box<List>),
1093 #     Nil
1094 # }
1095 let xs = Cons(1, box Cons(2, box Cons(3, box Nil)));
1096 let ys = xs; // copies `Cons(u32, pointer)` shallowly
1097 ~~~
1098
1099 Rust will consider a shallow copy of a type with a destructor like `List` to
1100 *move ownership* of the value. After a value has been moved, the source
1101 location cannot be used unless it is reinitialized.
1102
1103 ~~~
1104 # enum List {
1105 #     Cons(u32, Box<List>),
1106 #     Nil
1107 # }
1108 let mut xs = Nil;
1109 let ys = xs;
1110
1111 // attempting to use `xs` will result in an error here
1112
1113 xs = Nil;
1114
1115 // `xs` can be used again
1116 ~~~
1117
1118 A destructor call will only occur for a variable that has not been moved from,
1119 as it is only called a single time.
1120
1121
1122 Avoiding a move can be done with the library-defined `clone` method:
1123
1124 ~~~~
1125 let x = box 5;
1126 let y = x.clone(); // `y` is a newly allocated box
1127 let z = x; // no new memory allocated, `x` can no longer be used
1128 ~~~~
1129
1130 The `clone` method is provided by the `Clone` trait, and can be derived for
1131 our `List` type. Traits will be explained in detail [later](#traits).
1132
1133 ~~~{.ignore}
1134 #[deriving(Clone)]
1135 enum List {
1136     Cons(u32, Box<List>),
1137     Nil
1138 }
1139
1140 let x = Cons(5, box Nil);
1141 let y = x.clone();
1142
1143 // `x` can still be used!
1144
1145 let z = x;
1146
1147 // and now, it can no longer be used since it has been moved
1148 ~~~
1149
1150 The mutability of a value may be changed by moving it to a new owner:
1151
1152 ~~~~
1153 let r = box 13;
1154 let mut s = r; // box becomes mutable
1155 *s += 1;
1156 let t = s; // box becomes immutable
1157 ~~~~
1158
1159 A simple way to define a function prepending to the `List` type is to take
1160 advantage of moves:
1161
1162 ~~~
1163 enum List {
1164     Cons(u32, Box<List>),
1165     Nil
1166 }
1167
1168 fn prepend(xs: List, value: u32) -> List {
1169     Cons(value, box xs)
1170 }
1171
1172 let mut xs = Nil;
1173 xs = prepend(xs, 1);
1174 xs = prepend(xs, 2);
1175 xs = prepend(xs, 3);
1176 ~~~
1177
1178 However, this is not a very flexible definition of `prepend` as it requires
1179 ownership of a list to be passed in rather than just mutating it in-place.
1180
1181 ## References
1182
1183 The obvious signature for a `List` equality comparison is the following:
1184
1185 ~~~{.ignore}
1186 fn eq(xs: List, ys: List) -> bool { /* ... */ }
1187 ~~~
1188
1189 However, this will cause both lists to be moved into the function. Ownership
1190 isn't required to compare the lists, so the function should take *references*
1191 (&T) instead.
1192
1193 ~~~{.ignore}
1194 fn eq(xs: &List, ys: &List) -> bool { /* ... */ }
1195 ~~~
1196
1197 A reference is a *non-owning* view of a value. A reference can be obtained with the `&` (address-of)
1198 operator. It can be dereferenced by using the `*` operator. In a pattern, such as `match` expression
1199 branches, the `ref` keyword can be used to bind to a variable name by-reference rather than
1200 by-value. A recursive definition of equality using references is as follows:
1201
1202 ~~~
1203 # enum List {
1204 #     Cons(u32, Box<List>),
1205 #     Nil
1206 # }
1207 fn eq(xs: &List, ys: &List) -> bool {
1208     // Match on the next node in both lists.
1209     match (xs, ys) {
1210         // If we have reached the end of both lists, they are equal.
1211         (&Nil, &Nil) => true,
1212         // If the current elements of both lists are equal, keep going.
1213         (&Cons(x, box ref next_xs), &Cons(y, box ref next_ys))
1214                 if x == y => eq(next_xs, next_ys),
1215         // If the current elements are not equal, the lists are not equal.
1216         _ => false
1217     }
1218 }
1219
1220 let xs = Cons(5, box Cons(10, box Nil));
1221 let ys = Cons(5, box Cons(10, box Nil));
1222 assert!(eq(&xs, &ys));
1223 ~~~
1224
1225 > *Note:* Rust doesn't guarantee [tail-call](http://en.wikipedia.org/wiki/Tail_call) optimization,
1226 > but LLVM is able to handle a simple case like this with optimizations enabled.
1227
1228 ## Lists of other types
1229
1230 Our `List` type is currently always a list of 32-bit unsigned integers. By
1231 leveraging Rust's support for generics, it can be extended to work for any
1232 element type.
1233
1234 The `u32` in the previous definition can be substituted with a type parameter:
1235
1236 > *Note:* The following code introduces generics, which are explained in a
1237 > [dedicated section](#generics).
1238
1239 ~~~
1240 enum List<T> {
1241     Cons(T, Box<List<T>>),
1242     Nil
1243 }
1244 ~~~
1245
1246 The old `List` of `u32` is now available as `List<u32>`. The `prepend`
1247 definition has to be updated too:
1248
1249 ~~~
1250 # enum List<T> {
1251 #     Cons(T, Box<List<T>>),
1252 #     Nil
1253 # }
1254 fn prepend<T>(xs: List<T>, value: T) -> List<T> {
1255     Cons(value, box xs)
1256 }
1257 ~~~
1258
1259 Generic functions and types like this are equivalent to defining specialized
1260 versions for each set of type parameters.
1261
1262 Using the generic `List<T>` works much like before, thanks to type inference:
1263
1264 ~~~
1265 # enum List<T> {
1266 #     Cons(T, Box<List<T>>),
1267 #     Nil
1268 # }
1269 # fn prepend<T>(xs: List<T>, value: T) -> List<T> {
1270 #     Cons(value, box xs)
1271 # }
1272 let mut xs = Nil; // Unknown type! This is a `List<T>`, but `T` can be anything.
1273 xs = prepend(xs, 10); // Here the compiler infers `xs`'s type as `List<int>`.
1274 xs = prepend(xs, 15);
1275 xs = prepend(xs, 20);
1276 ~~~
1277
1278 The code sample above demonstrates type inference making most type annotations optional. It is
1279 equivalent to the following type-annotated code:
1280
1281 ~~~
1282 # enum List<T> {
1283 #     Cons(T, Box<List<T>>),
1284 #     Nil
1285 # }
1286 # fn prepend<T>(xs: List<T>, value: T) -> List<T> {
1287 #     Cons(value, box xs)
1288 # }
1289 let mut xs: List<int> = Nil::<int>;
1290 xs = prepend::<int>(xs, 10);
1291 xs = prepend::<int>(xs, 15);
1292 xs = prepend::<int>(xs, 20);
1293 ~~~
1294
1295 In declarations, the language uses `Type<T, U, V>` to describe a list of type
1296 parameters, but expressions use `identifier::<T, U, V>`, to disambiguate the
1297 `<` operator.
1298
1299 ## Defining list equality with generics
1300
1301 Generic functions are type-checked from the definition, so any necessary properties of the type must
1302 be specified up-front. Our previous definition of list equality relied on the element type having
1303 the `==` operator available, and took advantage of the lack of a destructor on `u32` to copy it
1304 without a move of ownership.
1305
1306 We can add a *trait bound* on the `PartialEq` trait to require that the type implement the `==` operator.
1307 Two more `ref` annotations need to be added to avoid attempting to move out the element types:
1308
1309 ~~~
1310 # enum List<T> {
1311 #     Cons(T, Box<List<T>>),
1312 #     Nil
1313 # }
1314 fn eq<T: PartialEq>(xs: &List<T>, ys: &List<T>) -> bool {
1315     // Match on the next node in both lists.
1316     match (xs, ys) {
1317         // If we have reached the end of both lists, they are equal.
1318         (&Nil, &Nil) => true,
1319         // If the current elements of both lists are equal, keep going.
1320         (&Cons(ref x, box ref next_xs), &Cons(ref y, box ref next_ys))
1321                 if x == y => eq(next_xs, next_ys),
1322         // If the current elements are not equal, the lists are not equal.
1323         _ => false
1324     }
1325 }
1326
1327 let xs = Cons('c', box Cons('a', box Cons('t', box Nil)));
1328 let ys = Cons('c', box Cons('a', box Cons('t', box Nil)));
1329 assert!(eq(&xs, &ys));
1330 ~~~
1331
1332 This would be a good opportunity to implement the `PartialEq` trait for our list type, making the `==` and
1333 `!=` operators available. We'll need to provide an `impl` for the `PartialEq` trait and a definition of the
1334 `eq` method. In a method, the `self` parameter refers to an instance of the type we're implementing
1335 on.
1336
1337 ~~~
1338 # enum List<T> {
1339 #     Cons(T, Box<List<T>>),
1340 #     Nil
1341 # }
1342 impl<T: PartialEq> PartialEq for List<T> {
1343     fn eq(&self, ys: &List<T>) -> bool {
1344         // Match on the next node in both lists.
1345         match (self, ys) {
1346             // If we have reached the end of both lists, they are equal.
1347             (&Nil, &Nil) => true,
1348             // If the current elements of both lists are equal, keep going.
1349             (&Cons(ref x, box ref next_xs), &Cons(ref y, box ref next_ys))
1350                     if x == y => next_xs == next_ys,
1351             // If the current elements are not equal, the lists are not equal.
1352             _ => false
1353         }
1354     }
1355 }
1356
1357 let xs = Cons(5, box Cons(10, box Nil));
1358 let ys = Cons(5, box Cons(10, box Nil));
1359 // The methods below are part of the PartialEq trait,
1360 // which we implemented on our linked list.
1361 assert!(xs.eq(&ys));
1362 assert!(!xs.ne(&ys));
1363
1364 // The PartialEq trait also allows us to use the shorthand infix operators.
1365 assert!(xs == ys);    // `xs == ys` is short for `xs.eq(&ys)`
1366 assert!(!(xs != ys)); // `xs != ys` is short for `xs.ne(&ys)`
1367 ~~~
1368
1369 # More on boxes
1370
1371 The most common use case for owned boxes is creating recursive data structures
1372 like a binary search tree. Rust's trait-based generics system (covered later in
1373 the tutorial) is usually used for static dispatch, but also provides dynamic
1374 dispatch via boxing. Values of different types may have different sizes, but a
1375 box is able to *erase* the difference via the layer of indirection they
1376 provide.
1377
1378 In uncommon cases, the indirection can provide a performance gain or memory
1379 reduction by making values smaller. However, unboxed values should almost
1380 always be preferred when they are usable.
1381
1382 Note that returning large unboxed values via boxes is unnecessary. A large
1383 value is returned via a hidden output parameter, and the decision on where to
1384 place the return value should be left to the caller:
1385
1386 ~~~~
1387 fn foo() -> (u64, u64, u64, u64, u64, u64) {
1388     (5, 5, 5, 5, 5, 5)
1389 }
1390
1391 let x = box foo(); // allocates a box, and writes the integers directly to it
1392 ~~~~
1393
1394 Beyond the properties granted by the size, an owned box behaves as a regular
1395 value by inheriting the mutability and lifetime of the owner:
1396
1397 ~~~~
1398 let x = 5; // immutable
1399 let mut y = 5; // mutable
1400 y += 2;
1401
1402 let x = box 5; // immutable
1403 let mut y = box 5; // mutable
1404 *y += 2; // the `*` operator is needed to access the contained value
1405 ~~~~
1406
1407 # References
1408
1409 In contrast with
1410 owned boxes, where the holder of an owned box is the owner of the pointed-to
1411 memory, references never imply ownership - they are "borrowed".
1412 You can borrow a reference to
1413 any object, and the compiler verifies that it cannot outlive the lifetime of
1414 the object.
1415
1416 As an example, consider a simple struct type, `Point`:
1417
1418 ~~~
1419 struct Point {
1420     x: f64,
1421     y: f64
1422 }
1423 ~~~
1424
1425 We can use this simple definition to allocate points in many different
1426 ways. For example, in this code, each of these local variables
1427 contains a point, but allocated in a different location:
1428
1429 ~~~
1430 # struct Point { x: f64, y: f64 }
1431 let on_the_stack :     Point  =     Point { x: 3.0, y: 4.0 };
1432 let on_the_heap  : Box<Point> = box Point { x: 7.0, y: 9.0 };
1433 ~~~
1434
1435 Suppose we want to write a procedure that computes the distance
1436 between any two points, no matter where they are stored. One option is
1437 to define a function that takes two arguments of type point—that is,
1438 it takes the points by value. But this will cause the points to be
1439 copied when we call the function. For points, this is probably not so
1440 bad, but often copies are expensive. So we’d like to define a function
1441 that takes the points by pointer. We can use references to do this:
1442
1443 ~~~
1444 # struct Point { x: f64, y: f64 }
1445 fn compute_distance(p1: &Point, p2: &Point) -> f64 {
1446     let x_d = p1.x - p2.x;
1447     let y_d = p1.y - p2.y;
1448     (x_d * x_d + y_d * y_d).sqrt()
1449 }
1450 ~~~
1451
1452 Now we can call `compute_distance()` in various ways:
1453
1454 ~~~
1455 # struct Point{ x: f64, y: f64 };
1456 # let on_the_stack :     Point  =     Point { x: 3.0, y: 4.0 };
1457 # let on_the_heap  : Box<Point> = box Point { x: 7.0, y: 9.0 };
1458 # fn compute_distance(p1: &Point, p2: &Point) -> f64 { 0.0 }
1459 compute_distance(&on_the_stack, on_the_heap);
1460 ~~~
1461
1462 Here the `&` operator is used to take the address of the variable
1463 `on_the_stack`; this is because `on_the_stack` has the type `Point`
1464 (that is, a struct value) and we have to take its address to get a
1465 reference. We also call this _borrowing_ the local variable
1466 `on_the_stack`, because we are creating an alias: that is, another
1467 route to the same data.
1468
1469 In the case of `owned_box`, however, no
1470 explicit action is necessary. The compiler will automatically convert
1471 a box `box point` to a reference like
1472 `&point`. This is another form of borrowing; in this case, the
1473 contents of the owned box are being lent out.
1474
1475 Whenever a value is borrowed, there are some limitations on what you
1476 can do with the original. For example, if the contents of a variable
1477 have been lent out, you cannot send that variable to another task, nor
1478 will you be permitted to take actions that might cause the borrowed
1479 value to be freed or to change its type. This rule should make
1480 intuitive sense: you must wait for a borrowed value to be returned
1481 (that is, for the reference to go out of scope) before you can
1482 make full use of it again.
1483
1484 For a more in-depth explanation of references and lifetimes, read the
1485 [references and lifetimes guide][lifetimes].
1486
1487 ## Freezing
1488
1489 Lending an &-pointer to an object freezes it and prevents mutation—even if the object was declared as `mut`.
1490 `Freeze` objects have freezing enforced statically at compile-time. An example
1491 of a non-`Freeze` type is [`RefCell<T>`][refcell].
1492
1493 ~~~~
1494 let mut x = 5;
1495 {
1496     let y = &x; // `x` is now frozen. It cannot be modified or re-assigned.
1497 }
1498 // `x` is now unfrozen again
1499 # x = 3;
1500 ~~~~
1501
1502 [refcell]: http://doc.rust-lang.org/std/cell/struct.RefCell.html
1503
1504 # Dereferencing pointers
1505
1506 Rust uses the unary star operator (`*`) to access the contents of a
1507 box or pointer, similarly to C.
1508
1509 ~~~
1510 let owned = box 10;
1511 let borrowed = &20;
1512
1513 let sum = *owned + *borrowed;
1514 ~~~
1515
1516 Dereferenced mutable pointers may appear on the left hand side of
1517 assignments. Such an assignment modifies the value that the pointer
1518 points to.
1519
1520 ~~~
1521 let mut owned = box 10;
1522
1523 let mut value = 20;
1524 let borrowed = &mut value;
1525
1526 *owned = *borrowed + 100;
1527 *borrowed = *owned + 1000;
1528 ~~~
1529
1530 Pointers have high operator precedence, but lower precedence than the
1531 dot operator used for field and method access. This precedence order
1532 can sometimes make code awkward and parenthesis-filled.
1533
1534 ~~~
1535 # struct Point { x: f64, y: f64 }
1536 # enum Shape { Rectangle(Point, Point) }
1537 # impl Shape { fn area(&self) -> int { 0 } }
1538 let start = box Point { x: 10.0, y: 20.0 };
1539 let end = box Point { x: (*start).x + 100.0, y: (*start).y + 100.0 };
1540 let rect = &Rectangle(*start, *end);
1541 let area = (*rect).area();
1542 ~~~
1543
1544 To combat this ugliness the dot operator applies _automatic pointer
1545 dereferencing_ to the receiver (the value on the left-hand side of the
1546 dot), so in most cases, explicitly dereferencing the receiver is not necessary.
1547
1548 ~~~
1549 # struct Point { x: f64, y: f64 }
1550 # enum Shape { Rectangle(Point, Point) }
1551 # impl Shape { fn area(&self) -> int { 0 } }
1552 let start = box Point { x: 10.0, y: 20.0 };
1553 let end = box Point { x: start.x + 100.0, y: start.y + 100.0 };
1554 let rect = &Rectangle(*start, *end);
1555 let area = rect.area();
1556 ~~~
1557
1558 You can write an expression that dereferences any number of pointers
1559 automatically. For example, if you feel inclined, you could write
1560 something silly like
1561
1562 ~~~
1563 # struct Point { x: f64, y: f64 }
1564 let point = &box Point { x: 10.0, y: 20.0 };
1565 println!("{:f}", point.x);
1566 ~~~
1567
1568 The indexing operator (`[]`) also auto-dereferences.
1569
1570 # Vectors and strings
1571
1572 A vector is a contiguous block of memory containing zero or more values of the
1573 same type. Rust also supports vector reference types, called slices, which are
1574 a view into a block of memory represented as a pointer and a length.
1575
1576 Strings are represented as vectors of `u8`, with the guarantee of containing a
1577 valid UTF-8 sequence.
1578
1579 Fixed-size vectors are an unboxed block of memory, with the element length as
1580 part of the type. A fixed-size vector owns the elements it contains, so the
1581 elements are mutable if the vector is mutable. Fixed-size strings do not exist.
1582
1583 ~~~
1584 // A fixed-size vector
1585 let numbers = [1, 2, 3];
1586 let more_numbers = numbers;
1587
1588 // The type of a fixed-size vector is written as `[Type, ..length]`
1589 let five_zeroes: [int, ..5] = [0, ..5];
1590 ~~~
1591
1592 A unique vector is dynamically sized, and has a destructor to clean up
1593 allocated memory on the heap. A unique vector owns the elements it contains, so
1594 the elements are mutable if the vector is mutable.
1595
1596 ~~~
1597 use std::string::String;
1598
1599 // A dynamically sized vector (unique vector)
1600 let mut numbers = vec![1, 2, 3];
1601 numbers.push(4);
1602 numbers.push(5);
1603
1604 // The type of a unique vector is written as `Vec<int>`
1605 let more_numbers: Vec<int> = numbers.move_iter().map(|i| i+1).collect();
1606
1607 // The original `numbers` value can no longer be used, due to move semantics.
1608
1609 let mut string = String::from_str("fo");
1610 string.push_char('o');
1611 ~~~
1612
1613 Slices are similar to fixed-size vectors, but the length is not part of the
1614 type. They simply point into a block of memory and do not have ownership over
1615 the elements.
1616
1617 ~~~
1618 // A slice
1619 let xs = &[1, 2, 3];
1620
1621 // Slices have their type written as `&[int]`
1622 let ys: &[int] = xs;
1623
1624 // Other vector types coerce to slices
1625 let three = [1, 2, 3];
1626 let zs: &[int] = three;
1627
1628 // An unadorned string literal is an immutable string slice
1629 let string = "foobar";
1630
1631 // A string slice type is written as `&str`
1632 let view: &str = string.slice(0, 3);
1633 ~~~
1634
1635 Mutable slices also exist, just as there are mutable references. However, there
1636 are no mutable string slices. Strings are a multi-byte encoding (UTF-8) of
1637 Unicode code points, so they cannot be freely mutated without the ability to
1638 alter the length.
1639
1640 ~~~
1641 let mut xs = [1, 2, 3];
1642 let view = xs.mut_slice(0, 2);
1643 view[0] = 5;
1644
1645 // The type of a mutable slice is written as `&mut [T]`
1646 let ys: &mut [int] = &mut [1, 2, 3];
1647 ~~~
1648
1649 Square brackets denote indexing into a slice or fixed-size vector:
1650
1651 ~~~~
1652 # enum Crayon { Almond, AntiqueBrass, Apricot,
1653 #               Aquamarine, Asparagus, AtomicTangerine,
1654 #               BananaMania, Beaver, Bittersweet };
1655 # fn draw_scene(c: Crayon) { }
1656 let crayons: [Crayon, ..3] = [BananaMania, Beaver, Bittersweet];
1657 match crayons[0] {
1658     Bittersweet => draw_scene(crayons[0]),
1659     _ => ()
1660 }
1661 ~~~~
1662
1663 A slice or fixed-size vector can be destructured using pattern matching:
1664
1665 ~~~~
1666 let numbers: &[int] = &[1, 2, 3];
1667 let score = match numbers {
1668     [] => 0,
1669     [a] => a * 10,
1670     [a, b] => a * 6 + b * 4,
1671     [a, b, c, ..rest] => a * 5 + b * 3 + c * 2 + rest.len() as int
1672 };
1673 ~~~~
1674
1675 Both vectors and strings support a number of useful [methods](#methods),
1676 defined in [`std::vec`], [`std::slice`], and [`std::str`].
1677
1678 [`std::vec`]: std/vec/index.html
1679 [`std::slice`]: std/slice/index.html
1680 [`std::str`]: std/str/index.html
1681
1682 # Ownership escape hatches
1683
1684 Ownership can cleanly describe tree-like data structures, and references provide non-owning pointers. However, more flexibility is often desired and Rust provides ways to escape from strict
1685 single parent ownership.
1686
1687 The standard library provides the `std::rc::Rc` pointer type to express *shared ownership* over a
1688 reference counted box. As soon as all of the `Rc` pointers go out of scope, the box and the
1689 contained value are destroyed.
1690
1691 ~~~
1692 use std::rc::Rc;
1693
1694 // A fixed-size array allocated in a reference-counted box
1695 let x = Rc::new([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]);
1696 let y = x.clone(); // a new owner
1697 let z = x; // this moves `x` into `z`, rather than creating a new owner
1698
1699 assert!(*z == [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]);
1700
1701 // the variable is mutable, but not the contents of the box
1702 let mut a = Rc::new([10, 9, 8, 7, 6, 5, 4, 3, 2, 1]);
1703 a = z;
1704 ~~~
1705
1706 A garbage collected pointer is provided via `std::gc::Gc`, with a task-local garbage collector
1707 having ownership of the box. It allows the creation of cycles, and the individual `Gc` pointers do
1708 not have a destructor.
1709
1710 ~~~
1711 use std::gc::Gc;
1712
1713 // A fixed-size array allocated in a garbage-collected box
1714 let x = Gc::new([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]);
1715 let y = x; // does not perform a move, unlike with `Rc`
1716 let z = x;
1717
1718 assert!(*z.borrow() == [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]);
1719 ~~~
1720
1721 With shared ownership, mutability cannot be inherited so the boxes are always immutable. However,
1722 it's possible to use *dynamic* mutability via types like `std::cell::Cell` where freezing is handled
1723 via dynamic checks and can fail at runtime.
1724
1725 The `Rc` and `Gc` types are not sendable, so they cannot be used to share memory between tasks. Safe
1726 immutable and mutable shared memory is provided by the `sync::arc` module.
1727
1728 # Closures
1729
1730 Named functions, like those we've seen so far, may not refer to local
1731 variables declared outside the function: they do not close over their
1732 environment (sometimes referred to as "capturing" variables in their
1733 environment). For example, you couldn't write the following:
1734
1735 ~~~~ {.ignore}
1736 let x = 3;
1737
1738 // `fun` cannot refer to `x`
1739 fn fun() -> () { println!("{}", x); }
1740 ~~~~
1741
1742 A _closure_ does support accessing the enclosing scope; below we will create
1743 2 _closures_ (nameless functions). Compare how `||` replaces `()` and how
1744 they try to access `x`:
1745
1746 ~~~~ {.ignore}
1747 let x = 3;
1748
1749 // `fun` is an invalid definition
1750 fn  fun       () -> () { println!("{}", x) }  // cannot capture from enclosing scope
1751 let closure = || -> () { println!("{}", x) }; // can capture from enclosing scope
1752
1753 // `fun_arg` is an invalid definition
1754 fn  fun_arg       (arg: int) -> () { println!("{}", arg + x) }  // cannot capture
1755 let closure_arg = |arg: int| -> () { println!("{}", arg + x) }; // can capture
1756 //                      ^
1757 // Requires a type because the implementation needs to know which `+` to use.
1758 // In the future, the implementation may not need the help.
1759
1760 fun();          // Still won't work
1761 closure();      // Prints: 3
1762
1763 fun_arg(7);     // Still won't work
1764 closure_arg(7); // Prints: 10
1765 ~~~~
1766
1767 Closures begin with the argument list between vertical bars and are followed by
1768 a single expression. Remember that a block, `{ <expr1>; <expr2>; ... }`, is
1769 considered a single expression: it evaluates to the result of the last
1770 expression it contains if that expression is not followed by a semicolon,
1771 otherwise the block evaluates to `()`, the unit value.
1772
1773 In general, return types and all argument types must be specified
1774 explicitly for function definitions.  (As previously mentioned in the
1775 [Functions section](#functions), omitting the return type from a
1776 function declaration is synonymous with an explicit declaration of
1777 return type unit, `()`.)
1778
1779 ~~~~ {.ignore}
1780 fn  fun   (x: int)         { println!("{}", x) } // this is same as saying `-> ()`
1781 fn  square(x: int) -> uint { (x * x) as uint }   // other return types are explicit
1782
1783 // Error: mismatched types: expected `()` but found `uint`
1784 fn  badfun(x: int)         { (x * x) as uint }
1785 ~~~~
1786
1787 On the other hand, the compiler can usually infer both the argument
1788 and return types for a closure expression; therefore they are often
1789 omitted, since both a human reader and the compiler can deduce the
1790 types from the immediate context.  This is in contrast to function
1791 declarations, which require types to be specified and are not subject
1792 to type inference. Compare:
1793
1794 ~~~~ {.ignore}
1795 // `fun` as a function declaration cannot infer the type of `x`, so it must be provided
1796 fn  fun       (x: int) { println!("{}", x) }
1797 let closure = |x     | { println!("{}", x) }; // infers `x: int`, return type `()`
1798
1799 // For closures, omitting a return type is *not* synonymous with `-> ()`
1800 let add_3   = |y     | { 3i + y }; // infers `y: int`, return type `int`.
1801
1802 fun(10);            // Prints 10
1803 closure(20);        // Prints 20
1804 closure(add_3(30)); // Prints 33
1805
1806 fun("String"); // Error: mismatched types
1807
1808 // Error: mismatched types
1809 // inference already assigned `closure` the type `|int| -> ()`
1810 closure("String");
1811 ~~~~
1812
1813 In cases where the compiler needs assistance, the arguments and return
1814 types may be annotated on closures, using the same notation as shown
1815 earlier.  In the example below, since different types provide an
1816 implementation for the operator `*`, the argument type for the `x`
1817 parameter must be explicitly provided.
1818
1819 ~~~~{.ignore}
1820 // Error: the type of `x` must be known to be used with `x * x`
1821 let square = |x     | -> uint { (x * x) as uint };
1822 ~~~~
1823
1824 In the corrected version, the argument type is explicitly annotated,
1825 while the return type can still be inferred.
1826
1827 ~~~~
1828 let square_explicit = |x: int| -> uint { (x * x) as uint };
1829 let square_infer    = |x: int|         { (x * x) as uint };
1830
1831 println!("{}", square_explicit(20));  // 400
1832 println!("{}", square_infer(-20));    // 400
1833 ~~~~
1834
1835 There are several forms of closure, each with its own role. The most
1836 common, called a _stack closure_, has type `||` and can directly
1837 access local variables in the enclosing scope.
1838
1839 ~~~~
1840 let mut max = 0;
1841 let f = |x: int| if x > max { max = x };
1842 for x in [1, 2, 3].iter() {
1843     f(*x);
1844 }
1845 ~~~~
1846
1847 Stack closures are very efficient because their environment is
1848 allocated on the call stack and refers by pointer to captured
1849 locals. To ensure that stack closures never outlive the local
1850 variables to which they refer, stack closures are not
1851 first-class. That is, they can only be used in argument position; they
1852 cannot be stored in data structures or returned from
1853 functions. Despite these limitations, stack closures are used
1854 pervasively in Rust code.
1855
1856 ## Owned closures
1857
1858 Owned closures, written `proc`,
1859 hold on to things that can safely be sent between
1860 processes. They copy the values they close over,
1861 but they also own them: that is, no other code can access
1862 them. Owned closures are used in concurrent code, particularly
1863 for spawning [tasks][tasks].
1864
1865 Closures can be used to spawn tasks.
1866 A practical example of this pattern is found when using the `spawn` function,
1867 which starts a new task.
1868
1869 ~~~~
1870 use std::task::spawn;
1871
1872 // proc is the closure which will be spawned.
1873 spawn(proc() {
1874     println!("I'm a new task")
1875 });
1876 ~~~~
1877
1878 ## Closure compatibility
1879
1880 Rust closures have a convenient subtyping property: you can pass any kind of
1881 closure (as long as the arguments and return types match) to functions
1882 that expect a `||`. Thus, when writing a higher-order function that
1883 only calls its function argument, and does nothing else with it, you
1884 should almost always declare the type of that argument as `||`. That way,
1885 callers may pass any kind of closure.
1886
1887 ~~~~
1888 fn call_twice(f: ||) { f(); f(); }
1889 let closure = || { "I'm a closure, and it doesn't matter what type I am"; };
1890 fn function() { "I'm a normal function"; }
1891 call_twice(closure);
1892 call_twice(function);
1893 ~~~~
1894
1895 > *Note:* Both the syntax and the semantics will be changing
1896 > in small ways. At the moment they can be unsound in some
1897 > scenarios, particularly with non-copyable types.
1898
1899 # Methods
1900
1901 Methods are like functions except that they always begin with a special argument,
1902 called `self`,
1903 which has the type of the method's receiver. The
1904 `self` argument is like `this` in C++ and many other languages.
1905 Methods are called with dot notation, as in `my_vec.len()`.
1906
1907 _Implementations_, written with the `impl` keyword, can define
1908 methods on most Rust types, including structs and enums.
1909 As an example, let's define a `draw` method on our `Shape` enum.
1910
1911 ~~~
1912 # fn draw_circle(p: Point, f: f64) { }
1913 # fn draw_rectangle(p: Point, p: Point) { }
1914 struct Point {
1915     x: f64,
1916     y: f64
1917 }
1918
1919 enum Shape {
1920     Circle(Point, f64),
1921     Rectangle(Point, Point)
1922 }
1923
1924 impl Shape {
1925     fn draw(&self) {
1926         match *self {
1927             Circle(p, f) => draw_circle(p, f),
1928             Rectangle(p1, p2) => draw_rectangle(p1, p2)
1929         }
1930     }
1931 }
1932
1933 let s = Circle(Point { x: 1.0, y: 2.0 }, 3.0);
1934 s.draw();
1935 ~~~
1936
1937 This defines an _implementation_ for `Shape` containing a single
1938 method, `draw`. In most respects the `draw` method is defined
1939 like any other function, except for the name `self`.
1940
1941 The type of `self` is the type on which the method is implemented,
1942 or a pointer thereof. As an argument it is written either `self`,
1943 `&self`, or `~self`.
1944 A caller must in turn have a compatible pointer type to call the method.
1945
1946 ~~~
1947 # fn draw_circle(p: Point, f: f64) { }
1948 # fn draw_rectangle(p: Point, p: Point) { }
1949 # struct Point { x: f64, y: f64 }
1950 # enum Shape {
1951 #     Circle(Point, f64),
1952 #     Rectangle(Point, Point)
1953 # }
1954 impl Shape {
1955     fn draw_reference(&self) { /* ... */ }
1956     fn draw_owned(~self) { /* ... */ }
1957     fn draw_value(self) { /* ... */ }
1958 }
1959
1960 let s = Circle(Point { x: 1.0, y: 2.0 }, 3.0);
1961
1962 (&s).draw_reference();
1963 (box s).draw_owned();
1964 s.draw_value();
1965 ~~~
1966
1967 Methods typically take a reference self type,
1968 so the compiler will go to great lengths to convert a callee
1969 to a reference.
1970
1971 ~~~
1972 # fn draw_circle(p: Point, f: f64) { }
1973 # fn draw_rectangle(p: Point, p: Point) { }
1974 # struct Point { x: f64, y: f64 }
1975 # enum Shape {
1976 #     Circle(Point, f64),
1977 #     Rectangle(Point, Point)
1978 # }
1979 # impl Shape {
1980 #    fn draw_reference(&self) { /* ... */ }
1981 #    fn draw_owned(~self) { /* ... */ }
1982 #    fn draw_value(self) { /* ... */ }
1983 # }
1984 # let s = Circle(Point { x: 1.0, y: 2.0 }, 3.0);
1985 // As with typical function arguments, owned pointers
1986 // are automatically converted to references
1987
1988 (box s).draw_reference();
1989
1990 // Unlike typical function arguments, the self value will
1991 // automatically be referenced ...
1992 s.draw_reference();
1993
1994 // ... and dereferenced
1995 (& &s).draw_reference();
1996
1997 // ... and dereferenced and borrowed
1998 (&box s).draw_reference();
1999 ~~~
2000
2001 Implementations may also define standalone (sometimes called "static")
2002 methods. The absence of a `self` parameter distinguishes such methods.
2003 These methods are the preferred way to define constructor functions.
2004
2005 ~~~~ {.ignore}
2006 impl Circle {
2007     fn area(&self) -> f64 { /* ... */ }
2008     fn new(area: f64) -> Circle { /* ... */ }
2009 }
2010 ~~~~
2011
2012 To call such a method, just prefix it with the type name and a double colon:
2013
2014 ~~~~
2015 use std::f64::consts::PI;
2016 struct Circle { radius: f64 }
2017 impl Circle {
2018     fn new(area: f64) -> Circle { Circle { radius: (area / PI).sqrt() } }
2019 }
2020 let c = Circle::new(42.5);
2021 ~~~~
2022
2023 # Generics
2024
2025 Throughout this tutorial, we've been defining functions that act only
2026 on specific data types. With type parameters we can also define
2027 functions whose arguments have generic types, and which can be invoked
2028 with a variety of types. Consider a generic `map` function, which
2029 takes a function `function` and a vector `vector` and returns a new
2030 vector consisting of the result of applying `function` to each element
2031 of `vector`:
2032
2033 ~~~~
2034 fn map<T, U>(vector: &[T], function: |v: &T| -> U) -> Vec<U> {
2035     let mut accumulator = Vec::new();
2036     for element in vector.iter() {
2037         accumulator.push(function(element));
2038     }
2039     return accumulator;
2040 }
2041 ~~~~
2042
2043 When defined with type parameters, as denoted by `<T, U>`, this
2044 function can be applied to any type of vector, as long as the type of
2045 `function`'s argument and the type of the vector's contents agree with
2046 each other.
2047
2048 Inside a generic function, the names of the type parameters
2049 (capitalized by convention) stand for opaque types. All you can do
2050 with instances of these types is pass them around: you can't apply any
2051 operations to them or pattern-match on them. Note that instances of
2052 generic types are often passed by pointer. For example, the parameter
2053 `function()` is supplied with a pointer to a value of type `T` and not
2054 a value of type `T` itself. This ensures that the function works with
2055 the broadest set of types possible, since some types are expensive or
2056 illegal to copy and pass by value.
2057
2058 Generic `type`, `struct`, and `enum` declarations follow the same pattern:
2059
2060 ~~~~
2061 extern crate collections;
2062 type Set<T> = collections::HashMap<T, ()>;
2063
2064 struct Stack<T> {
2065     elements: Vec<T>
2066 }
2067
2068 enum Option<T> {
2069     Some(T),
2070     None
2071 }
2072 # fn main() {}
2073 ~~~~
2074
2075 These declarations can be instantiated to valid types like `Set<int>`,
2076 `Stack<int>`, and `Option<int>`.
2077
2078 The last type in that example, `Option`, appears frequently in Rust code.
2079 Because Rust does not have null pointers (except in unsafe code), we need
2080 another way to write a function whose result isn't defined on every possible
2081 combination of arguments of the appropriate types. The usual way is to write
2082 a function that returns `Option<T>` instead of `T`.
2083
2084 ~~~~
2085 # struct Point { x: f64, y: f64 }
2086 # enum Shape { Circle(Point, f64), Rectangle(Point, Point) }
2087 fn radius(shape: Shape) -> Option<f64> {
2088     match shape {
2089         Circle(_, radius) => Some(radius),
2090         Rectangle(..)     => None
2091     }
2092 }
2093 ~~~~
2094
2095 The Rust compiler compiles generic functions very efficiently by
2096 *monomorphizing* them. *Monomorphization* is a fancy name for a simple
2097 idea: generate a separate copy of each generic function at each call site,
2098 a copy that is specialized to the argument
2099 types and can thus be optimized specifically for them. In this
2100 respect, Rust's generics have similar performance characteristics to
2101 C++ templates.
2102
2103 ## Traits
2104
2105 Within a generic function—that is, a function parameterized by a
2106 type parameter, say, `T`—the operations we can do on arguments of
2107 type `T` are quite limited.  After all, since we don't know what type
2108 `T` will be instantiated with, we can't safely modify or query values
2109 of type `T`.  This is where _traits_ come into play. Traits are Rust's
2110 most powerful tool for writing polymorphic code. Java developers will
2111 see them as similar to Java interfaces, and Haskellers will notice
2112 their similarities to type classes. Rust's traits give us a way to
2113 express *bounded polymorphism*: by limiting the set of possible types
2114 that a type parameter could refer to, they expand the number of
2115 operations we can safely perform on arguments of that type.
2116
2117 As motivation, let us consider copying of values in Rust.  The `clone`
2118 method is not defined for values of every type.  One reason is
2119 user-defined destructors: copying a value of a type that has a
2120 destructor could result in the destructor running multiple times.
2121 Therefore, values of types that have destructors cannot be copied
2122 unless we explicitly implement `clone` for them.
2123
2124 This complicates handling of generic functions.
2125 If we have a function with a type parameter `T`,
2126 can we copy values of type `T` inside that function?
2127 In Rust, we can't,
2128 and if we try to run the following code the compiler will complain.
2129
2130 ~~~~ {.ignore}
2131 // This does not compile
2132 fn head_bad<T>(v: &[T]) -> T {
2133     v[0] // error: copying a non-copyable value
2134 }
2135 ~~~~
2136
2137 However, we can tell the compiler
2138 that the `head` function is only for copyable types.
2139 In Rust, copyable types are those that _implement the `Clone` trait_.
2140 We can then explicitly create a second copy of the value we are returning
2141 by calling the `clone` method:
2142
2143 ~~~~
2144 // This does
2145 fn head<T: Clone>(v: &[T]) -> T {
2146     v[0].clone()
2147 }
2148 ~~~~
2149
2150 The bounded type parameter `T: Clone` says that `head`
2151 can be called on an argument of type `&[T]` for any `T`,
2152 so long as there is an implementation of the
2153 `Clone` trait for `T`.
2154 When instantiating a generic function,
2155 we can only instantiate it with types
2156 that implement the correct trait,
2157 so we could not apply `head` to a vector whose elements are of some type
2158 that does not implement `Clone`.
2159
2160 While most traits can be defined and implemented by user code,
2161 three traits are automatically derived and implemented
2162 for all applicable types by the compiler,
2163 and may not be overridden:
2164
2165 * `Send` - Sendable types.
2166 Types are sendable
2167 unless they contain references.
2168
2169 * `Share` - Types that are *threadsafe*
2170 These are types that are safe to be used across several threads with access to
2171 a `&T` pointer. `Mutex<T>` is an example of a *sharable* type with internal mutable data.
2172
2173 * `'static` - Non-borrowed types.
2174 These are types that do not contain any data whose lifetime is bound to
2175 a particular stack frame. These are types that do not contain any
2176 references, or types where the only contained references
2177 have the `'static` lifetime. (For more on named lifetimes and their uses,
2178 see the [references and lifetimes guide][lifetimes].)
2179
2180 > *Note:* These built-in traits were referred to as 'kinds' in earlier
2181 > iterations of the language, and often still are.
2182
2183 Additionally, the `Drop` trait is used to define destructors. This
2184 trait provides one method called `drop`, which is automatically
2185 called when a value of the type that implements this trait is
2186 destroyed, either because the value went out of scope or because the
2187 garbage collector reclaimed it.
2188
2189 ~~~
2190 struct TimeBomb {
2191     explosivity: uint
2192 }
2193
2194 impl Drop for TimeBomb {
2195     fn drop(&mut self) {
2196         for _ in range(0, self.explosivity) {
2197             println!("blam!");
2198         }
2199     }
2200 }
2201 ~~~
2202
2203 It is illegal to call `drop` directly. Only code inserted by the compiler
2204 may call it.
2205
2206 ## Declaring and implementing traits
2207
2208 At its simplest, a trait is a set of zero or more _method signatures_.
2209 For example, we could declare the trait
2210 `Printable` for things that can be printed to the console,
2211 with a single method signature:
2212
2213 ~~~~
2214 trait Printable {
2215     fn print(&self);
2216 }
2217 ~~~~
2218
2219 We say that the `Printable` trait _provides_ a `print` method with the
2220 given signature.  This means that we can call `print` on an argument
2221 of any type that implements the `Printable` trait.
2222
2223 Rust's built-in `Send` and `Share` types are examples of traits that
2224 don't provide any methods.
2225
2226 Traits may be implemented for specific types with [impls]. An impl for
2227 a particular trait gives an implementation of the methods that
2228 trait provides.  For instance, the following impls of
2229 `Printable` for `int` and `String` give implementations of the `print`
2230 method.
2231
2232 [impls]: #methods
2233
2234 ~~~~
2235 # trait Printable { fn print(&self); }
2236 impl Printable for int {
2237     fn print(&self) { println!("{}", *self) }
2238 }
2239
2240 impl Printable for String {
2241     fn print(&self) { println!("{}", *self) }
2242 }
2243
2244 # 1.print();
2245 # ("foo".to_string()).print();
2246 ~~~~
2247
2248 Methods defined in an impl for a trait may be called just like
2249 any other method, using dot notation, as in `1.print()`.
2250
2251 ## Default method implementations in trait definitions
2252
2253 Sometimes, a method that a trait provides will have the same
2254 implementation for most or all of the types that implement that trait.
2255 For instance, suppose that we wanted `bool`s and `f32`s to be
2256 printable, and that we wanted the implementation of `print` for those
2257 types to be exactly as it is for `int`, above:
2258
2259 ~~~~
2260 # trait Printable { fn print(&self); }
2261 impl Printable for f32 {
2262     fn print(&self) { println!("{}", *self) }
2263 }
2264
2265 impl Printable for bool {
2266     fn print(&self) { println!("{}", *self) }
2267 }
2268
2269 # true.print();
2270 # 3.14159.print();
2271 ~~~~
2272
2273 This works fine, but we've now repeated the same definition of `print`
2274 in three places.  Instead of doing that, we can simply include the
2275 definition of `print` right in the trait definition, instead of just
2276 giving its signature.  That is, we can write the following:
2277
2278 ~~~~
2279 extern crate debug;
2280
2281 # fn main() {
2282 trait Printable {
2283     // Default method implementation
2284     fn print(&self) { println!("{:?}", *self) }
2285 }
2286
2287 impl Printable for int {}
2288
2289 impl Printable for String {
2290     fn print(&self) { println!("{}", *self) }
2291 }
2292
2293 impl Printable for bool {}
2294
2295 impl Printable for f32 {}
2296
2297 # 1.print();
2298 # ("foo".to_string()).print();
2299 # true.print();
2300 # 3.14159.print();
2301 # }
2302 ~~~~
2303
2304 Here, the impls of `Printable` for `int`, `bool`, and `f32` don't
2305 need to provide an implementation of `print`, because in the absence
2306 of a specific implementation, Rust just uses the _default method_
2307 provided in the trait definition.  Depending on the trait, default
2308 methods can save a great deal of boilerplate code from having to be
2309 written in impls.  Of course, individual impls can still override the
2310 default method for `print`, as is being done above in the impl for
2311 `String`.
2312
2313 ## Type-parameterized traits
2314
2315 Traits may be parameterized by type variables.  For example, a trait
2316 for generalized sequence types might look like the following:
2317
2318 ~~~~
2319 trait Seq<T> {
2320     fn length(&self) -> uint;
2321 }
2322
2323 impl<T> Seq<T> for Vec<T> {
2324     fn length(&self) -> uint { self.len() }
2325 }
2326 ~~~~
2327
2328 The implementation has to explicitly declare the type parameter that
2329 it binds, `T`, before using it to specify its trait type. Rust
2330 requires this declaration because the `impl` could also, for example,
2331 specify an implementation of `Seq<int>`. The trait type (appearing
2332 between `impl` and `for`) *refers* to a type, rather than
2333 defining one.
2334
2335 The type parameters bound by a trait are in scope in each of the
2336 method declarations. So, re-declaring the type parameter
2337 `T` as an explicit type parameter for `length`, in either the trait or
2338 the impl, would be a compile-time error.
2339
2340 Within a trait definition, `Self` is a special type that you can think
2341 of as a type parameter. An implementation of the trait for any given
2342 type `T` replaces the `Self` type parameter with `T`. The following
2343 trait describes types that support an equality operation:
2344
2345 ~~~~
2346 // In a trait, `self` refers to the self argument.
2347 // `Self` refers to the type implementing the trait.
2348 trait PartialEq {
2349     fn equals(&self, other: &Self) -> bool;
2350 }
2351
2352 // In an impl, `self` refers just to the value of the receiver
2353 impl PartialEq for int {
2354     fn equals(&self, other: &int) -> bool { *other == *self }
2355 }
2356 ~~~~
2357
2358 Notice that in the trait definition, `equals` takes a
2359 second parameter of type `Self`.
2360 In contrast, in the `impl`, `equals` takes a second parameter of
2361 type `int`, only using `self` as the name of the receiver.
2362
2363 Just as in type implementations, traits can define standalone (static)
2364 methods.  These methods are called by prefixing the method name with the trait
2365 name and a double colon.  The compiler uses type inference to decide which
2366 implementation to use.
2367
2368 ~~~~
2369 use std::f64::consts::PI;
2370 trait Shape { fn new(area: f64) -> Self; }
2371 struct Circle { radius: f64 }
2372 struct Square { length: f64 }
2373
2374 impl Shape for Circle {
2375     fn new(area: f64) -> Circle { Circle { radius: (area / PI).sqrt() } }
2376 }
2377 impl Shape for Square {
2378     fn new(area: f64) -> Square { Square { length: area.sqrt() } }
2379 }
2380
2381 let area = 42.5;
2382 let c: Circle = Shape::new(area);
2383 let s: Square = Shape::new(area);
2384 ~~~~
2385
2386 ## Bounded type parameters and static method dispatch
2387
2388 Traits give us a language for defining predicates on types, or
2389 abstract properties that types can have. We can use this language to
2390 define _bounds_ on type parameters, so that we can then operate on
2391 generic types.
2392
2393 ~~~~
2394 # trait Printable { fn print(&self); }
2395 fn print_all<T: Printable>(printable_things: Vec<T>) {
2396     for thing in printable_things.iter() {
2397         thing.print();
2398     }
2399 }
2400 ~~~~
2401
2402 Declaring `T` as conforming to the `Printable` trait (as we earlier
2403 did with `Clone`) makes it possible to call methods from that trait
2404 on values of type `T` inside the function. It will also cause a
2405 compile-time error when anyone tries to call `print_all` on a vector
2406 whose element type does not have a `Printable` implementation.
2407
2408 Type parameters can have multiple bounds by separating them with `+`,
2409 as in this version of `print_all` that copies elements.
2410
2411 ~~~
2412 # trait Printable { fn print(&self); }
2413 fn print_all<T: Printable + Clone>(printable_things: Vec<T>) {
2414     let mut i = 0;
2415     while i < printable_things.len() {
2416         let copy_of_thing = printable_things.get(i).clone();
2417         copy_of_thing.print();
2418         i += 1;
2419     }
2420 }
2421 ~~~
2422
2423 Method calls to bounded type parameters are _statically dispatched_,
2424 imposing no more overhead than normal function invocation, so are
2425 the preferred way to use traits polymorphically.
2426
2427 This usage of traits is similar to Haskell type classes.
2428
2429 ## Trait objects and dynamic method dispatch
2430
2431 The above allows us to define functions that polymorphically act on
2432 values of a single unknown type that conforms to a given trait.
2433 However, consider this function:
2434
2435 ~~~~
2436 # type Circle = int; type Rectangle = int;
2437 # impl Drawable for int { fn draw(&self) {} }
2438 # fn new_circle() -> int { 1 }
2439 trait Drawable { fn draw(&self); }
2440
2441 fn draw_all<T: Drawable>(shapes: Vec<T>) {
2442     for shape in shapes.iter() { shape.draw(); }
2443 }
2444 # let c: Circle = new_circle();
2445 # draw_all(vec![c]);
2446 ~~~~
2447
2448 You can call that on a vector of circles, or a vector of rectangles
2449 (assuming those have suitable `Drawable` traits defined), but not on
2450 a vector containing both circles and rectangles. When such behavior is
2451 needed, a trait name can alternately be used as a type, called
2452 an _object_.
2453
2454 ~~~~
2455 # trait Drawable { fn draw(&self); }
2456 fn draw_all(shapes: &[Box<Drawable>]) {
2457     for shape in shapes.iter() { shape.draw(); }
2458 }
2459 ~~~~
2460
2461 In this example, there is no type parameter. Instead, the `~Drawable`
2462 type denotes any owned box value that implements the `Drawable` trait.
2463 To construct such a value, you use the `as` operator to cast a value
2464 to an object:
2465
2466 ~~~~
2467 # type Circle = int; type Rectangle = bool;
2468 # trait Drawable { fn draw(&self); }
2469 # fn new_circle() -> Circle { 1 }
2470 # fn new_rectangle() -> Rectangle { true }
2471 # fn draw_all(shapes: &[Box<Drawable>]) {}
2472
2473 impl Drawable for Circle { fn draw(&self) { /* ... */ } }
2474 impl Drawable for Rectangle { fn draw(&self) { /* ... */ } }
2475
2476 let c: Box<Circle> = box new_circle();
2477 let r: Box<Rectangle> = box new_rectangle();
2478 draw_all([c as Box<Drawable>, r as Box<Drawable>]);
2479 ~~~~
2480
2481 We omit the code for `new_circle` and `new_rectangle`; imagine that
2482 these just return `Circle`s and `Rectangle`s with a default size. Note
2483 that, like strings and vectors, objects have dynamic size and may
2484 only be referred to via one of the pointer types.
2485 Other pointer types work as well.
2486 Casts to traits may only be done with compatible pointers so,
2487 for example, an `&Circle` may not be cast to a `Box<Drawable>`.
2488
2489 ~~~
2490 # type Circle = int; type Rectangle = int;
2491 # trait Drawable { fn draw(&self); }
2492 # impl Drawable for int { fn draw(&self) {} }
2493 # fn new_circle() -> int { 1 }
2494 # fn new_rectangle() -> int { 2 }
2495 // An owned object
2496 let owny: Box<Drawable> = box new_circle() as Box<Drawable>;
2497 // A borrowed object
2498 let stacky: &Drawable = &new_circle() as &Drawable;
2499 ~~~
2500
2501 Method calls to trait types are _dynamically dispatched_. Since the
2502 compiler doesn't know specifically which functions to call at compile
2503 time, it uses a lookup table (also known as a vtable or dictionary) to
2504 select the method to call at runtime.
2505
2506 This usage of traits is similar to Java interfaces.
2507
2508 There are some built-in bounds, such as `Send` and `Share`, which are properties
2509 of the components of types. By design, trait objects don't know the exact type
2510 of their contents and so the compiler cannot reason about those properties.
2511
2512 You can instruct the compiler, however, that the contents of a trait object must
2513 acribe to a particular bound with a trailing colon (`:`). These are examples of
2514 valid types:
2515
2516 ~~~rust
2517 trait Foo {}
2518 trait Bar<T> {}
2519
2520 fn sendable_foo(f: Box<Foo:Send>) { /* ... */ }
2521 fn shareable_bar<T: Share>(b: &Bar<T>: Share) { /* ... */ }
2522 ~~~
2523
2524 When no colon is specified (such as the type `~Foo`), it is inferred that the
2525 value ascribes to no bounds. They must be added manually if any bounds are
2526 necessary for usage.
2527
2528 Builtin kind bounds can also be specified on closure types in the same way (for
2529 example, by writing `fn:Send()`), and the default behaviours are the same as
2530 for traits of the same storage class.
2531
2532 ## Trait inheritance
2533
2534 We can write a trait declaration that _inherits_ from other traits, called _supertraits_.
2535 Types that implement a trait must also implement its supertraits.
2536 For example,
2537 we can define a `Circle` trait that inherits from `Shape`.
2538
2539 ~~~~
2540 trait Shape { fn area(&self) -> f64; }
2541 trait Circle : Shape { fn radius(&self) -> f64; }
2542 ~~~~
2543
2544 Now, we can implement `Circle` on a type only if we also implement `Shape`.
2545
2546 ~~~~
2547 use std::f64::consts::PI;
2548 # trait Shape { fn area(&self) -> f64; }
2549 # trait Circle : Shape { fn radius(&self) -> f64; }
2550 # struct Point { x: f64, y: f64 }
2551 # fn square(x: f64) -> f64 { x * x }
2552 struct CircleStruct { center: Point, radius: f64 }
2553 impl Circle for CircleStruct {
2554     fn radius(&self) -> f64 { (self.area() / PI).sqrt() }
2555 }
2556 impl Shape for CircleStruct {
2557     fn area(&self) -> f64 { PI * square(self.radius) }
2558 }
2559 ~~~~
2560
2561 Notice that methods of `Circle` can call methods on `Shape`, as our
2562 `radius` implementation calls the `area` method.
2563 This is a silly way to compute the radius of a circle
2564 (since we could just return the `radius` field), but you get the idea.
2565
2566 In type-parameterized functions,
2567 methods of the supertrait may be called on values of subtrait-bound type parameters.
2568 Refering to the previous example of `trait Circle : Shape`:
2569
2570 ~~~
2571 # trait Shape { fn area(&self) -> f64; }
2572 # trait Circle : Shape { fn radius(&self) -> f64; }
2573 fn radius_times_area<T: Circle>(c: T) -> f64 {
2574     // `c` is both a Circle and a Shape
2575     c.radius() * c.area()
2576 }
2577 ~~~
2578
2579 Likewise, supertrait methods may also be called on trait objects.
2580
2581 ~~~ {.ignore}
2582 use std::f64::consts::PI;
2583 # trait Shape { fn area(&self) -> f64; }
2584 # trait Circle : Shape { fn radius(&self) -> f64; }
2585 # struct Point { x: f64, y: f64 }
2586 # struct CircleStruct { center: Point, radius: f64 }
2587 # impl Circle for CircleStruct { fn radius(&self) -> f64 { (self.area() / PI).sqrt() } }
2588 # impl Shape for CircleStruct { fn area(&self) -> f64 { PI * square(self.radius) } }
2589
2590 let concrete = ~CircleStruct{center:Point{x:3.0,y:4.0},radius:5.0};
2591 let mycircle: ~Circle = concrete as ~Circle;
2592 let nonsense = mycircle.radius() * mycircle.area();
2593 ~~~
2594
2595 > *Note:* Trait inheritance does not actually work with objects yet
2596
2597 ## Deriving implementations for traits
2598
2599 A small number of traits in `std` and `extra` can have implementations
2600 that can be automatically derived. These instances are specified by
2601 placing the `deriving` attribute on a data type declaration. For
2602 example, the following will mean that `Circle` has an implementation
2603 for `PartialEq` and can be used with the equality operators, and that a value
2604 of type `ABC` can be randomly generated and converted to a string:
2605
2606 ~~~
2607 extern crate rand;
2608
2609 #[deriving(PartialEq)]
2610 struct Circle { radius: f64 }
2611
2612 #[deriving(Rand, Show)]
2613 enum ABC { A, B, C }
2614
2615 fn main() {
2616     // Use the Show trait to print "A, B, C."
2617     println!("{}, {}, {}", A, B, C);
2618 }
2619 ~~~
2620
2621 The full list of derivable traits is `PartialEq`, `TotalEq`, `Ord`,
2622 `TotalOrd`, `Encodable`, `Decodable`, `Clone`,
2623 `Hash`, `Rand`, `Default`, `Zero`, `FromPrimitive` and `Show`.
2624
2625 # Crates and the module system
2626
2627 Rust's module system is very powerful, but because of that also somewhat complex.
2628 Nevertheless, this section will try to explain every important aspect of it.
2629
2630 ## Crates
2631
2632 In order to speak about the module system, we first need to define the medium it exists in:
2633
2634 Let's say you've written a program or a library, compiled it, and got the resulting binary.
2635 In Rust, the content of all source code that the compiler directly had to compile in order to end up with
2636 that binary is collectively called a 'crate'.
2637
2638 For example, for a simple hello world program your crate only consists of this code:
2639
2640 ~~~~
2641 // `main.rs`
2642 fn main() {
2643     println!("Hello world!");
2644 }
2645 ~~~~
2646
2647 A crate is also the unit of independent compilation in Rust: `rustc` always compiles a single crate at a time,
2648 from which it produces either a library or an executable.
2649
2650 Note that merely using an already compiled library in your code does not make it part of your crate.
2651
2652 ## The module hierarchy
2653
2654 For every crate, all the code in it is arranged in a hierarchy of modules starting with a single
2655 root module. That root module is called the 'crate root'.
2656
2657 All modules in a crate below the crate root are declared with the `mod` keyword:
2658
2659 ~~~~
2660 // This is the crate root
2661
2662 mod farm {
2663     // This is the body of module 'farm' declared in the crate root.
2664
2665     fn chicken() { println!("cluck cluck"); }
2666     fn cow() { println!("mooo"); }
2667
2668     mod barn {
2669         // Body of module 'barn'
2670
2671         fn hay() { println!("..."); }
2672     }
2673 }
2674
2675 fn main() {
2676     println!("Hello farm!");
2677 }
2678 ~~~~
2679
2680 As you can see, your module hierarchy is now three modules deep: There is the crate root, which contains your `main()`
2681 function, and the module `farm`. The module `farm` also contains two functions and a third module `barn`,
2682 which contains a function `hay`.
2683
2684 ## Paths and visibility
2685
2686 We've now defined a nice module hierarchy. But how do we access the items in it from our `main` function?
2687 One way to do it is to simply fully qualifying it:
2688
2689 ~~~~ {.ignore}
2690 mod farm {
2691     fn chicken() { println!("cluck cluck"); }
2692     // ...
2693 }
2694
2695 fn main() {
2696     println!("Hello chicken!");
2697
2698     ::farm::chicken(); // Won't compile yet, see further down
2699 }
2700 ~~~~
2701
2702 The `::farm::chicken` construct is what we call a 'path'.
2703
2704 Because it's starting with a `::`, it's also a 'global path', which qualifies
2705 an item by its full path in the module hierarchy relative to the crate root.
2706
2707 If the path were to start with a regular identifier, like `farm::chicken`, it
2708 would be a 'local path' instead. We'll get to them later.
2709
2710 Now, if you actually tried to compile this code example, you'll notice that you
2711 get a `function 'chicken' is private` error. That's because by default, items
2712 (`fn`, `struct`, `static`, `mod`, ...) are private.
2713
2714 To make them visible outside their containing modules, you need to mark them
2715 _public_ with `pub`:
2716
2717 ~~~~
2718 mod farm {
2719     pub fn chicken() { println!("cluck cluck"); }
2720     pub fn cow() { println!("mooo"); }
2721     // ...
2722 }
2723
2724 fn main() {
2725     println!("Hello chicken!");
2726     ::farm::chicken(); // This compiles now
2727 }
2728 ~~~~
2729
2730 Visibility restrictions in Rust exist only at module boundaries. This
2731 is quite different from most object-oriented languages that also
2732 enforce restrictions on objects themselves. That's not to say that
2733 Rust doesn't support encapsulation: both struct fields and methods can
2734 be private. But this encapsulation is at the module level, not the
2735 struct level.
2736
2737 Fields are _private_ by default, and can be made _public_ with
2738 the `pub` keyword:
2739
2740 ~~~
2741 mod farm {
2742 # pub type Chicken = int;
2743 # struct Human(int);
2744 # impl Human { pub fn rest(&self) { } }
2745 # pub fn make_me_a_farm() -> Farm { Farm { chickens: vec![], farmer: Human(0) } }
2746     pub struct Farm {
2747         chickens: Vec<Chicken>,
2748         pub farmer: Human
2749     }
2750
2751     impl Farm {
2752         fn feed_chickens(&self) { /* ... */ }
2753         pub fn add_chicken(&self, c: Chicken) { /* ... */ }
2754     }
2755
2756     pub fn feed_animals(farm: &Farm) {
2757         farm.feed_chickens();
2758     }
2759 }
2760
2761 fn main() {
2762     let f = make_me_a_farm();
2763     f.add_chicken(make_me_a_chicken());
2764     farm::feed_animals(&f);
2765     f.farmer.rest();
2766
2767     // This wouldn't compile because both are private:
2768     // `f.feed_chickens();`
2769     // `let chicken_counter = f.chickens.len();`
2770 }
2771 # fn make_me_a_farm() -> farm::Farm { farm::make_me_a_farm() }
2772 # fn make_me_a_chicken() -> farm::Chicken { 0 }
2773 ~~~
2774
2775 Exact details and specifications about visibility rules can be found in the Rust
2776 manual.
2777
2778 ## Files and modules
2779
2780 One important aspect of Rust's module system is that source files and modules are not the same thing. You define a module hierarchy, populate it with all your definitions, define visibility, maybe put in a `fn main()`, and that's it.
2781
2782 The only file that's relevant when compiling is the one that contains the body
2783 of your crate root, and it's only relevant because you have to pass that file
2784 to `rustc` to compile your crate.
2785
2786 In principle, that's all you need: You can write any Rust program as one giant source file that contains your
2787 crate root and everything else in `mod ... { ... }` declarations.
2788
2789 However, in practice you usually want to split up your code into multiple
2790 source files to make it more manageable. Rust allows you to move the body of
2791 any module into its own source file. If you declare a module without its body,
2792 like `mod foo;`, the compiler will look for the files `foo.rs` and `foo/mod.rs`
2793 inside some directory (usually the same as of the source file containing the
2794 `mod foo;` declaration). If it finds either, it uses the content of that file
2795 as the body of the module. If it finds both, that's a compile error.
2796
2797 To move the content of `mod farm` into its own file, you can write:
2798
2799 ~~~~ {.ignore}
2800 // `main.rs` - contains body of the crate root
2801 mod farm; // Compiler will look for `farm.rs` and `farm/mod.rs`
2802
2803 fn main() {
2804     println!("Hello farm!");
2805     ::farm::cow();
2806 }
2807 ~~~~
2808
2809 ~~~~
2810 // `farm.rs` - contains body of module 'farm' in the crate root
2811 pub fn chicken() { println!("cluck cluck"); }
2812 pub fn cow() { println!("mooo"); }
2813
2814 pub mod barn {
2815     pub fn hay() { println!("..."); }
2816 }
2817 # fn main() { }
2818 ~~~~
2819
2820 In short, `mod foo;` is just syntactic sugar for `mod foo { /* content of <...>/foo.rs or <...>/foo/mod.rs */ }`.
2821
2822 This also means that having two or more identical `mod foo;` declarations
2823 somewhere in your crate hierarchy is generally a bad idea,
2824 just like copy-and-paste-ing a module into multiple places is a bad idea.
2825 Both will result in duplicate and mutually incompatible definitions.
2826
2827 When `rustc` resolves these module declarations, it starts by looking in the
2828 parent directory of the file containing the `mod foo` declaration. For example,
2829 given a file with the module body:
2830
2831 ~~~ {.ignore}
2832 // `src/main.rs`
2833 mod plants;
2834 mod animals {
2835     mod fish;
2836     mod mammals {
2837         mod humans;
2838     }
2839 }
2840 ~~~
2841
2842 The compiler will look for these files, in this order:
2843
2844 ~~~ {.notrust}
2845 src/plants.rs
2846 src/plants/mod.rs
2847
2848 src/animals/fish.rs
2849 src/animals/fish/mod.rs
2850
2851 src/animals/mammals/humans.rs
2852 src/animals/mammals/humans/mod.rs
2853 ~~~
2854
2855 Keep in mind that identical module hierarchies can still lead to different path
2856 lookups depending on how and where you've moved a module body to its own file.
2857 For example, if you move the `animals` module into its own file:
2858
2859 ~~~ {.ignore}
2860 // `src/main.rs`
2861 mod plants;
2862 mod animals;
2863 ~~~
2864
2865 ~~~ {.ignore}
2866 // `src/animals.rs` or `src/animals/mod.rs`
2867 mod fish;
2868 mod mammals {
2869     mod humans;
2870 }
2871 ~~~
2872
2873 ...then the source files of `mod animals`'s submodules can either be in the same directory as the animals source file or in a subdirectory of its directory. If the animals file is `src/animals.rs`, `rustc` will look for:
2874
2875 ~~~ {.notrust}
2876 src/animals.rs
2877     src/fish.rs
2878     src/fish/mod.rs
2879
2880     src/mammals/humans.rs
2881     src/mammals/humans/mod.rs
2882 ~~~
2883
2884 If the animals file is `src/animals/mod.rs`, `rustc` will look for:
2885
2886 ~~~ {.notrust}
2887 src/animals/mod.rs
2888     src/animals/fish.rs
2889     src/animals/fish/mod.rs
2890
2891     src/animals/mammals/humans.rs
2892     src/animals/mammals/humans/mod.rs
2893
2894 ~~~
2895
2896 These rules allow you to write small modules consisting of single source files which can live in the same directory as well as large modules which group submodule source files in subdirectories.
2897
2898 If you need to override where `rustc` will look for the file containing a
2899 module's source code, use the `path` compiler directive. For example, to load a
2900 `classified` module from a different file:
2901
2902 ~~~ {.ignore}
2903 #[path="../../area51/alien.rs"]
2904 mod classified;
2905 ~~~
2906
2907 ## Importing names into the local scope
2908
2909 Always referring to definitions in other modules with their global
2910 path gets old really fast, so Rust has a way to import
2911 them into the local scope of your module: `use`-statements.
2912
2913 They work like this: At the beginning of any module body, `fn` body, or any other block
2914 you can write a list of `use`-statements, consisting of the keyword `use` and a __global path__ to an item
2915 without the `::` prefix. For example, this imports `cow` into the local scope:
2916
2917 ~~~
2918 use farm::cow;
2919 # mod farm { pub fn cow() { println!("I'm a hidden ninja cow!") } }
2920 # fn main() { cow() }
2921 ~~~
2922
2923 The path you give to `use` is per default global, meaning relative to the crate root,
2924 no matter how deep the module hierarchy is, or whether the module body it's written in
2925 is contained in its own file. (Remember: files are irrelevant.)
2926
2927 This is different from other languages, where you often only find a single import construct that combines the semantic
2928 of `mod foo;` and `use`-statements, and which tend to work relative to the source file or use an absolute file path
2929 - Ruby's `require` or C/C++'s `#include` come to mind.
2930
2931 However, it's also possible to import things relative to the module of the `use`-statement:
2932 Adding a `super::` in front of the path will start in the parent module,
2933 while adding a `self::` prefix will start in the current module:
2934
2935 ~~~
2936 # mod workaround {
2937 # pub fn some_parent_item(){ println!("...") }
2938 # mod foo {
2939 use super::some_parent_item;
2940 use self::some_child_module::some_item;
2941 # pub fn bar() { some_parent_item(); some_item() }
2942 # pub mod some_child_module { pub fn some_item() {} }
2943 # }
2944 # }
2945 ~~~
2946
2947 Again - relative to the module, not to the file.
2948
2949 Imports are also shadowed by local definitions:
2950 For each name you mention in a module/block, `rust`
2951 will first look at all items that are defined locally,
2952 and only if that results in no match look at items you brought in
2953 scope with corresponding `use` statements.
2954
2955 ~~~ {.ignore}
2956 # // FIXME: Allow unused import in doc test
2957 use farm::cow;
2958 // ...
2959 # mod farm { pub fn cow() { println!("Hidden ninja cow is hidden.") } }
2960 fn cow() { println!("Mooo!") }
2961
2962 fn main() {
2963     cow() // resolves to the locally defined `cow()` function
2964 }
2965 ~~~
2966
2967 To make this behavior more obvious, the rule has been made that `use`-statement always need to be written
2968 before any declaration, like in the example above. This is a purely artificial rule introduced
2969 because people always assumed they shadowed each other based on order, despite the fact that all items in rust are
2970 mutually recursive, order independent definitions.
2971
2972 One odd consequence of that rule is that `use` statements also go in front of any `mod` declaration,
2973 even if they refer to things inside them:
2974
2975 ~~~
2976 use farm::cow;
2977 mod farm {
2978     pub fn cow() { println!("Moooooo?") }
2979 }
2980
2981 fn main() { cow() }
2982 ~~~
2983
2984 This is what our `farm` example looks like with `use` statements:
2985
2986 ~~~~
2987 use farm::chicken;
2988 use farm::cow;
2989 use farm::barn;
2990
2991 mod farm {
2992     pub fn chicken() { println!("cluck cluck"); }
2993     pub fn cow() { println!("mooo"); }
2994
2995     pub mod barn {
2996         pub fn hay() { println!("..."); }
2997     }
2998 }
2999
3000 fn main() {
3001     println!("Hello farm!");
3002
3003     // Can now refer to those names directly:
3004     chicken();
3005     cow();
3006     barn::hay();
3007 }
3008 ~~~~
3009
3010 And here an example with multiple files:
3011
3012 ~~~{.ignore}
3013 // `a.rs` - crate root
3014 use b::foo;
3015 use b::c::bar;
3016 mod b;
3017 fn main() {
3018     foo();
3019     bar();
3020 }
3021 ~~~
3022
3023 ~~~{.ignore}
3024 // `b/mod.rs`
3025 pub mod c;
3026 pub fn foo() { println!("Foo!"; }
3027 ~~~
3028
3029 ~~~{.ignore}
3030 // `b/c.rs`
3031 pub fn bar() { println!("Bar!"); }
3032 ~~~
3033
3034 There also exist two short forms for importing multiple names at once:
3035
3036 1. Explicit mention multiple names as the last element of an `use` path:
3037
3038 ~~~
3039 use farm::{chicken, cow};
3040 # mod farm {
3041 #     pub fn cow() { println!("Did I already mention how hidden and ninja I am?") }
3042 #     pub fn chicken() { println!("I'm Bat-chicken, guardian of the hidden tutorial code.") }
3043 # }
3044 # fn main() { cow(); chicken() }
3045 ~~~
3046
3047 2. Import everything in a module with a wildcard:
3048
3049 ~~~
3050 use farm::*;
3051 # mod farm {
3052 #     pub fn cow() { println!("Bat-chicken? What a stupid name!") }
3053 #     pub fn chicken() { println!("Says the 'hidden ninja' cow.") }
3054 # }
3055 # fn main() { cow(); chicken() }
3056 ~~~
3057
3058 > *Note:* This feature of the compiler is currently gated behind the
3059 > `#![feature(globs)]` directive. More about these directives can be found in
3060 > the manual.
3061
3062 However, that's not all. You can also rename an item while you're bringing it into scope:
3063
3064 ~~~
3065 use egg_layer = farm::chicken;
3066 # mod farm { pub fn chicken() { println!("Laying eggs is fun!")  } }
3067 // ...
3068
3069 fn main() {
3070     egg_layer();
3071 }
3072 ~~~
3073
3074 In general, `use` creates a local alias:
3075 An alternate path and a possibly different name to access the same item,
3076 without touching the original, and with both being interchangeable.
3077
3078 ## Reexporting names
3079
3080 It is also possible to reexport items to be accessible under your module.
3081
3082 For that, you write `pub use`:
3083
3084 ~~~
3085 mod farm {
3086     pub use self::barn::hay;
3087
3088     pub fn chicken() { println!("cluck cluck"); }
3089     pub fn cow() { println!("mooo"); }
3090
3091     mod barn {
3092         pub fn hay() { println!("..."); }
3093     }
3094 }
3095
3096 fn main() {
3097     farm::chicken();
3098     farm::cow();
3099     farm::hay();
3100 }
3101 ~~~
3102
3103 Just like in normal `use` statements, the exported names
3104 merely represent an alias to the same thing and can also be renamed.
3105
3106 The above example also demonstrate what you can use `pub use` for:
3107 The nested `barn` module is private, but the `pub use` allows users
3108 of the module `farm` to access a function from `barn` without needing
3109 to know that `barn` exists.
3110
3111 In other words, you can use it to decouple a public api from its internal implementation.
3112
3113 ## Using libraries
3114
3115 So far we've only talked about how to define and structure your own crate.
3116
3117 However, most code out there will want to use preexisting libraries,
3118 as there really is no reason to start from scratch each time you start a new project.
3119
3120 In Rust terminology, we need a way to refer to other crates.
3121
3122 For that, Rust offers you the `extern crate` declaration:
3123
3124 ~~~
3125 extern crate num;
3126 // `num` ships with Rust (much like `extra`; more details further down).
3127
3128 fn main() {
3129     // The rational number '1/2':
3130     let one_half = ::num::rational::Ratio::new(1, 2);
3131 }
3132 ~~~
3133
3134 A statement of the form `extern crate foo;` will cause `rustc` to search for the crate `foo`,
3135 and if it finds a matching binary it lets you use it from inside your crate.
3136
3137 The effect it has on your module hierarchy mirrors aspects of both `mod` and `use`:
3138
3139 - Like `mod`, it causes `rustc` to actually emit code:
3140   The linkage information the binary needs to use the library `foo`.
3141
3142 - But like `use`, all `extern crate` statements that refer to the same library are interchangeable,
3143   as each one really just presents an alias to an external module (the crate root of the library
3144   you're linking against).
3145
3146 Remember how `use`-statements have to go before local declarations because the latter shadows the former?
3147 Well, `extern crate` statements also have their own rules in that regard:
3148 Both `use` and local declarations can shadow them, so the rule is that `extern crate` has to go in front
3149 of both `use` and local declarations.
3150
3151 Which can result in something like this:
3152
3153 ~~~
3154 extern crate num;
3155
3156 use farm::dog;
3157 use num::rational::Ratio;
3158
3159 mod farm {
3160     pub fn dog() { println!("woof"); }
3161 }
3162
3163 fn main() {
3164     farm::dog();
3165     let a_third = Ratio::new(1, 3);
3166 }
3167 ~~~
3168
3169 It's a bit weird, but it's the result of shadowing rules that have been set that way because
3170 they model most closely what people expect to shadow.
3171
3172 ## Crate metadata and settings
3173
3174 For every crate you can define a number of metadata items, such as link name, version or author.
3175 You can also toggle settings that have crate-global consequences. Both mechanism
3176 work by providing attributes in the crate root.
3177
3178 For example, Rust uniquely identifies crates by their link metadata, which includes
3179 the link name and the version. It also hashes the filename and the symbols in a binary
3180 based on the link metadata, allowing you to use two different versions of the same library in a crate
3181 without conflict.
3182
3183 Therefore, if you plan to compile your crate as a library, you should annotate it with that information:
3184
3185 ~~~~
3186 # #![allow(unused_attribute)]
3187 // `lib.rs`
3188
3189 # #![crate_type = "lib"]
3190 #![crate_id = "farm#2.5"]
3191
3192 // ...
3193 # fn farm() {}
3194 ~~~~
3195
3196 You can also specify crate id information in a `extern crate` statement.  For
3197 example, these `extern crate` statements would both accept and select the
3198 crate define above:
3199
3200 ~~~~ {.ignore}
3201 extern crate farm;
3202 extern crate farm = "farm#2.5";
3203 extern crate my_farm = "farm";
3204 ~~~~
3205
3206 Other crate settings and metadata include things like enabling/disabling certain errors or warnings,
3207 or setting the crate type (library or executable) explicitly:
3208
3209 ~~~~
3210 # #![allow(unused_attribute)]
3211 // `lib.rs`
3212 // ...
3213
3214 // This crate is a library ("bin" is the default)
3215 #![crate_id = "farm#2.5"]
3216 #![crate_type = "lib"]
3217
3218 // Turn on a warning
3219 #[warn(non_camel_case_types)]
3220 # fn farm() {}
3221 ~~~~
3222
3223 ## A minimal example
3224
3225 Now for something that you can actually compile yourself.
3226
3227 We define two crates, and use one of them as a library in the other.
3228
3229 ~~~~
3230 # #![allow(unused_attribute)]
3231 // `world.rs`
3232 #![crate_id = "world#0.42"]
3233
3234 # mod secret_module_to_make_this_test_run {
3235 pub fn explore() -> &'static str { "world" }
3236 # }
3237 ~~~~
3238
3239 ~~~~ {.ignore}
3240 // `main.rs`
3241 extern crate world;
3242 fn main() { println!("hello {}", world::explore()); }
3243 ~~~~
3244
3245 Now compile and run like this (adjust to your platform if necessary):
3246
3247 ~~~~ {.notrust}
3248 > rustc --crate-type=lib world.rs  # compiles libworld-<HASH>-0.42.so
3249 > rustc main.rs -L .               # compiles main
3250 > ./main
3251 "hello world"
3252 ~~~~
3253
3254 Notice that the library produced contains the version in the file name
3255 as well as an inscrutable string of alphanumerics. As explained in the previous paragraph,
3256 these are both part of Rust's library versioning scheme. The alphanumerics are
3257 a hash representing the crate's id.
3258
3259 ## The standard library and the prelude
3260
3261 While reading the examples in this tutorial, you might have asked yourself where all
3262 those magical predefined items like `range` are coming from.
3263
3264 The truth is, there's nothing magical about them: They are all defined normally
3265 in the `std` library, which is a crate that ships with Rust.
3266
3267 The only magical thing that happens is that `rustc` automatically inserts this line into your crate root:
3268
3269 ~~~ {.ignore}
3270 extern crate std;
3271 ~~~
3272
3273 As well as this line into every module body:
3274
3275 ~~~ {.ignore}
3276 use std::prelude::*;
3277 ~~~
3278
3279 The role of the `prelude` module is to re-export common definitions from `std`.
3280
3281 This allows you to use common types and functions like `Option<T>` or `range`
3282 without needing to import them. And if you need something from `std` that's not in the prelude,
3283 you just have to import it with an `use` statement.
3284
3285 For example, it re-exports `range` which is defined in `std::iter::range`:
3286
3287 ~~~
3288 use iter_range = std::iter::range;
3289
3290 fn main() {
3291     // `range` is imported by default
3292     for _ in range(0, 10) {}
3293
3294     // Doesn't hinder you from importing it under a different name yourself
3295     for _ in iter_range(0, 10) {}
3296
3297     // Or from not using the automatic import.
3298     for _ in ::std::iter::range(0, 10) {}
3299 }
3300 ~~~
3301
3302 Both auto-insertions can be disabled with an attribute if necessary:
3303
3304 ~~~
3305 # #![allow(unused_attribute)]
3306 // In the crate root:
3307 #![no_std]
3308 ~~~
3309
3310 ~~~
3311 # #![allow(unused_attribute)]
3312 // In any module:
3313 #![no_implicit_prelude]
3314 ~~~
3315
3316 See the [API documentation][stddoc] for details.
3317
3318 [stddoc]: std/index.html
3319
3320 # What next?
3321
3322 Now that you know the essentials, check out any of the additional
3323 guides on individual topics.
3324
3325 * [Pointers][pointers]
3326 * [Lifetimes][lifetimes]
3327 * [Tasks and communication][tasks]
3328 * [Macros][macros]
3329 * [The foreign function interface][ffi]
3330 * [Containers and iterators][container]
3331 * [Documenting Rust code][rustdoc]
3332 * [Testing Rust code][testing]
3333 * [The Rust Runtime][runtime]
3334
3335 There is further documentation on the [wiki], however those tend to be even more out of date as this document.
3336
3337 [pointers]: guide-pointers.html
3338 [lifetimes]: guide-lifetimes.html
3339 [tasks]: guide-tasks.html
3340 [macros]: guide-macros.html
3341 [ffi]: guide-ffi.html
3342 [container]: guide-container.html
3343 [testing]: guide-testing.html
3344 [runtime]: guide-runtime.html
3345 [rustdoc]: rustdoc.html
3346 [wiki]: https://github.com/mozilla/rust/wiki/Docs
3347
3348 [wiki-packages]: https://github.com/mozilla/rust/wiki/Doc-packages,-editors,-and-other-tools