]> git.lizzy.rs Git - rust.git/blob - src/libnative/io/net.rs
native: Add some documentation for accept
[rust.git] / src / libnative / io / net.rs
1 // Copyright 2013-2014 The Rust Project Developers. See the COPYRIGHT
2 // file at the top-level directory of this distribution and at
3 // http://rust-lang.org/COPYRIGHT.
4 //
5 // Licensed under the Apache License, Version 2.0 <LICENSE-APACHE or
6 // http://www.apache.org/licenses/LICENSE-2.0> or the MIT license
7 // <LICENSE-MIT or http://opensource.org/licenses/MIT>, at your
8 // option. This file may not be copied, modified, or distributed
9 // except according to those terms.
10
11 use alloc::arc::Arc;
12 use libc;
13 use std::mem;
14 use std::ptr;
15 use std::rt::mutex;
16 use std::rt::rtio;
17 use std::rt::rtio::{IoResult, IoError};
18 use std::sync::atomics;
19
20 use super::{retry, keep_going};
21 use super::c;
22 use super::util;
23
24 #[cfg(unix)] use super::process;
25 #[cfg(unix)] use super::file::FileDesc;
26
27 pub use self::os::{init, sock_t, last_error};
28
29 ////////////////////////////////////////////////////////////////////////////////
30 // sockaddr and misc bindings
31 ////////////////////////////////////////////////////////////////////////////////
32
33 pub fn htons(u: u16) -> u16 {
34     u.to_be()
35 }
36 pub fn ntohs(u: u16) -> u16 {
37     Int::from_be(u)
38 }
39
40 enum InAddr {
41     InAddr(libc::in_addr),
42     In6Addr(libc::in6_addr),
43 }
44
45 fn ip_to_inaddr(ip: rtio::IpAddr) -> InAddr {
46     match ip {
47         rtio::Ipv4Addr(a, b, c, d) => {
48             let ip = (a as u32 << 24) |
49                      (b as u32 << 16) |
50                      (c as u32 <<  8) |
51                      (d as u32 <<  0);
52             InAddr(libc::in_addr {
53                 s_addr: Int::from_be(ip)
54             })
55         }
56         rtio::Ipv6Addr(a, b, c, d, e, f, g, h) => {
57             In6Addr(libc::in6_addr {
58                 s6_addr: [
59                     htons(a),
60                     htons(b),
61                     htons(c),
62                     htons(d),
63                     htons(e),
64                     htons(f),
65                     htons(g),
66                     htons(h),
67                 ]
68             })
69         }
70     }
71 }
72
73 fn addr_to_sockaddr(addr: rtio::SocketAddr,
74                     storage: &mut libc::sockaddr_storage)
75                     -> libc::socklen_t {
76     unsafe {
77         let len = match ip_to_inaddr(addr.ip) {
78             InAddr(inaddr) => {
79                 let storage = storage as *mut _ as *mut libc::sockaddr_in;
80                 (*storage).sin_family = libc::AF_INET as libc::sa_family_t;
81                 (*storage).sin_port = htons(addr.port);
82                 (*storage).sin_addr = inaddr;
83                 mem::size_of::<libc::sockaddr_in>()
84             }
85             In6Addr(inaddr) => {
86                 let storage = storage as *mut _ as *mut libc::sockaddr_in6;
87                 (*storage).sin6_family = libc::AF_INET6 as libc::sa_family_t;
88                 (*storage).sin6_port = htons(addr.port);
89                 (*storage).sin6_addr = inaddr;
90                 mem::size_of::<libc::sockaddr_in6>()
91             }
92         };
93         return len as libc::socklen_t;
94     }
95 }
96
97 fn socket(addr: rtio::SocketAddr, ty: libc::c_int) -> IoResult<sock_t> {
98     unsafe {
99         let fam = match addr.ip {
100             rtio::Ipv4Addr(..) => libc::AF_INET,
101             rtio::Ipv6Addr(..) => libc::AF_INET6,
102         };
103         match libc::socket(fam, ty, 0) {
104             -1 => Err(os::last_error()),
105             fd => Ok(fd),
106         }
107     }
108 }
109
110 fn setsockopt<T>(fd: sock_t, opt: libc::c_int, val: libc::c_int,
111                  payload: T) -> IoResult<()> {
112     unsafe {
113         let payload = &payload as *const T as *const libc::c_void;
114         let ret = libc::setsockopt(fd, opt, val,
115                                    payload,
116                                    mem::size_of::<T>() as libc::socklen_t);
117         if ret != 0 {
118             Err(os::last_error())
119         } else {
120             Ok(())
121         }
122     }
123 }
124
125 pub fn getsockopt<T: Copy>(fd: sock_t, opt: libc::c_int,
126                            val: libc::c_int) -> IoResult<T> {
127     unsafe {
128         let mut slot: T = mem::zeroed();
129         let mut len = mem::size_of::<T>() as libc::socklen_t;
130         let ret = c::getsockopt(fd, opt, val,
131                                 &mut slot as *mut _ as *mut _,
132                                 &mut len);
133         if ret != 0 {
134             Err(os::last_error())
135         } else {
136             assert!(len as uint == mem::size_of::<T>());
137             Ok(slot)
138         }
139     }
140 }
141
142 fn sockname(fd: sock_t,
143             f: unsafe extern "system" fn(sock_t, *mut libc::sockaddr,
144                                          *mut libc::socklen_t) -> libc::c_int)
145     -> IoResult<rtio::SocketAddr>
146 {
147     let mut storage: libc::sockaddr_storage = unsafe { mem::zeroed() };
148     let mut len = mem::size_of::<libc::sockaddr_storage>() as libc::socklen_t;
149     unsafe {
150         let storage = &mut storage as *mut libc::sockaddr_storage;
151         let ret = f(fd,
152                     storage as *mut libc::sockaddr,
153                     &mut len as *mut libc::socklen_t);
154         if ret != 0 {
155             return Err(os::last_error())
156         }
157     }
158     return sockaddr_to_addr(&storage, len as uint);
159 }
160
161 pub fn sockaddr_to_addr(storage: &libc::sockaddr_storage,
162                         len: uint) -> IoResult<rtio::SocketAddr> {
163     match storage.ss_family as libc::c_int {
164         libc::AF_INET => {
165             assert!(len as uint >= mem::size_of::<libc::sockaddr_in>());
166             let storage: &libc::sockaddr_in = unsafe {
167                 mem::transmute(storage)
168             };
169             let ip = (storage.sin_addr.s_addr as u32).to_be();
170             let a = (ip >> 24) as u8;
171             let b = (ip >> 16) as u8;
172             let c = (ip >>  8) as u8;
173             let d = (ip >>  0) as u8;
174             Ok(rtio::SocketAddr {
175                 ip: rtio::Ipv4Addr(a, b, c, d),
176                 port: ntohs(storage.sin_port),
177             })
178         }
179         libc::AF_INET6 => {
180             assert!(len as uint >= mem::size_of::<libc::sockaddr_in6>());
181             let storage: &libc::sockaddr_in6 = unsafe {
182                 mem::transmute(storage)
183             };
184             let a = ntohs(storage.sin6_addr.s6_addr[0]);
185             let b = ntohs(storage.sin6_addr.s6_addr[1]);
186             let c = ntohs(storage.sin6_addr.s6_addr[2]);
187             let d = ntohs(storage.sin6_addr.s6_addr[3]);
188             let e = ntohs(storage.sin6_addr.s6_addr[4]);
189             let f = ntohs(storage.sin6_addr.s6_addr[5]);
190             let g = ntohs(storage.sin6_addr.s6_addr[6]);
191             let h = ntohs(storage.sin6_addr.s6_addr[7]);
192             Ok(rtio::SocketAddr {
193                 ip: rtio::Ipv6Addr(a, b, c, d, e, f, g, h),
194                 port: ntohs(storage.sin6_port),
195             })
196         }
197         _ => {
198             #[cfg(unix)] use libc::EINVAL as ERROR;
199             #[cfg(windows)] use libc::WSAEINVAL as ERROR;
200             Err(IoError {
201                 code: ERROR as uint,
202                 extra: 0,
203                 detail: None,
204             })
205         }
206     }
207 }
208
209 ////////////////////////////////////////////////////////////////////////////////
210 // TCP streams
211 ////////////////////////////////////////////////////////////////////////////////
212
213 pub struct TcpStream {
214     inner: Arc<Inner>,
215     read_deadline: u64,
216     write_deadline: u64,
217 }
218
219 struct Inner {
220     fd: sock_t,
221
222     // Unused on Linux, where this lock is not necessary.
223     #[allow(dead_code)]
224     lock: mutex::NativeMutex
225 }
226
227 pub struct Guard<'a> {
228     pub fd: sock_t,
229     pub guard: mutex::LockGuard<'a>,
230 }
231
232 impl Inner {
233     fn new(fd: sock_t) -> Inner {
234         Inner { fd: fd, lock: unsafe { mutex::NativeMutex::new() } }
235     }
236 }
237
238 impl TcpStream {
239     pub fn connect(addr: rtio::SocketAddr,
240                    timeout: Option<u64>) -> IoResult<TcpStream> {
241         let fd = try!(socket(addr, libc::SOCK_STREAM));
242         let ret = TcpStream::new(Inner::new(fd));
243
244         let mut storage = unsafe { mem::zeroed() };
245         let len = addr_to_sockaddr(addr, &mut storage);
246         let addrp = &storage as *const _ as *const libc::sockaddr;
247
248         match timeout {
249             Some(timeout) => {
250                 try!(util::connect_timeout(fd, addrp, len, timeout));
251                 Ok(ret)
252             },
253             None => {
254                 match retry(|| unsafe { libc::connect(fd, addrp, len) }) {
255                     -1 => Err(os::last_error()),
256                     _ => Ok(ret),
257                 }
258             }
259         }
260     }
261
262     fn new(inner: Inner) -> TcpStream {
263         TcpStream {
264             inner: Arc::new(inner),
265             read_deadline: 0,
266             write_deadline: 0,
267         }
268     }
269
270     pub fn fd(&self) -> sock_t { self.inner.fd }
271
272     fn set_nodelay(&mut self, nodelay: bool) -> IoResult<()> {
273         setsockopt(self.fd(), libc::IPPROTO_TCP, libc::TCP_NODELAY,
274                    nodelay as libc::c_int)
275     }
276
277     fn set_keepalive(&mut self, seconds: Option<uint>) -> IoResult<()> {
278         let ret = setsockopt(self.fd(), libc::SOL_SOCKET, libc::SO_KEEPALIVE,
279                              seconds.is_some() as libc::c_int);
280         match seconds {
281             Some(n) => ret.and_then(|()| self.set_tcp_keepalive(n)),
282             None => ret,
283         }
284     }
285
286     #[cfg(target_os = "macos")]
287     #[cfg(target_os = "ios")]
288     fn set_tcp_keepalive(&mut self, seconds: uint) -> IoResult<()> {
289         setsockopt(self.fd(), libc::IPPROTO_TCP, libc::TCP_KEEPALIVE,
290                    seconds as libc::c_int)
291     }
292     #[cfg(target_os = "freebsd")]
293     #[cfg(target_os = "dragonfly")]
294     fn set_tcp_keepalive(&mut self, seconds: uint) -> IoResult<()> {
295         setsockopt(self.fd(), libc::IPPROTO_TCP, libc::TCP_KEEPIDLE,
296                    seconds as libc::c_int)
297     }
298     #[cfg(not(target_os = "macos"), not(target_os = "ios"), not(target_os = "freebsd"),
299       not(target_os = "dragonfly"))]
300     fn set_tcp_keepalive(&mut self, _seconds: uint) -> IoResult<()> {
301         Ok(())
302     }
303
304     #[cfg(target_os = "linux")]
305     fn lock_nonblocking(&self) {}
306
307     #[cfg(not(target_os = "linux"))]
308     fn lock_nonblocking<'a>(&'a self) -> Guard<'a> {
309         let ret = Guard {
310             fd: self.fd(),
311             guard: unsafe { self.inner.lock.lock() },
312         };
313         assert!(util::set_nonblocking(self.fd(), true).is_ok());
314         ret
315     }
316 }
317
318 #[cfg(windows)] type wrlen = libc::c_int;
319 #[cfg(not(windows))] type wrlen = libc::size_t;
320
321 impl rtio::RtioTcpStream for TcpStream {
322     fn read(&mut self, buf: &mut [u8]) -> IoResult<uint> {
323         let fd = self.fd();
324         let dolock = || self.lock_nonblocking();
325         let doread = |nb| unsafe {
326             let flags = if nb {c::MSG_DONTWAIT} else {0};
327             libc::recv(fd,
328                        buf.as_mut_ptr() as *mut libc::c_void,
329                        buf.len() as wrlen,
330                        flags) as libc::c_int
331         };
332         read(fd, self.read_deadline, dolock, doread)
333     }
334
335     fn write(&mut self, buf: &[u8]) -> IoResult<()> {
336         let fd = self.fd();
337         let dolock = || self.lock_nonblocking();
338         let dowrite = |nb: bool, buf: *const u8, len: uint| unsafe {
339             let flags = if nb {c::MSG_DONTWAIT} else {0};
340             libc::send(fd,
341                        buf as *mut libc::c_void,
342                        len as wrlen,
343                        flags) as i64
344         };
345         match write(fd, self.write_deadline, buf, true, dolock, dowrite) {
346             Ok(_) => Ok(()),
347             Err(e) => Err(e)
348         }
349     }
350     fn peer_name(&mut self) -> IoResult<rtio::SocketAddr> {
351         sockname(self.fd(), libc::getpeername)
352     }
353     fn control_congestion(&mut self) -> IoResult<()> {
354         self.set_nodelay(false)
355     }
356     fn nodelay(&mut self) -> IoResult<()> {
357         self.set_nodelay(true)
358     }
359     fn keepalive(&mut self, delay_in_seconds: uint) -> IoResult<()> {
360         self.set_keepalive(Some(delay_in_seconds))
361     }
362     fn letdie(&mut self) -> IoResult<()> {
363         self.set_keepalive(None)
364     }
365
366     fn clone(&self) -> Box<rtio::RtioTcpStream + Send> {
367         box TcpStream {
368             inner: self.inner.clone(),
369             read_deadline: 0,
370             write_deadline: 0,
371         } as Box<rtio::RtioTcpStream + Send>
372     }
373
374     fn close_write(&mut self) -> IoResult<()> {
375         super::mkerr_libc(unsafe { libc::shutdown(self.fd(), libc::SHUT_WR) })
376     }
377     fn close_read(&mut self) -> IoResult<()> {
378         super::mkerr_libc(unsafe { libc::shutdown(self.fd(), libc::SHUT_RD) })
379     }
380
381     fn set_timeout(&mut self, timeout: Option<u64>) {
382         let deadline = timeout.map(|a| ::io::timer::now() + a).unwrap_or(0);
383         self.read_deadline = deadline;
384         self.write_deadline = deadline;
385     }
386     fn set_read_timeout(&mut self, timeout: Option<u64>) {
387         self.read_deadline = timeout.map(|a| ::io::timer::now() + a).unwrap_or(0);
388     }
389     fn set_write_timeout(&mut self, timeout: Option<u64>) {
390         self.write_deadline = timeout.map(|a| ::io::timer::now() + a).unwrap_or(0);
391     }
392 }
393
394 impl rtio::RtioSocket for TcpStream {
395     fn socket_name(&mut self) -> IoResult<rtio::SocketAddr> {
396         sockname(self.fd(), libc::getsockname)
397     }
398 }
399
400 impl Drop for Inner {
401     fn drop(&mut self) { unsafe { os::close(self.fd); } }
402 }
403
404 #[unsafe_destructor]
405 impl<'a> Drop for Guard<'a> {
406     fn drop(&mut self) {
407         assert!(util::set_nonblocking(self.fd, false).is_ok());
408     }
409 }
410
411 ////////////////////////////////////////////////////////////////////////////////
412 // TCP listeners
413 ////////////////////////////////////////////////////////////////////////////////
414
415 pub struct TcpListener {
416     inner: Inner,
417 }
418
419 impl TcpListener {
420     pub fn bind(addr: rtio::SocketAddr) -> IoResult<TcpListener> {
421         let fd = try!(socket(addr, libc::SOCK_STREAM));
422         let ret = TcpListener { inner: Inner::new(fd) };
423
424         let mut storage = unsafe { mem::zeroed() };
425         let len = addr_to_sockaddr(addr, &mut storage);
426         let addrp = &storage as *const _ as *const libc::sockaddr;
427
428         // On platforms with Berkeley-derived sockets, this allows
429         // to quickly rebind a socket, without needing to wait for
430         // the OS to clean up the previous one.
431         if cfg!(unix) {
432             try!(setsockopt(fd, libc::SOL_SOCKET, libc::SO_REUSEADDR,
433                             1 as libc::c_int));
434         }
435
436         match unsafe { libc::bind(fd, addrp, len) } {
437             -1 => Err(os::last_error()),
438             _ => Ok(ret),
439         }
440     }
441
442     pub fn fd(&self) -> sock_t { self.inner.fd }
443
444     pub fn native_listen(self, backlog: int) -> IoResult<TcpAcceptor> {
445         match unsafe { libc::listen(self.fd(), backlog as libc::c_int) } {
446             -1 => Err(os::last_error()),
447
448             #[cfg(unix)]
449             _ => {
450                 let (reader, writer) = try!(process::pipe());
451                 try!(util::set_nonblocking(reader.fd(), true));
452                 try!(util::set_nonblocking(writer.fd(), true));
453                 try!(util::set_nonblocking(self.fd(), true));
454                 Ok(TcpAcceptor {
455                     inner: Arc::new(AcceptorInner {
456                         listener: self,
457                         reader: reader,
458                         writer: writer,
459                         closed: atomics::AtomicBool::new(false),
460                     }),
461                     deadline: 0,
462                 })
463             }
464
465             #[cfg(windows)]
466             _ => {
467                 let accept = try!(os::Event::new());
468                 let ret = unsafe {
469                     c::WSAEventSelect(self.fd(), accept.handle(), c::FD_ACCEPT)
470                 };
471                 if ret != 0 {
472                     return Err(os::last_error())
473                 }
474                 Ok(TcpAcceptor {
475                     inner: Arc::new(AcceptorInner {
476                         listener: self,
477                         abort: try!(os::Event::new()),
478                         accept: accept,
479                         closed: atomics::AtomicBool::new(false),
480                     }),
481                     deadline: 0,
482                 })
483             }
484         }
485     }
486 }
487
488 impl rtio::RtioTcpListener for TcpListener {
489     fn listen(self: Box<TcpListener>)
490               -> IoResult<Box<rtio::RtioTcpAcceptor + Send>> {
491         self.native_listen(128).map(|a| {
492             box a as Box<rtio::RtioTcpAcceptor + Send>
493         })
494     }
495 }
496
497 impl rtio::RtioSocket for TcpListener {
498     fn socket_name(&mut self) -> IoResult<rtio::SocketAddr> {
499         sockname(self.fd(), libc::getsockname)
500     }
501 }
502
503 pub struct TcpAcceptor {
504     inner: Arc<AcceptorInner>,
505     deadline: u64,
506 }
507
508 #[cfg(unix)]
509 struct AcceptorInner {
510     listener: TcpListener,
511     reader: FileDesc,
512     writer: FileDesc,
513     closed: atomics::AtomicBool,
514 }
515
516 #[cfg(windows)]
517 struct AcceptorInner {
518     listener: TcpListener,
519     abort: os::Event,
520     accept: os::Event,
521     closed: atomics::AtomicBool,
522 }
523
524 impl TcpAcceptor {
525     pub fn fd(&self) -> sock_t { self.inner.listener.fd() }
526
527     #[cfg(unix)]
528     pub fn native_accept(&mut self) -> IoResult<TcpStream> {
529         // In implementing accept, the two main concerns are dealing with
530         // close_accept() and timeouts. The unix implementation is based on a
531         // nonblocking accept plus a call to select(). Windows ends up having
532         // an entirely separate implementation than unix, which is explained
533         // below.
534         //
535         // To implement timeouts, all blocking is done via select() instead of
536         // accept() by putting the socket in non-blocking mode. Because
537         // select() takes a timeout argument, we just pass through the timeout
538         // to select().
539         //
540         // To implement close_accept(), we have a self-pipe to ourselves which
541         // is passed to select() along with the socket being accepted on. The
542         // self-pipe is never written to unless close_accept() is called.
543         let deadline = if self.deadline == 0 {None} else {Some(self.deadline)};
544
545         while !self.inner.closed.load(atomics::SeqCst) {
546             match retry(|| unsafe {
547                 libc::accept(self.fd(), ptr::mut_null(), ptr::mut_null())
548             }) {
549                 -1 if util::wouldblock() => {}
550                 -1 => return Err(os::last_error()),
551                 fd => return Ok(TcpStream::new(Inner::new(fd as sock_t))),
552             }
553             try!(util::await([self.fd(), self.inner.reader.fd()],
554                              deadline, util::Readable));
555         }
556
557         Err(util::eof())
558     }
559
560     #[cfg(windows)]
561     pub fn native_accept(&mut self) -> IoResult<TcpStream> {
562         // Unlink unix, windows cannot invoke `select` on arbitrary file
563         // descriptors like pipes, only sockets. Consequently, windows cannot
564         // use the same implementation as unix for accept() when close_accept()
565         // is considered.
566         //
567         // In order to implement close_accept() and timeouts, windows uses
568         // event handles. An acceptor-specific abort event is created which
569         // will only get set in close_accept(), and it will never be un-set.
570         // Additionally, another acceptor-specific event is associated with the
571         // FD_ACCEPT network event.
572         //
573         // These two events are then passed to WaitForMultipleEvents to see
574         // which one triggers first, and the timeout passed to this function is
575         // the local timeout for the acceptor.
576         //
577         // If the wait times out, then the accept timed out. If the wait
578         // succeeds with the abort event, then we were closed, and if the wait
579         // succeeds otherwise, then we do a nonblocking poll via `accept` to
580         // see if we can accept a connection. The connection is candidate to be
581         // stolen, so we do all of this in a loop as well.
582         let events = [self.inner.abort.handle(), self.inner.accept.handle()];
583
584         while !self.inner.closed.load(atomics::SeqCst) {
585             let ms = if self.deadline == 0 {
586                 c::WSA_INFINITE as u64
587             } else {
588                 let now = ::io::timer::now();
589                 if self.deadline < now {0} else {now - self.deadline}
590             };
591             let ret = unsafe {
592                 c::WSAWaitForMultipleEvents(2, events.as_ptr(), libc::FALSE,
593                                             ms as libc::DWORD, libc::FALSE)
594             };
595             match ret {
596                 c::WSA_WAIT_TIMEOUT => {
597                     return Err(util::timeout("accept timed out"))
598                 }
599                 c::WSA_WAIT_FAILED => return Err(os::last_error()),
600                 c::WSA_WAIT_EVENT_0 => break,
601                 n => assert_eq!(n, c::WSA_WAIT_EVENT_0 + 1),
602             }
603             println!("woke up");
604
605             let mut wsaevents: c::WSANETWORKEVENTS = unsafe { mem::zeroed() };
606             let ret = unsafe {
607                 c::WSAEnumNetworkEvents(self.fd(), events[1], &mut wsaevents)
608             };
609             if ret != 0 { return Err(os::last_error()) }
610
611             if wsaevents.lNetworkEvents & c::FD_ACCEPT == 0 { continue }
612             match unsafe {
613                 libc::accept(self.fd(), ptr::mut_null(), ptr::mut_null())
614             } {
615                 -1 if util::wouldblock() => {}
616                 -1 => return Err(os::last_error()),
617                 fd => return Ok(TcpStream::new(Inner::new(fd))),
618             }
619         }
620
621         Err(util::eof())
622     }
623 }
624
625 impl rtio::RtioSocket for TcpAcceptor {
626     fn socket_name(&mut self) -> IoResult<rtio::SocketAddr> {
627         sockname(self.fd(), libc::getsockname)
628     }
629 }
630
631 impl rtio::RtioTcpAcceptor for TcpAcceptor {
632     fn accept(&mut self) -> IoResult<Box<rtio::RtioTcpStream + Send>> {
633         self.native_accept().map(|s| box s as Box<rtio::RtioTcpStream + Send>)
634     }
635
636     fn accept_simultaneously(&mut self) -> IoResult<()> { Ok(()) }
637     fn dont_accept_simultaneously(&mut self) -> IoResult<()> { Ok(()) }
638     fn set_timeout(&mut self, timeout: Option<u64>) {
639         self.deadline = timeout.map(|a| ::io::timer::now() + a).unwrap_or(0);
640     }
641
642     fn clone(&self) -> Box<rtio::RtioTcpAcceptor + Send> {
643         box TcpAcceptor {
644             inner: self.inner.clone(),
645             deadline: 0,
646         } as Box<rtio::RtioTcpAcceptor + Send>
647     }
648
649     #[cfg(unix)]
650     fn close_accept(&mut self) -> IoResult<()> {
651         self.inner.closed.store(true, atomics::SeqCst);
652         let mut fd = FileDesc::new(self.inner.writer.fd(), false);
653         match fd.inner_write([0]) {
654             Ok(..) => Ok(()),
655             Err(..) if util::wouldblock() => Ok(()),
656             Err(e) => Err(e),
657         }
658     }
659
660     #[cfg(windows)]
661     fn close_accept(&mut self) -> IoResult<()> {
662         self.inner.closed.store(true, atomics::SeqCst);
663         let ret = unsafe { c::WSASetEvent(self.inner.abort.handle()) };
664         if ret == libc::TRUE {
665             Ok(())
666         } else {
667             Err(os::last_error())
668         }
669     }
670 }
671
672 ////////////////////////////////////////////////////////////////////////////////
673 // UDP
674 ////////////////////////////////////////////////////////////////////////////////
675
676 pub struct UdpSocket {
677     inner: Arc<Inner>,
678     read_deadline: u64,
679     write_deadline: u64,
680 }
681
682 impl UdpSocket {
683     pub fn bind(addr: rtio::SocketAddr) -> IoResult<UdpSocket> {
684         let fd = try!(socket(addr, libc::SOCK_DGRAM));
685         let ret = UdpSocket {
686             inner: Arc::new(Inner::new(fd)),
687             read_deadline: 0,
688             write_deadline: 0,
689         };
690
691         let mut storage = unsafe { mem::zeroed() };
692         let len = addr_to_sockaddr(addr, &mut storage);
693         let addrp = &storage as *const _ as *const libc::sockaddr;
694
695         match unsafe { libc::bind(fd, addrp, len) } {
696             -1 => Err(os::last_error()),
697             _ => Ok(ret),
698         }
699     }
700
701     pub fn fd(&self) -> sock_t { self.inner.fd }
702
703     pub fn set_broadcast(&mut self, on: bool) -> IoResult<()> {
704         setsockopt(self.fd(), libc::SOL_SOCKET, libc::SO_BROADCAST,
705                    on as libc::c_int)
706     }
707
708     pub fn set_multicast_loop(&mut self, on: bool) -> IoResult<()> {
709         setsockopt(self.fd(), libc::IPPROTO_IP, libc::IP_MULTICAST_LOOP,
710                    on as libc::c_int)
711     }
712
713     pub fn set_membership(&mut self, addr: rtio::IpAddr,
714                           opt: libc::c_int) -> IoResult<()> {
715         match ip_to_inaddr(addr) {
716             InAddr(addr) => {
717                 let mreq = libc::ip_mreq {
718                     imr_multiaddr: addr,
719                     // interface == INADDR_ANY
720                     imr_interface: libc::in_addr { s_addr: 0x0 },
721                 };
722                 setsockopt(self.fd(), libc::IPPROTO_IP, opt, mreq)
723             }
724             In6Addr(addr) => {
725                 let mreq = libc::ip6_mreq {
726                     ipv6mr_multiaddr: addr,
727                     ipv6mr_interface: 0,
728                 };
729                 setsockopt(self.fd(), libc::IPPROTO_IPV6, opt, mreq)
730             }
731         }
732     }
733
734     #[cfg(target_os = "linux")]
735     fn lock_nonblocking(&self) {}
736
737     #[cfg(not(target_os = "linux"))]
738     fn lock_nonblocking<'a>(&'a self) -> Guard<'a> {
739         let ret = Guard {
740             fd: self.fd(),
741             guard: unsafe { self.inner.lock.lock() },
742         };
743         assert!(util::set_nonblocking(self.fd(), true).is_ok());
744         ret
745     }
746 }
747
748 impl rtio::RtioSocket for UdpSocket {
749     fn socket_name(&mut self) -> IoResult<rtio::SocketAddr> {
750         sockname(self.fd(), libc::getsockname)
751     }
752 }
753
754 #[cfg(windows)] type msglen_t = libc::c_int;
755 #[cfg(unix)]    type msglen_t = libc::size_t;
756
757 impl rtio::RtioUdpSocket for UdpSocket {
758     fn recv_from(&mut self, buf: &mut [u8]) -> IoResult<(uint, rtio::SocketAddr)> {
759         let fd = self.fd();
760         let mut storage: libc::sockaddr_storage = unsafe { mem::zeroed() };
761         let storagep = &mut storage as *mut _ as *mut libc::sockaddr;
762         let mut addrlen: libc::socklen_t =
763                 mem::size_of::<libc::sockaddr_storage>() as libc::socklen_t;
764
765         let dolock = || self.lock_nonblocking();
766         let n = try!(read(fd, self.read_deadline, dolock, |nb| unsafe {
767             let flags = if nb {c::MSG_DONTWAIT} else {0};
768             libc::recvfrom(fd,
769                            buf.as_mut_ptr() as *mut libc::c_void,
770                            buf.len() as msglen_t,
771                            flags,
772                            storagep,
773                            &mut addrlen) as libc::c_int
774         }));
775         sockaddr_to_addr(&storage, addrlen as uint).and_then(|addr| {
776             Ok((n as uint, addr))
777         })
778     }
779
780     fn send_to(&mut self, buf: &[u8], dst: rtio::SocketAddr) -> IoResult<()> {
781         let mut storage = unsafe { mem::zeroed() };
782         let dstlen = addr_to_sockaddr(dst, &mut storage);
783         let dstp = &storage as *const _ as *const libc::sockaddr;
784
785         let fd = self.fd();
786         let dolock = || self.lock_nonblocking();
787         let dowrite = |nb, buf: *const u8, len: uint| unsafe {
788             let flags = if nb {c::MSG_DONTWAIT} else {0};
789             libc::sendto(fd,
790                          buf as *const libc::c_void,
791                          len as msglen_t,
792                          flags,
793                          dstp,
794                          dstlen) as i64
795         };
796
797         let n = try!(write(fd, self.write_deadline, buf, false, dolock, dowrite));
798         if n != buf.len() {
799             Err(util::short_write(n, "couldn't send entire packet at once"))
800         } else {
801             Ok(())
802         }
803     }
804
805     fn join_multicast(&mut self, multi: rtio::IpAddr) -> IoResult<()> {
806         match multi {
807             rtio::Ipv4Addr(..) => {
808                 self.set_membership(multi, libc::IP_ADD_MEMBERSHIP)
809             }
810             rtio::Ipv6Addr(..) => {
811                 self.set_membership(multi, libc::IPV6_ADD_MEMBERSHIP)
812             }
813         }
814     }
815     fn leave_multicast(&mut self, multi: rtio::IpAddr) -> IoResult<()> {
816         match multi {
817             rtio::Ipv4Addr(..) => {
818                 self.set_membership(multi, libc::IP_DROP_MEMBERSHIP)
819             }
820             rtio::Ipv6Addr(..) => {
821                 self.set_membership(multi, libc::IPV6_DROP_MEMBERSHIP)
822             }
823         }
824     }
825
826     fn loop_multicast_locally(&mut self) -> IoResult<()> {
827         self.set_multicast_loop(true)
828     }
829     fn dont_loop_multicast_locally(&mut self) -> IoResult<()> {
830         self.set_multicast_loop(false)
831     }
832
833     fn multicast_time_to_live(&mut self, ttl: int) -> IoResult<()> {
834         setsockopt(self.fd(), libc::IPPROTO_IP, libc::IP_MULTICAST_TTL,
835                    ttl as libc::c_int)
836     }
837     fn time_to_live(&mut self, ttl: int) -> IoResult<()> {
838         setsockopt(self.fd(), libc::IPPROTO_IP, libc::IP_TTL, ttl as libc::c_int)
839     }
840
841     fn hear_broadcasts(&mut self) -> IoResult<()> {
842         self.set_broadcast(true)
843     }
844     fn ignore_broadcasts(&mut self) -> IoResult<()> {
845         self.set_broadcast(false)
846     }
847
848     fn clone(&self) -> Box<rtio::RtioUdpSocket + Send> {
849         box UdpSocket {
850             inner: self.inner.clone(),
851             read_deadline: 0,
852             write_deadline: 0,
853         } as Box<rtio::RtioUdpSocket + Send>
854     }
855
856     fn set_timeout(&mut self, timeout: Option<u64>) {
857         let deadline = timeout.map(|a| ::io::timer::now() + a).unwrap_or(0);
858         self.read_deadline = deadline;
859         self.write_deadline = deadline;
860     }
861     fn set_read_timeout(&mut self, timeout: Option<u64>) {
862         self.read_deadline = timeout.map(|a| ::io::timer::now() + a).unwrap_or(0);
863     }
864     fn set_write_timeout(&mut self, timeout: Option<u64>) {
865         self.write_deadline = timeout.map(|a| ::io::timer::now() + a).unwrap_or(0);
866     }
867 }
868
869 ////////////////////////////////////////////////////////////////////////////////
870 // Timeout helpers
871 //
872 // The read/write functions below are the helpers for reading/writing a socket
873 // with a possible deadline specified. This is generally viewed as a timed out
874 // I/O operation.
875 //
876 // From the application's perspective, timeouts apply to the I/O object, not to
877 // the underlying file descriptor (it's one timeout per object). This means that
878 // we can't use the SO_RCVTIMEO and corresponding send timeout option.
879 //
880 // The next idea to implement timeouts would be to use nonblocking I/O. An
881 // invocation of select() would wait (with a timeout) for a socket to be ready.
882 // Once its ready, we can perform the operation. Note that the operation *must*
883 // be nonblocking, even though select() says the socket is ready. This is
884 // because some other thread could have come and stolen our data (handles can be
885 // cloned).
886 //
887 // To implement nonblocking I/O, the first option we have is to use the
888 // O_NONBLOCK flag. Remember though that this is a global setting, affecting all
889 // I/O objects, so this was initially viewed as unwise.
890 //
891 // It turns out that there's this nifty MSG_DONTWAIT flag which can be passed to
892 // send/recv, but the niftiness wears off once you realize it only works well on
893 // linux [1] [2]. This means that it's pretty easy to get a nonblocking
894 // operation on linux (no flag fiddling, no affecting other objects), but not on
895 // other platforms.
896 //
897 // To work around this constraint on other platforms, we end up using the
898 // original strategy of flipping the O_NONBLOCK flag. As mentioned before, this
899 // could cause other objects' blocking operations to suddenly become
900 // nonblocking. To get around this, a "blocking operation" which returns EAGAIN
901 // falls back to using the same code path as nonblocking operations, but with an
902 // infinite timeout (select + send/recv). This helps emulate blocking
903 // reads/writes despite the underlying descriptor being nonblocking, as well as
904 // optimizing the fast path of just hitting one syscall in the good case.
905 //
906 // As a final caveat, this implementation uses a mutex so only one thread is
907 // doing a nonblocking operation at at time. This is the operation that comes
908 // after the select() (at which point we think the socket is ready). This is
909 // done for sanity to ensure that the state of the O_NONBLOCK flag is what we
910 // expect (wouldn't want someone turning it on when it should be off!). All
911 // operations performed in the lock are *nonblocking* to avoid holding the mutex
912 // forever.
913 //
914 // So, in summary, linux uses MSG_DONTWAIT and doesn't need mutexes, everyone
915 // else uses O_NONBLOCK and mutexes with some trickery to make sure blocking
916 // reads/writes are still blocking.
917 //
918 // Fun, fun!
919 //
920 // [1] http://twistedmatrix.com/pipermail/twisted-commits/2012-April/034692.html
921 // [2] http://stackoverflow.com/questions/19819198/does-send-msg-dontwait
922
923 pub fn read<T>(fd: sock_t,
924                deadline: u64,
925                lock: || -> T,
926                read: |bool| -> libc::c_int) -> IoResult<uint> {
927     let mut ret = -1;
928     if deadline == 0 {
929         ret = retry(|| read(false));
930     }
931
932     if deadline != 0 || (ret == -1 && util::wouldblock()) {
933         let deadline = match deadline {
934             0 => None,
935             n => Some(n),
936         };
937         loop {
938             // With a timeout, first we wait for the socket to become
939             // readable using select(), specifying the relevant timeout for
940             // our previously set deadline.
941             try!(util::await([fd], deadline, util::Readable));
942
943             // At this point, we're still within the timeout, and we've
944             // determined that the socket is readable (as returned by
945             // select). We must still read the socket in *nonblocking* mode
946             // because some other thread could come steal our data. If we
947             // fail to read some data, we retry (hence the outer loop) and
948             // wait for the socket to become readable again.
949             let _guard = lock();
950             match retry(|| read(deadline.is_some())) {
951                 -1 if util::wouldblock() => { assert!(deadline.is_some()); }
952                 -1 => return Err(os::last_error()),
953                n => { ret = n; break }
954             }
955         }
956     }
957
958     match ret {
959         0 => Err(util::eof()),
960         n if n < 0 => Err(os::last_error()),
961         n => Ok(n as uint)
962     }
963 }
964
965 pub fn write<T>(fd: sock_t,
966                 deadline: u64,
967                 buf: &[u8],
968                 write_everything: bool,
969                 lock: || -> T,
970                 write: |bool, *const u8, uint| -> i64) -> IoResult<uint> {
971     let mut ret = -1;
972     let mut written = 0;
973     if deadline == 0 {
974         if write_everything {
975             ret = keep_going(buf, |inner, len| {
976                 written = buf.len() - len;
977                 write(false, inner, len)
978             });
979         } else {
980             ret = retry(|| {
981                 write(false, buf.as_ptr(), buf.len()) as libc::c_int
982             }) as i64;
983             if ret > 0 { written = ret as uint; }
984         }
985     }
986
987     if deadline != 0 || (ret == -1 && util::wouldblock()) {
988         let deadline = match deadline {
989             0 => None,
990             n => Some(n),
991         };
992         while written < buf.len() && (write_everything || written == 0) {
993             // As with read(), first wait for the socket to be ready for
994             // the I/O operation.
995             match util::await([fd], deadline, util::Writable) {
996                 Err(ref e) if e.code == libc::EOF as uint && written > 0 => {
997                     assert!(deadline.is_some());
998                     return Err(util::short_write(written, "short write"))
999                 }
1000                 Err(e) => return Err(e),
1001                 Ok(()) => {}
1002             }
1003
1004             // Also as with read(), we use MSG_DONTWAIT to guard ourselves
1005             // against unforeseen circumstances.
1006             let _guard = lock();
1007             let ptr = buf.slice_from(written).as_ptr();
1008             let len = buf.len() - written;
1009             match retry(|| write(deadline.is_some(), ptr, len) as libc::c_int) {
1010                 -1 if util::wouldblock() => {}
1011                 -1 => return Err(os::last_error()),
1012                 n => { written += n as uint; }
1013             }
1014         }
1015         ret = 0;
1016     }
1017     if ret < 0 {
1018         Err(os::last_error())
1019     } else {
1020         Ok(written)
1021     }
1022 }
1023
1024 #[cfg(windows)]
1025 mod os {
1026     use libc;
1027     use std::mem;
1028     use std::rt::rtio::{IoError, IoResult};
1029
1030     use io::c;
1031
1032     pub type sock_t = libc::SOCKET;
1033     pub struct Event(c::WSAEVENT);
1034
1035     impl Event {
1036         pub fn new() -> IoResult<Event> {
1037             let event = unsafe { c::WSACreateEvent() };
1038             if event == c::WSA_INVALID_EVENT {
1039                 Err(last_error())
1040             } else {
1041                 Ok(Event(event))
1042             }
1043         }
1044
1045         pub fn handle(&self) -> c::WSAEVENT { let Event(handle) = *self; handle }
1046     }
1047
1048     impl Drop for Event {
1049         fn drop(&mut self) {
1050             unsafe { let _ = c::WSACloseEvent(self.handle()); }
1051         }
1052     }
1053
1054     pub fn init() {
1055         unsafe {
1056             use std::rt::mutex::{StaticNativeMutex, NATIVE_MUTEX_INIT};
1057             static mut INITIALIZED: bool = false;
1058             static mut LOCK: StaticNativeMutex = NATIVE_MUTEX_INIT;
1059
1060             let _guard = LOCK.lock();
1061             if !INITIALIZED {
1062                 let mut data: c::WSADATA = mem::zeroed();
1063                 let ret = c::WSAStartup(0x202,      // version 2.2
1064                                         &mut data);
1065                 assert_eq!(ret, 0);
1066                 INITIALIZED = true;
1067             }
1068         }
1069     }
1070
1071     pub fn last_error() -> IoError {
1072         use std::os;
1073         let code = unsafe { c::WSAGetLastError() as uint };
1074         IoError {
1075             code: code,
1076             extra: 0,
1077             detail: Some(os::error_string(code)),
1078         }
1079     }
1080
1081     pub unsafe fn close(sock: sock_t) { let _ = libc::closesocket(sock); }
1082 }
1083
1084 #[cfg(unix)]
1085 mod os {
1086     use libc;
1087     use std::rt::rtio::IoError;
1088     use io;
1089
1090     pub type sock_t = io::file::fd_t;
1091
1092     pub fn init() {}
1093     pub fn last_error() -> IoError { io::last_error() }
1094     pub unsafe fn close(sock: sock_t) { let _ = libc::close(sock); }
1095 }