]> git.lizzy.rs Git - plan9front.git/blob - sys/src/9/port/usbehci.c
usbehci: portreset timing
[plan9front.git] / sys / src / 9 / port / usbehci.c
1 /*
2  * USB Enhanced Host Controller Interface (EHCI) driver
3  * High speed USB 2.0.
4  *
5  * Note that all of our unlock routines call coherence.
6  *
7  * BUGS:
8  * - Too many delays and ilocks.
9  * - bandwidth admission control must be done per-frame.
10  * - requires polling (some controllers miss interrupts).
11  * - must warn of power overruns.
12  */
13
14 #include        "u.h"
15 #include        "../port/lib.h"
16 #include        "mem.h"
17 #include        "dat.h"
18 #include        "fns.h"
19 #include        "io.h"
20 #include        "../port/error.h"
21 #include        "../port/usb.h"
22 #include        "usbehci.h"
23 #include        "uncached.h"
24
25 #define diprint         if(ehcidebug || iso->debug)print
26 #define ddiprint        if(ehcidebug>1 || iso->debug>1)print
27 #define dqprint         if(ehcidebug || (qh->io && qh->io->debug))print
28 #define ddqprint        if(ehcidebug>1 || (qh->io && qh->io->debug>1))print
29
30 #define TRUNC(x, sz)    ((x) & ((sz)-1))
31 #define LPTR(q)         ((ulong*)KADDR((q) & ~0x1F))
32
33 typedef struct Ctlio Ctlio;
34 typedef union Ed Ed;
35 typedef struct Edpool Edpool;
36 typedef struct Itd Itd;
37 typedef struct Qio Qio;
38 typedef struct Qtd Qtd;
39 typedef struct Sitd Sitd;
40 typedef struct Td Td;
41
42 /*
43  * EHCI interface registers and bits
44  */
45 enum
46 {
47         /* Queue states (software) */
48         Qidle           = 0,
49         Qinstall,
50         Qrun,
51         Qdone,
52         Qclose,
53         Qfree,
54
55         Enabledelay     = 100,          /* waiting for a port to enable */
56         Abortdelay      = 10,           /* delay after cancelling Tds (ms) */
57
58         Incr            = 64,           /* for pools of Tds, Qhs, etc. */
59         Align           = 128,          /* in bytes for all those descriptors */
60
61         /* Keep them as a power of 2, lower than ctlr->nframes */
62         /* Also, keep Nisoframes >= Nintrleafs */
63         Nintrleafs      = 32,           /* nb. of leaf frames in intr. tree */
64         Nisoframes      = 64,           /* nb. of iso frames (in window) */
65
66         /*
67          * HW constants
68          */
69
70         /* Itd bits (csw[]) */
71         Itdactive       = 0x80000000,   /* execution enabled */
72         Itddberr        = 0x40000000,   /* data buffer error */
73         Itdbabble       = 0x20000000,   /* babble error */
74         Itdtrerr        = 0x10000000,   /* transaction error */
75         Itdlenshift     = 16,           /* transaction length */
76         Itdlenmask      = 0xFFF,
77         Itdioc          = 0x00008000,   /* interrupt on complete */
78         Itdpgshift      = 12,           /* page select field */
79         Itdoffshift     = 0,            /* transaction offset */
80         /* Itd bits, buffer[] */
81         Itdepshift      = 8,            /* endpoint address (buffer[0]) */
82         Itddevshift     = 0,            /* device address (buffer[0]) */
83         Itdin           = 0x800,        /* is input (buffer[1]) */
84         Itdout          = 0,
85         Itdmaxpktshift  = 0,            /* max packet (buffer[1]) */
86         Itdntdsshift    = 0,            /* nb. of tds per µframe (buffer[2]) */
87
88         Itderrors       = Itddberr|Itdbabble|Itdtrerr,
89
90         /* Sitd bits (epc) */
91         Stdin           = 0x80000000,   /* input direction */
92         Stdportshift    = 24,           /* hub port number */
93         Stdhubshift     = 16,           /* hub address */
94         Stdepshift      = 8,            /* endpoint address */
95         Stddevshift     = 0,            /* device address */
96         /* Sitd bits (mfs) */
97         Stdssmshift     = 0,            /* split start mask */
98         Stdscmshift     = 8,            /* split complete mask */
99         /* Sitd bits (csw) */
100         Stdioc          = 0x80000000,   /* interrupt on complete */
101         Stdpg           = 0x40000000,   /* page select */
102         Stdlenshift     = 16,           /* total bytes to transfer */
103         Stdlenmask      = 0x3FF,
104         Stdactive       = 0x00000080,   /* active */
105         Stderr          = 0x00000040,   /* tr. translator error */
106         Stddberr        = 0x00000020,   /* data buffer error */
107         Stdbabble       = 0x00000010,   /* babble error */
108         Stdtrerr        = 0x00000008,   /* transaction error */
109         Stdmmf          = 0x00000004,   /* missed µframe */
110         Stddcs          = 0x00000002,   /* do complete split */
111
112         Stderrors       = Stderr|Stddberr|Stdbabble|Stdtrerr|Stdmmf,
113
114         /* Sitd bits buffer[1] */
115         Stdtpall        = 0x00000000,   /* all payload here (188 bytes) */
116         Stdtpbegin      = 0x00000008,   /* first payload for fs trans. */
117         Stdtcntmask     = 0x00000007,   /* T-count */
118
119         /* Td bits (csw) */
120         Tddata1         = 0x80000000,   /* data toggle 1 */
121         Tddata0         = 0x00000000,   /* data toggle 0 */
122         Tdlenshift      = 16,           /* total bytes to transfer */
123         Tdlenmask       = 0x7FFF,
124         Tdmaxpkt        = 0x5000,       /* max buffer for a Td */
125         Tdioc           = 0x00008000,   /* interrupt on complete */
126         Tdpgshift       = 12,           /* current page */
127         Tdpgmask        = 7,
128         Tderr1          = 0x00000400,   /* bit 0 of error counter */
129         Tderr2          = 0x00000800,   /* bit 1 of error counter */
130         Tdtokout        = 0x00000000,   /* direction out */
131         Tdtokin         = 0x00000100,   /* direction in */
132         Tdtoksetup      = 0x00000200,   /* setup packet */
133         Tdtok           = 0x00000300,   /* token bits */
134         Tdactive                = 0x00000080,   /* active */
135         Tdhalt          = 0x00000040,   /* halted */
136         Tddberr         = 0x00000020,   /* data buffer error */
137         Tdbabble        = 0x00000010,   /* babble error */
138         Tdtrerr         = 0x00000008,   /* transaction error */
139         Tdmmf           = 0x00000004,   /* missed µframe */
140         Tddcs           = 0x00000002,   /* do complete split */
141         Tdping          = 0x00000001,   /* do ping */
142
143         Tderrors        = Tdhalt|Tddberr|Tdbabble|Tdtrerr|Tdmmf,
144
145         /* Qh bits (eps0) */
146         Qhrlcmask       = 0xF,          /* nak reload count */
147         Qhrlcshift      = 28,           /* nak reload count */
148         Qhnhctl         = 0x08000000,   /* not-high speed ctl */
149         Qhmplmask       = 0x7FF,        /* max packet */
150         Qhmplshift      = 16,
151         Qhhrl           = 0x00008000,   /* head of reclamation list */
152         Qhdtc           = 0x00004000,   /* data toggle ctl. */
153         Qhint           = 0x00000080,   /* inactivate on next transition */
154         Qhspeedmask     = 0x00003000,   /* speed bits */
155         Qhfull          = 0x00000000,   /* full speed */
156         Qhlow           = 0x00001000,   /* low speed */
157         Qhhigh          = 0x00002000,   /* high speed */
158
159         /* Qh bits (eps1) */
160         Qhmultshift     = 30,           /* multiple tds per µframe */
161         Qhmultmask      = 3,
162         Qhportshift     = 23,           /* hub port number */
163         Qhhubshift      = 16,           /* hub address */
164         Qhscmshift      = 8,            /* split completion mask bits */
165         Qhismshift      = 0,            /* interrupt sched. mask bits */
166 };
167
168 /*
169  * Endpoint tree (software)
170  */
171 struct Qtree
172 {
173         int     nel;
174         int     depth;
175         ulong*  bw;
176         Qh**    root;
177 };
178
179 /*
180  * One per endpoint per direction, to control I/O.
181  */
182 struct Qio
183 {
184         QLock;                  /* for the entire I/O process */
185         Rendez;                 /* wait for completion */
186         Qh*     qh;             /* Td list (field const after init) */
187         int     usbid;          /* usb address for endpoint/device */
188         int     toggle;         /* Tddata0/Tddata1 */
189         int     tok;            /* Tdtoksetup, Tdtokin, Tdtokout */
190         ulong   iotime;         /* last I/O time; to hold interrupt polls */
191         int     debug;          /* debug flag from the endpoint */
192         char*   err;            /* error string */
193         char*   tag;            /* debug (no room in Qh for this) */
194         ulong   bw;
195 };
196
197 struct Ctlio
198 {
199         Qio;                    /* a single Qio for each RPC */
200         uchar*  data;           /* read from last ctl req. */
201         int     ndata;          /* number of bytes read */
202 };
203
204 struct Isoio
205 {
206         QLock;
207         Rendez;                 /* wait for space/completion/errors */
208         int     usbid;          /* address used for device/endpoint */
209         int     tok;            /* Tdtokin or Tdtokout */
210         int     state;          /* Qrun -> Qdone -> Qrun... -> Qclose */
211         int     nframes;        /* number of frames ([S]Itds) used */
212         uchar*  data;           /* iso data buffers if not embedded */
213         char*   err;            /* error string */
214         int     nerrs;          /* nb of consecutive I/O errors */
215         ulong   maxsize;        /* ntds * ep->maxpkt */
216         long    nleft;          /* number of bytes left from last write */
217         int     debug;          /* debug flag from the endpoint */
218         int     delay;          /* max number of bytes to buffer */
219         int     hs;             /* is high speed? */
220         Isoio*  next;           /* in list of active Isoios */
221         ulong   td0frno;        /* first frame used in ctlr */
222         union{
223                 Itd*    tdi;    /* next td processed by interrupt */
224                 Sitd*   stdi;
225         };
226         union{
227                 Itd*    tdu;    /* next td for user I/O in tdps */
228                 Sitd*   stdu;
229         };
230         union{
231                 Itd**   itdps;  /* itdps[i]: ptr to Itd for i-th frame or nil */
232                 Sitd**  sitdps; /* sitdps[i]: ptr to Sitd for i-th frame or nil */
233                 ulong** tdps;   /* same thing, as seen by hw */
234         };
235 };
236
237 struct Edpool
238 {
239         Lock;
240         Ed*     free;
241         int     nalloc;
242         int     ninuse;
243         int     nfree;
244 };
245
246 /*
247  * We use the 64-bit version for Itd, Sitd, Td, and Qh.
248  * If the ehci is 64-bit capable it assumes we are using those
249  * structures even when the system is 32 bits.
250  */
251
252 /*
253  * Iso transfer descriptor.  hw: 92 bytes, 108 bytes total
254  * aligned to 32.
255  */
256 struct Itd
257 {
258         ulong   link;           /* to next hw struct */
259         ulong   csw[8];         /* sts/length/pg/off. updated by hw */
260         ulong   buffer[7];      /* buffer pointers, addrs, maxsz */
261         ulong   xbuffer[7];     /* high 32 bits of buffer for 64-bits */
262
263         ulong   _pad0;          /* pad to next cache line */
264         /* cache-line boundary here */
265
266         /* software */
267         Itd*    next;
268         ulong   ndata;          /* number of bytes in data */
269         ulong   mdata;          /* max number of bytes in data */
270         uchar*  data;
271 };
272
273 /*
274  * Split transaction iso transfer descriptor.
275  * hw: 36 bytes, 52 bytes total. aligned to 32.
276  */
277 struct Sitd
278 {
279         ulong   link;           /* to next hw struct */
280         ulong   epc;            /* static endpoint state. addrs */
281         ulong   mfs;            /* static endpoint state. µ-frame sched. */
282         ulong   csw;            /* transfer state. updated by hw */
283         ulong   buffer[2];      /* buf. ptr/offset. offset updated by hw */
284                                 /* buf ptr/TP/Tcnt. TP/Tcnt updated by hw */
285         ulong   blink;          /* back pointer */
286         /* cache-line boundary after xbuffer[0] */
287         ulong   xbuffer[2];     /* high 32 bits of buffer for 64-bits */
288
289         /* software */
290         Sitd*   next;
291         ulong   ndata;          /* number of bytes in data */
292         ulong   mdata;          /* max number of bytes in data */
293         uchar*  data;
294 };
295
296 /*
297  * Queue element transfer descriptor.
298  * hw: first 52 bytes, total 68+sbuff bytes.  aligned to 32 bytes.
299  */
300 struct Td
301 {
302         ulong   nlink;          /* to next Td */
303         ulong   alink;          /* alternate link to next Td */
304         ulong   csw;            /* cmd/sts. updated by hw */
305         ulong   buffer[5];      /* buf ptrs. offset updated by hw */
306         /* cache-line boundary here */
307         ulong   xbuffer[5];     /* high 32 bits of buffer for 64-bits */
308
309         /* software */
310         Td*     next;           /* in qh or Isoio or free list */
311         ulong   ndata;          /* bytes available/used at data */
312         uchar*  data;           /* pointer to actual data */
313         uchar*  buff;           /* allocated data buffer or nil */
314         uchar   sbuff[1];       /* first byte of embedded buffer */
315 };
316
317 /*
318  * Queue head. Aligned to 32 bytes.
319  * hw: first 68 bytes, 92 total.
320  */
321 struct Qh
322 {
323         ulong   link;           /* to next Qh in round robin */
324         ulong   eps0;           /* static endpoint state. addrs */
325         ulong   eps1;           /* static endpoint state. µ-frame sched. */
326
327         /* updated by hw */
328         ulong   tclink;         /* current Td (No Term bit here!) */
329         ulong   nlink;          /* to next Td */
330         ulong   alink;          /* alternate link to next Td */
331         ulong   csw;            /* cmd/sts. updated by hw */
332         /* cache-line boundary after buffer[0] */
333         ulong   buffer[5];      /* buf ptrs. offset updated by hw */
334         ulong   xbuffer[5];     /* high 32 bits of buffer for 64-bits */
335
336         /* software */
337         Qh*     next;           /* in controller list/tree of Qhs */
338         int     state;          /* Qidle -> Qinstall -> Qrun -> Qdone | Qclose */
339         Qio*    io;             /* for this queue */
340         Td*     tds;            /* for this queue */
341         int     sched;          /* slot for for intr. Qhs */
342         Qh*     inext;          /* next in list of intr. qhs */
343 };
344
345 /*
346  * We can avoid frame span traversal nodes if we don't span frames.
347  * Just schedule transfers that can fit on the current frame and
348  * wait a little bit otherwise.
349  */
350
351 /*
352  * Software. Ehci descriptors provided by pool.
353  * There are soo few because we avoid using Fstn.
354  */
355 union Ed
356 {
357         Ed*     next;           /* in free list */
358         Qh      qh;
359         Td      td;
360         Itd     itd;
361         Sitd    sitd;
362         uchar   align[Align];
363 };
364
365 int ehcidebug;
366
367 static Edpool edpool;
368 static char Ebug[] = "not yet implemented";
369 static char* qhsname[] = { "idle", "install", "run", "done", "close", "FREE" };
370
371 Ecapio* ehcidebugcapio;
372 int ehcidebugport;
373
374 void
375 ehcirun(Ctlr *ctlr, int on)
376 {
377         int i;
378         Eopio *opio;
379
380         ddprint("ehci %#p %s\n", ctlr->capio, on ? "starting" : "halting");
381         opio = ctlr->opio;
382         if(on)
383                 opio->cmd |= Crun;
384         else
385                 opio->cmd = Cstop;
386         coherence();
387         for(i = 0; i < 100; i++)
388                 if(on == 0 && (opio->sts & Shalted) != 0)
389                         break;
390                 else if(on != 0 && (opio->sts & Shalted) == 0)
391                         break;
392                 else
393                         delay(1);
394         if(i == 100)
395                 print("ehci %#p %s cmd timed out\n",
396                         ctlr->capio, on ? "run" : "halt");
397         ddprint("ehci %#p cmd %#lux sts %#lux\n",
398                 ctlr->capio, opio->cmd, opio->sts);
399 }
400
401 static void*
402 edalloc(void)
403 {
404         Ed *ed, *pool;
405         int i;
406
407         lock(&edpool);
408         if(edpool.free == nil){
409                 pool = xspanalloc(Incr*sizeof(Ed), Align, 0);
410                 if(pool == nil)
411                         panic("edalloc");
412                 for(i=Incr; --i>=0;){
413                         pool[i].next = edpool.free;
414                         edpool.free = &pool[i];
415                 }
416                 edpool.nalloc += Incr;
417                 edpool.nfree += Incr;
418                 dprint("ehci: edalloc: %d eds\n", edpool.nalloc);
419         }
420         ed = edpool.free;
421         edpool.free = ed->next;
422         edpool.ninuse++;
423         edpool.nfree--;
424         unlock(&edpool);
425
426         memset(ed, 0, sizeof(Ed));      /* safety */
427         assert(((ulong)ed & 0xF) == 0);
428         return ed;
429 }
430
431 static void
432 edfree(void *a)
433 {
434         Ed *ed;
435
436         ed = a;
437         lock(&edpool);
438         ed->next = edpool.free;
439         edpool.free = ed;
440         edpool.ninuse--;
441         edpool.nfree++;
442         unlock(&edpool);
443 }
444
445 /*
446  * Allocate and do some initialization.
447  * Free after releasing buffers used.
448  */
449
450 static Itd*
451 itdalloc(void)
452 {
453         Itd *td;
454
455         td = edalloc();
456         td->link = Lterm;
457         return td;
458 }
459
460 static void
461 itdfree(Itd *td)
462 {
463         edfree(td);
464 }
465
466 static Sitd*
467 sitdalloc(void)
468 {
469         Sitd *td;
470
471         td = edalloc();
472         td->link = td->blink = Lterm;
473         return td;
474 }
475
476 static void
477 sitdfree(Sitd *td)
478 {
479         edfree(td);
480 }
481
482 static Td*
483 tdalloc(void)
484 {
485         Td *td;
486
487         td = edalloc();
488         td->nlink = td->alink = Lterm;
489         return td;
490 }
491
492 static void
493 tdfree(Td *td)
494 {
495         if(td == nil)
496                 return;
497         free(td->buff);
498         edfree(td);
499 }
500
501 static void
502 tdlinktd(Td *td, Td *next)
503 {
504         td->next = next;
505         td->alink = Lterm;
506         if(next == nil)
507                 td->nlink = Lterm;
508         else
509                 td->nlink = PADDR(next);
510         coherence();
511 }
512
513 static Qh*
514 qhlinkqh(Qh *qh, Qh *next)
515 {
516         qh->next = next;
517         if(next == nil)
518                 qh->link = Lterm;
519         else
520                 qh->link = PADDR(next)|Lqh;
521         coherence();
522         return qh;
523 }
524
525 static void
526 qhsetaddr(Qh *qh, ulong addr)
527 {
528         ulong eps0;
529
530         eps0 = qh->eps0 & ~((Epmax<<8)|Devmax);
531         qh->eps0 = eps0 | addr & Devmax | ((addr >> 7) & Epmax) << 8;
532         coherence();
533 }
534
535 /*
536  * return smallest power of 2 <= n
537  */
538 static int
539 flog2lower(int n)
540 {
541         int i;
542
543         for(i = 0; (1 << (i + 1)) <= n; i++)
544                 ;
545         return i;
546 }
547
548 static int
549 pickschedq(Qtree *qt, int pollival, ulong bw, ulong limit)
550 {
551         int i, j, d, upperb, q;
552         ulong best, worst, total;
553
554         d = flog2lower(pollival);
555         if(d > qt->depth)
556                 d = qt->depth;
557         q = -1;
558         worst = 0;
559         best = ~0;
560         upperb = (1 << (d+1)) - 1;
561         for(i = (1 << d) - 1; i < upperb; i++){
562                 total = qt->bw[0];
563                 for(j = i; j > 0; j = (j - 1) / 2)
564                         total += qt->bw[j];
565                 if(total < best){
566                         best = total;
567                         q = i;
568                 }
569                 if(total > worst)
570                         worst = total;
571         }
572         if(worst + bw >= limit)
573                 return -1;
574         return q;
575 }
576
577 static int
578 schedq(Ctlr *ctlr, Qh *qh, int pollival)
579 {
580         int q;
581         Qh *tqh;
582         ulong bw;
583
584         bw = qh->io->bw;
585         q = pickschedq(ctlr->tree, pollival, 0, ~0);
586         ddqprint("ehci: sched %#p q %d, ival %d, bw %uld\n",
587                 qh->io, q, pollival, bw);
588         if(q < 0){
589                 print("ehci: no room for ed\n");
590                 return -1;
591         }
592         ctlr->tree->bw[q] += bw;
593         tqh = ctlr->tree->root[q];
594         qh->sched = q;
595         qhlinkqh(qh, tqh->next);
596         qhlinkqh(tqh, qh);
597         coherence();
598         qh->inext = ctlr->intrqhs;
599         ctlr->intrqhs = qh;
600         coherence();
601         return 0;
602 }
603
604 static void
605 unschedq(Ctlr *ctlr, Qh *qh)
606 {
607         int q;
608         Qh *prev, *this, *next;
609         Qh **l;
610         ulong bw;
611
612         bw = qh->io->bw;
613         q = qh->sched;
614         if(q < 0)
615                 return;
616         ctlr->tree->bw[q] -= bw;
617
618         prev = ctlr->tree->root[q];
619         this = prev->next;
620         while(this != nil && this != qh){
621                 prev = this;
622                 this = this->next;
623         }
624         if(this == nil)
625                 print("ehci: unschedq %d: not found\n", q);
626         else{
627                 next = this->next;
628                 qhlinkqh(prev, next);
629         }
630         for(l = &ctlr->intrqhs; *l != nil; l = &(*l)->inext)
631                 if(*l == qh){
632                         *l = (*l)->inext;
633                         return;
634                 }
635         print("ehci: unschedq: qh %#p not found\n", qh);
636 }
637
638 static ulong
639 qhmaxpkt(Qh *qh)
640 {
641         return (qh->eps0 >> Qhmplshift) & Qhmplmask;
642 }
643
644 static void
645 qhsetmaxpkt(Qh *qh, int maxpkt)
646 {
647         ulong eps0;
648
649         eps0 = qh->eps0 & ~(Qhmplmask << Qhmplshift);
650         qh->eps0 = eps0 | (maxpkt & Qhmplmask) << Qhmplshift;
651         coherence();
652 }
653
654 /*
655  * Initialize the round-robin circular list of ctl/bulk Qhs
656  * if ep is nil. Otherwise, allocate and link a new Qh in the ctlr.
657  */
658 static Qh*
659 qhalloc(Ctlr *ctlr, Ep *ep, Qio *io, char* tag)
660 {
661         Qh *qh;
662         int ttype;
663
664         qh = edalloc();
665         qh->nlink = Lterm;
666         qh->alink = Lterm;
667         qh->csw = Tdhalt;
668         qh->state = Qidle;
669         qh->sched = -1;
670         qh->io = io;
671         if(ep != nil){
672                 qh->eps0 = 0;
673                 qhsetmaxpkt(qh, ep->maxpkt);
674                 if(ep->dev->speed == Lowspeed)
675                         qh->eps0 |= Qhlow;
676                 if(ep->dev->speed == Highspeed)
677                         qh->eps0 |= Qhhigh;
678                 else if(ep->ttype == Tctl)
679                         qh->eps0 |= Qhnhctl;
680                 qh->eps0 |= Qhdtc | 8 << Qhrlcshift;    /* 8 naks max */
681                 coherence();
682                 qhsetaddr(qh, io->usbid);
683                 qh->eps1 = (ep->ntds & Qhmultmask) << Qhmultshift;
684                 qh->eps1 |= ep->dev->port << Qhportshift;
685                 qh->eps1 |= ep->dev->hub << Qhhubshift;
686                 qh->eps1 |= 034 << Qhscmshift;
687                 if(ep->ttype == Tintr)
688                         qh->eps1 |= 1 << Qhismshift;    /* intr. start µf. */
689                 coherence();
690                 if(io != nil)
691                         io->tag = tag;
692         }
693         ilock(ctlr);
694         ttype = Tctl;
695         if(ep != nil)
696                 ttype = ep->ttype;
697         switch(ttype){
698         case Tctl:
699         case Tbulk:
700                 if(ctlr->qhs == nil){
701                         ctlr->qhs = qhlinkqh(qh, qh);
702                         qh->eps0 |= Qhhigh | Qhhrl;
703                         coherence();
704                         ctlr->opio->link = PADDR(qh)|Lqh;
705                         coherence();
706                 }else{
707                         qhlinkqh(qh, ctlr->qhs->next);
708                         qhlinkqh(ctlr->qhs, qh);
709                 }
710                 break;
711         case Tintr:
712                 schedq(ctlr, qh, ep->pollival);
713                 break;
714         default:
715                 print("ehci: qhalloc called for ttype != ctl/bulk\n");
716         }
717         iunlock(ctlr);
718         return qh;
719 }
720
721 static int
722 qhadvanced(void *a)
723 {
724         Ctlr *ctlr;
725
726         ctlr = a;
727         return (ctlr->opio->cmd & Ciasync) == 0;
728 }
729
730 /*
731  * called when a qh is removed, to be sure the hw is not
732  * keeping pointers into it.
733  */
734 static void
735 qhcoherency(Ctlr *ctlr)
736 {
737         int i;
738
739         qlock(&ctlr->portlck);
740         ctlr->opio->cmd |= Ciasync;     /* ask for intr. on async advance */
741         coherence();
742         for(i = 0; i < 3 && qhadvanced(ctlr) == 0; i++){
743                 while(waserror())
744                         ;
745                 tsleep(ctlr, qhadvanced, ctlr, Abortdelay);
746                 poperror();
747         }
748         dprint("ehci: qhcoherency: doorbell %d\n", qhadvanced(ctlr));
749         if(i == 3)
750                 print("ehci: async advance doorbell did not ring\n");
751         ctlr->opio->cmd &= ~Ciasync;    /* try to clean */
752         qunlock(&ctlr->portlck);
753 }
754
755 static void
756 qhfree(Ctlr *ctlr, Qh *qh)
757 {
758         Td *td;
759         Qh *q;
760
761         ilock(ctlr);
762         if(qh->sched < 0){
763                 for(q = ctlr->qhs; q != nil; q = q->next)
764                         if(q->next == qh)
765                                 break;
766                 if(q == nil)
767                         panic("qhfree: nil q");
768                 q->next = qh->next;
769                 q->link = qh->link;
770                 coherence();
771         }else
772                 unschedq(ctlr, qh);
773         qh->state = Qfree;      /* paranoia */
774         iunlock(ctlr);
775
776         qhcoherency(ctlr);
777
778         while((td = qh->tds) != nil){
779                 qh->tds = td->next;
780                 tdfree(td);
781         }
782
783         edfree(qh);
784 }
785
786 static void
787 qhlinktd(Qh *qh, Td *td)
788 {
789         ulong csw;
790         int i;
791
792         csw = qh->csw;
793         qh->tds = td;
794         if(td == nil)
795                 qh->csw = (csw & ~Tdactive) | Tdhalt;
796         else{
797                 csw &= Tddata1 | Tdping;        /* save */
798                 qh->csw = Tdhalt;
799                 coherence();
800                 qh->tclink = 0;
801                 qh->alink = Lterm;
802                 qh->nlink = PADDR(td);
803                 for(i = 0; i < nelem(qh->buffer); i++)
804                         qh->buffer[i] = 0;
805                 coherence();
806                 qh->csw = csw & ~(Tdhalt|Tdactive);     /* activate next */
807         }
808         coherence();
809 }
810
811 static char*
812 seprintlink(char *s, char *se, char *name, ulong l, int typed)
813 {
814         s = seprint(s, se, "%s %ulx", name, l);
815         if((l & Lterm) != 0)
816                 return seprint(s, se, "T");
817         if(typed == 0)
818                 return s;
819         switch(l & (3<<1)){
820         case Litd:
821                 return seprint(s, se, "I");
822         case Lqh:
823                 return seprint(s, se, "Q");
824         case Lsitd:
825                 return seprint(s, se, "S");
826         default:
827                 return seprint(s, se, "F");
828         }
829 }
830
831 static char*
832 seprintitd(char *s, char *se, Itd *td)
833 {
834         int i;
835         ulong b0, b1;
836         char flags[6];
837         char *rw;
838
839         if(td == nil)
840                 return seprint(s, se, "<nil itd>\n");
841         b0 = td->buffer[0];
842         b1 = td->buffer[1];
843
844         s = seprint(s, se, "itd %#p", td);
845         rw = (b1 & Itdin) ? "in" : "out";
846         s = seprint(s, se, " %s ep %uld dev %uld max %uld mult %uld",
847                 rw, (b0>>8)&Epmax, (b0&Devmax),
848                 td->buffer[1] & 0x7ff, b1 & 3);
849         s = seprintlink(s, se, " link", td->link, 1);
850         s = seprint(s, se, "\n");
851         for(i = 0; i < nelem(td->csw); i++){
852                 memset(flags, '-', 5);
853                 if((td->csw[i] & Itdactive) != 0)
854                         flags[0] = 'a';
855                 if((td->csw[i] & Itdioc) != 0)
856                         flags[1] = 'i';
857                 if((td->csw[i] & Itddberr) != 0)
858                         flags[2] = 'd';
859                 if((td->csw[i] & Itdbabble) != 0)
860                         flags[3] = 'b';
861                 if((td->csw[i] & Itdtrerr) != 0)
862                         flags[4] = 't';
863                 flags[5] = 0;
864                 s = seprint(s, se, "\ttd%d %s", i, flags);
865                 s = seprint(s, se, " len %uld", (td->csw[i] >> 16) & 0x7ff);
866                 s = seprint(s, se, " pg %uld", (td->csw[i] >> 12) & 0x7);
867                 s = seprint(s, se, " off %uld\n", td->csw[i] & 0xfff);
868         }
869         s = seprint(s, se, "\tbuffs:");
870         for(i = 0; i < nelem(td->buffer); i++)
871                 s = seprint(s, se, " %#lux", td->buffer[i] >> 12);
872         return seprint(s, se, "\n");
873 }
874
875 static char*
876 seprintsitd(char *s, char *se, Sitd *td)
877 {
878         char rw, pg, ss;
879         char flags[8];
880         static char pc[4] = { 'a', 'b', 'm', 'e' };
881
882         if(td == nil)
883                 return seprint(s, se, "<nil sitd>\n");
884         s = seprint(s, se, "sitd %#p", td);
885         rw = (td->epc & Stdin) ? 'r' : 'w';
886         s = seprint(s, se, " %c ep %uld dev %uld",
887                 rw, (td->epc>>8)&0xf, td->epc&0x7f);
888         s = seprint(s, se, " max %uld", (td->csw >> 16) & 0x3ff);
889         s = seprint(s, se, " hub %uld", (td->epc >> 16) & 0x7f);
890         s = seprint(s, se, " port %uld\n", (td->epc >> 24) & 0x7f);
891         memset(flags, '-', 7);
892         if((td->csw & Stdactive) != 0)
893                 flags[0] = 'a';
894         if((td->csw & Stdioc) != 0)
895                 flags[1] = 'i';
896         if((td->csw & Stderr) != 0)
897                 flags[2] = 'e';
898         if((td->csw & Stddberr) != 0)
899                 flags[3] = 'd';
900         if((td->csw & Stdbabble) != 0)
901                 flags[4] = 'b';
902         if((td->csw & Stdtrerr) != 0)
903                 flags[5] = 't';
904         if((td->csw & Stdmmf) != 0)
905                 flags[6] = 'n';
906         flags[7] = 0;
907         ss = (td->csw & Stddcs) ? 'c' : 's';
908         pg = (td->csw & Stdpg) ? '1' : '0';
909         s = seprint(s, se, "\t%s %cs pg%c", flags, ss, pg);
910         s = seprint(s, se, " b0 %#lux b1 %#lux off %uld\n",
911                 td->buffer[0] >> 12, td->buffer[1] >> 12, td->buffer[0] & 0xfff);
912         s = seprint(s, se, "\ttpos %c tcnt %uld",
913                 pc[(td->buffer[0]>>3)&3], td->buffer[1] & 7);
914         s = seprint(s, se, " ssm %#lux csm %#lux cspm %#lux",
915                 td->mfs & 0xff, (td->mfs>>8) & 0xff, (td->csw>>8) & 0xff);
916         s = seprintlink(s, se, " link", td->link, 1);
917         s = seprintlink(s, se, " blink", td->blink, 0);
918         return seprint(s, se, "\n");
919 }
920
921 static long
922 maxtdlen(Td *td)
923 {
924         return (td->csw >> Tdlenshift) & Tdlenmask;
925 }
926
927 static long
928 tdlen(Td *td)
929 {
930         if(td->data == nil)
931                 return 0;
932         return td->ndata - maxtdlen(td);
933 }
934
935 static char*
936 seprinttd(char *s, char *se, Td *td, char *tag)
937 {
938         int i;
939         char t, ss;
940         char flags[9];
941         static char *tok[4] = { "out", "in", "setup", "BUG" };
942
943         if(td == nil)
944                 return seprint(s, se, "%s <nil td>\n", tag);
945         s = seprint(s, se, "%s %#p", tag, td);
946         s = seprintlink(s, se, " nlink", td->nlink, 0);
947         s = seprintlink(s, se, " alink", td->alink, 0);
948         s = seprint(s, se, " %s", tok[(td->csw & Tdtok) >> 8]);
949         if((td->csw & Tdping) != 0)
950                 s = seprint(s, se, " png");
951         memset(flags, '-', 8);
952         if((td->csw & Tdactive) != 0)
953                 flags[0] = 'a';
954         if((td->csw & Tdioc) != 0)
955                 flags[1] = 'i';
956         if((td->csw & Tdhalt) != 0)
957                 flags[2] = 'h';
958         if((td->csw & Tddberr) != 0)
959                 flags[3] = 'd';
960         if((td->csw & Tdbabble) != 0)
961                 flags[4] = 'b';
962         if((td->csw & Tdtrerr) != 0)
963                 flags[5] = 't';
964         if((td->csw & Tdmmf) != 0)
965                 flags[6] = 'n';
966         if((td->csw & (Tderr2|Tderr1)) == 0)
967                 flags[7] = 'z';
968         flags[8] = 0;
969         t = (td->csw & Tddata1) ? '1' : '0';
970         ss = (td->csw & Tddcs) ? 'c' : 's';
971         s = seprint(s, se, "\n\td%c %s %cs", t, flags, ss);
972         s = seprint(s, se, " max %uld", maxtdlen(td));
973         s = seprint(s, se, " pg %uld off %#lux\n",
974                 (td->csw >> Tdpgshift) & Tdpgmask, td->buffer[0] & 0xFFF);
975         s = seprint(s, se, "\tbuffs:");
976         for(i = 0; i < nelem(td->buffer); i++)
977                 s = seprint(s, se, " %#lux", td->buffer[i]>>12);
978         if(td->data != nil)
979                 s = seprintdata(s, se, td->data, td->ndata);
980         return seprint(s, se, "\n");
981 }
982
983 static void
984 dumptd(Td *td, char *pref)
985 {
986         char buf[256];
987         char *se;
988         int i;
989
990         i = 0;
991         se = buf+sizeof(buf);
992         for(; td != nil; td = td->next){
993                 seprinttd(buf, se, td, pref);
994                 print("%s", buf);
995                 if(i++ > 20){
996                         print("...more tds...\n");
997                         break;
998                 }
999         }
1000 }
1001
1002 static void
1003 qhdump(Qh *qh)
1004 {
1005         char buf[256];
1006         char *s, *se, *tag;
1007         Td td;
1008         static char *speed[] = {"full", "low", "high", "BUG"};
1009
1010         if(qh == nil){
1011                 print("<nil qh>\n");
1012                 return;
1013         }
1014         if(qh->io == nil)
1015                 tag = "qh";
1016         else
1017                 tag = qh->io->tag;
1018         se = buf+sizeof(buf);
1019         s = seprint(buf, se, "%s %#p", tag, qh);
1020         s = seprint(s, se, " ep %uld dev %uld",
1021                 (qh->eps0>>8)&0xf, qh->eps0&0x7f);
1022         s = seprint(s, se, " hub %uld", (qh->eps1 >> 16) & 0x7f);
1023         s = seprint(s, se, " port %uld", (qh->eps1 >> 23) & 0x7f);
1024         s = seprintlink(s, se, " link", qh->link, 1);
1025         seprint(s, se, "  clink %#lux", qh->tclink);
1026         print("%s\n", buf);
1027         s = seprint(buf, se, "\tnrld %uld", (qh->eps0 >> Qhrlcshift) & Qhrlcmask);
1028         s = seprint(s, se, " nak %uld", (qh->alink >> 1) & 0xf);
1029         s = seprint(s, se, " max %uld ", qhmaxpkt(qh));
1030         if((qh->eps0 & Qhnhctl) != 0)
1031                 s = seprint(s, se, "c");
1032         if((qh->eps0 & Qhhrl) != 0)
1033                 s = seprint(s, se, "h");
1034         if((qh->eps0 & Qhdtc) != 0)
1035                 s = seprint(s, se, "d");
1036         if((qh->eps0 & Qhint) != 0)
1037                 s = seprint(s, se, "i");
1038         s = seprint(s, se, " %s", speed[(qh->eps0 >> 12) & 3]);
1039         s = seprint(s, se, " mult %uld", (qh->eps1 >> Qhmultshift) & Qhmultmask);
1040         seprint(s, se, " scm %#lux ism %#lux\n",
1041                 (qh->eps1 >> 8 & 0xff), qh->eps1 & 0xff);
1042         print("%s\n", buf);
1043         memset(&td, 0, sizeof(td));
1044         memmove(&td, &qh->nlink, 32);   /* overlay area */
1045         seprinttd(buf, se, &td, "\tovl");
1046         print("%s", buf);
1047 }
1048
1049 static void
1050 isodump(Isoio* iso, int all)
1051 {
1052         Itd *td, *tdi, *tdu;
1053         Sitd *std, *stdi, *stdu;
1054         char buf[256];
1055         int i;
1056
1057         if(iso == nil){
1058                 print("<nil iso>\n");
1059                 return;
1060         }
1061         print("iso %#p %s %s speed state %d nframes %d maxsz %uld",
1062                 iso, iso->tok == Tdtokin ? "in" : "out",
1063                 iso->hs ? "high" : "full",
1064                 iso->state, iso->nframes, iso->maxsize);
1065         print(" td0 %uld tdi %#p tdu %#p data %#p\n",
1066                 iso->td0frno, iso->tdi, iso->tdu, iso->data);
1067         if(iso->err != nil)
1068                 print("\terr %s\n", iso->err);
1069         if(iso->err != nil)
1070                 print("\terr='%s'\n", iso->err);
1071         if(all == 0)
1072                 if(iso->hs != 0){
1073                         tdi = iso->tdi;
1074                         seprintitd(buf, buf+sizeof(buf), tdi);
1075                         print("\ttdi %s\n", buf);
1076                         tdu = iso->tdu;
1077                         seprintitd(buf, buf+sizeof(buf), tdu);
1078                         print("\ttdu %s\n", buf);
1079                 }else{
1080                         stdi = iso->stdi;
1081                         seprintsitd(buf, buf+sizeof(buf), stdi);
1082                         print("\tstdi %s\n", buf);
1083                         stdu = iso->stdu;
1084                         seprintsitd(buf, buf+sizeof(buf), stdu);
1085                         print("\tstdu %s\n", buf);
1086                 }
1087         else
1088                 for(i = 0; i < Nisoframes; i++)
1089                         if(iso->tdps[i] != nil)
1090                                 if(iso->hs != 0){
1091                                         td = iso->itdps[i];
1092                                         seprintitd(buf, buf+sizeof(buf), td);
1093                                         if(td == iso->tdi)
1094                                                 print("i->");
1095                                         if(td == iso->tdu)
1096                                                 print("i->");
1097                                         print("[%d]\t%s", i, buf);
1098                                 }else{
1099                                         std = iso->sitdps[i];
1100                                         seprintsitd(buf, buf+sizeof(buf), std);
1101                                         if(std == iso->stdi)
1102                                                 print("i->");
1103                                         if(std == iso->stdu)
1104                                                 print("u->");
1105                                         print("[%d]\t%s", i, buf);
1106                                 }
1107 }
1108
1109 static void
1110 dump(Hci *hp)
1111 {
1112         int i;
1113         char *s, *se;
1114         char buf[128];
1115         Ctlr *ctlr;
1116         Eopio *opio;
1117         Isoio *iso;
1118         Qh *qh;
1119
1120         ctlr = hp->aux;
1121         opio = ctlr->opio;
1122         ilock(ctlr);
1123         print("ehci port %#p frames %#p (%d fr.) nintr %d ntdintr %d",
1124                 ctlr->capio, ctlr->frames, ctlr->nframes,
1125                 ctlr->nintr, ctlr->ntdintr);
1126         print(" nqhintr %d nisointr %d\n", ctlr->nqhintr, ctlr->nisointr);
1127         print("\tcmd %#lux sts %#lux intr %#lux frno %uld",
1128                 opio->cmd, opio->sts, opio->intr, opio->frno);
1129         print(" base %#lux link %#lux fr0 %#lux\n",
1130                 opio->frbase, opio->link, ctlr->frames[0]);
1131         se = buf+sizeof(buf);
1132         s = seprint(buf, se, "\t");
1133         for(i = 0; i < hp->nports; i++){
1134                 s = seprint(s, se, "p%d %#lux ", i, opio->portsc[i]);
1135                 if(hp->nports > 4 && i == hp->nports/2 - 1)
1136                         s = seprint(s, se, "\n\t");
1137         }
1138         print("%s\n", buf);
1139         qh = ctlr->qhs;
1140         i = 0;
1141         do{
1142                 qhdump(qh);
1143                 qh = qh->next;
1144         }while(qh != ctlr->qhs && i++ < 100);
1145         if(i > 100)
1146                 print("...too many Qhs...\n");
1147         if(ctlr->intrqhs != nil)
1148                 print("intr qhs:\n");
1149         for(qh = ctlr->intrqhs; qh != nil; qh = qh->inext)
1150                 qhdump(qh);
1151         if(ctlr->iso != nil)
1152                 print("iso:\n");
1153         for(iso = ctlr->iso; iso != nil; iso = iso->next)
1154                 isodump(ctlr->iso, 0);
1155         print("%d eds in tree\n", ctlr->ntree);
1156         iunlock(ctlr);
1157         lock(&edpool);
1158         print("%d eds allocated = %d in use + %d free\n",
1159                 edpool.nalloc, edpool.ninuse, edpool.nfree);
1160         unlock(&edpool);
1161 }
1162
1163 static char*
1164 errmsg(int err)
1165 {
1166         if(err == 0)
1167                 return "ok";
1168         if(err & Tddberr)
1169                 return "data buffer error";
1170         if(err & Tdbabble)
1171                 return "babble detected";
1172         if(err & Tdtrerr)
1173                 return "transaction error";
1174         if(err & Tdmmf)
1175                 return "missed µframe";
1176         if(err & Tdhalt)
1177                 return Estalled;        /* [uo]hci report this error */
1178         return Eio;
1179 }
1180
1181 static char*
1182 ierrmsg(int err)
1183 {
1184         if(err == 0)
1185                 return "ok";
1186         if(err & Itddberr)
1187                 return "data buffer error";
1188         if(err & Itdbabble)
1189                 return "babble detected";
1190         if(err & Itdtrerr)
1191                 return "transaction error";
1192         return Eio;
1193 }
1194
1195 static char*
1196 serrmsg(int err)
1197 {
1198         if(err & Stderr)
1199                 return "translation translator error";
1200         /* other errors have same numbers than Td errors */
1201         return errmsg(err);
1202 }
1203
1204 static int
1205 isocanread(void *a)
1206 {
1207         Isoio *iso;
1208
1209         iso = a;
1210         if(iso->state == Qclose)
1211                 return 1;
1212         if(iso->state == Qrun && iso->tok == Tdtokin){
1213                 if(iso->hs != 0 && iso->tdi != iso->tdu)
1214                         return 1;
1215                 if(iso->hs == 0 && iso->stdi != iso->stdu)
1216                         return 1;
1217         }
1218         return 0;
1219 }
1220
1221 static int
1222 isocanwrite(void *a)
1223 {
1224         Isoio *iso;
1225
1226         iso = a;
1227         if(iso->state == Qclose)
1228                 return 1;
1229         if(iso->state == Qrun && iso->tok == Tdtokout){
1230                 if(iso->hs != 0 && iso->tdu->next != iso->tdi)
1231                         return 1;
1232                 if(iso->hs == 0 && iso->stdu->next != iso->stdi)
1233                         return 1;
1234         }
1235         return 0;
1236 }
1237
1238 static void
1239 itdinit(Isoio *iso, Itd *td)
1240 {
1241         int p, t;
1242         ulong pa, tsize, size;
1243
1244         /*
1245          * BUG: This does not put an integral number of samples
1246          * on each µframe unless samples per packet % 8 == 0
1247          * Also, all samples are packed early on each frame.
1248          */
1249         p = 0;
1250         size = td->ndata = td->mdata;
1251         pa = PADDR(td->data);
1252         for(t = 0; size > 0 && t < 8; t++){
1253                 tsize = size;
1254                 if(tsize > iso->maxsize)
1255                         tsize = iso->maxsize;
1256                 size -= tsize;
1257                 assert(p < nelem(td->buffer));
1258                 td->csw[t] = tsize << Itdlenshift | p << Itdpgshift |
1259                         (pa & 0xFFF) << Itdoffshift | Itdactive | Itdioc;
1260                 coherence();
1261                 if(((pa+tsize) & ~0xFFF) != (pa & ~0xFFF))
1262                         p++;
1263                 pa += tsize;
1264         }
1265 }
1266
1267 static void
1268 sitdinit(Isoio *iso, Sitd *td)
1269 {
1270         td->ndata = td->mdata & Stdlenmask;
1271         td->buffer[0] = PADDR(td->data);
1272         td->buffer[1] = (td->buffer[0] & ~0xFFF) + 0x1000;
1273         if(iso->tok == Tdtokin || td->ndata <= 188)
1274                 td->buffer[1] |= Stdtpall;
1275         else
1276                 td->buffer[1] |= Stdtpbegin;
1277         if(iso->tok == Tdtokin)
1278                 td->buffer[1] |= 1;
1279         else
1280                 td->buffer[1] |= ((td->ndata + 187) / 188) & Stdtcntmask;
1281         coherence();
1282         td->csw = td->ndata << Stdlenshift | Stdactive | Stdioc;
1283         coherence();
1284 }
1285
1286 static int
1287 itdactive(Itd *td)
1288 {
1289         int i;
1290
1291         for(i = 0; i < nelem(td->csw); i++)
1292                 if((td->csw[i] & Itdactive) != 0)
1293                         return 1;
1294         return 0;
1295 }
1296
1297 static int
1298 isodelay(void *a)
1299 {
1300         Isoio *iso;
1301         int delay;
1302
1303         iso = a;
1304         if(iso->state == Qclose || iso->err || iso->delay == 0)
1305                 return 1;
1306
1307         delay = 0;
1308         if(iso->hs){
1309                 Itd *i;
1310
1311                 for(i = iso->tdi; i->next != iso->tdu; i = i->next){
1312                         if(!itdactive(i))
1313                                 continue;
1314                         delay += i->mdata;
1315                         if(delay > iso->delay)
1316                                 break;
1317                 }
1318         } else {
1319                 Sitd *i;
1320
1321                 for(i = iso->stdi; i->next != iso->stdu; i = i->next){
1322                         if((i->csw & Stdactive) == 0)
1323                                 continue;
1324                         delay += i->mdata;
1325                         if(delay > iso->delay)
1326                                 break;
1327                 }
1328         }
1329
1330         return delay <= iso->delay;
1331 }
1332
1333
1334 static int
1335 isohsinterrupt(Ctlr *ctlr, Isoio *iso)
1336 {
1337         int err, i, nframes, t;
1338         Itd *tdi;
1339
1340         tdi = iso->tdi;
1341         if(tdi == nil || itdactive(tdi))                        /* not all tds are done */
1342                 return 0;
1343         ctlr->nisointr++;
1344         ddiprint("isohsintr: iso %#p: tdi %#p tdu %#p\n", iso, tdi, iso->tdu);
1345         if(iso->state != Qrun && iso->state != Qdone)
1346                 panic("isofsintr: iso state");
1347         if(ehcidebug > 1 || iso->debug > 1)
1348                 isodump(iso, 0);
1349
1350         nframes = iso->nframes / 2;             /* limit how many we look */
1351         if(nframes > Nisoframes)
1352                 nframes = Nisoframes;
1353
1354         if(iso->tok == Tdtokin)
1355                 tdi->ndata = 0;
1356         /* else, it has the number of bytes transferred */
1357
1358         for(i = 0; i < nframes && itdactive(tdi) == 0; i++){
1359                 if(iso->tok == Tdtokin)
1360                         tdi->ndata += (tdi->csw[i] >> Itdlenshift) & Itdlenmask;
1361                 err = 0;
1362                 coherence();
1363                 for(t = 0; t < nelem(tdi->csw); t++){
1364                         tdi->csw[t] &= ~Itdioc;
1365                         coherence();
1366                         err |= tdi->csw[t] & Itderrors;
1367                 }
1368                 if(err == 0)
1369                         iso->nerrs = 0;
1370                 else if(iso->nerrs++ > iso->nframes/2){
1371                         if(iso->err == nil){
1372                                 iso->err = ierrmsg(err);
1373                                 diprint("isohsintr: tdi %#p error %#ux %s\n",
1374                                         tdi, err, iso->err);
1375                                 diprint("ctlr load %uld\n", ctlr->load);
1376                         }
1377                         tdi->ndata = 0;
1378                 }else
1379                         tdi->ndata = 0;
1380                 if(tdi->next == iso->tdu || tdi->next->next == iso->tdu){
1381                         memset(iso->tdu->data, 0, iso->tdu->mdata);
1382                         itdinit(iso, iso->tdu);
1383                         iso->tdu = iso->tdu->next;
1384                         iso->nleft = 0;
1385                 }
1386                 tdi = tdi->next;
1387                 coherence();
1388         }
1389         ddiprint("isohsintr: %d frames processed\n", nframes);
1390         if(i == nframes){
1391                 tdi->csw[0] |= Itdioc;
1392                 coherence();
1393         }
1394         iso->tdi = tdi;
1395         coherence();
1396         if(isocanwrite(iso) || isocanread(iso)){
1397                 diprint("wakeup iso %#p tdi %#p tdu %#p\n", iso,
1398                         iso->tdi, iso->tdu);
1399                 wakeup(iso);
1400         }
1401         return 1;
1402 }
1403
1404 static int
1405 isofsinterrupt(Ctlr *ctlr, Isoio *iso)
1406 {
1407         int err, i, nframes;
1408         Sitd *stdi;
1409
1410         stdi = iso->stdi;
1411         if(stdi == nil || (stdi->csw & Stdactive) != 0)         /* nothing new done */
1412                 return 0;
1413         ctlr->nisointr++;
1414         ddiprint("isofsintr: iso %#p: tdi %#p tdu %#p\n", iso, stdi, iso->stdu);
1415         if(iso->state != Qrun && iso->state != Qdone)
1416                 panic("isofsintr: iso state");
1417         if(ehcidebug > 1 || iso->debug > 1)
1418                 isodump(iso, 0);
1419
1420         nframes = iso->nframes / 2;             /* limit how many we look */
1421         if(nframes > Nisoframes)
1422                 nframes = Nisoframes;
1423
1424         for(i = 0; i < nframes && (stdi->csw & Stdactive) == 0; i++){
1425                 stdi->csw &= ~Stdioc;
1426                 /* write back csw and see if it produces errors */
1427                 coherence();
1428                 err = stdi->csw & Stderrors;
1429                 if(err == 0){
1430                         iso->nerrs = 0;
1431                         if(iso->tok == Tdtokin)
1432                                 stdi->ndata = (stdi->csw>>Stdlenshift)&Stdlenmask;
1433                         /* else len is assumed correct */
1434                 }else if(iso->nerrs++ > iso->nframes/2){
1435                         if(iso->err == nil){
1436                                 iso->err = serrmsg(err);
1437                                 diprint("isofsintr: tdi %#p error %#ux %s\n",
1438                                         stdi, err, iso->err);
1439                                 diprint("ctlr load %uld\n", ctlr->load);
1440                         }
1441                         stdi->ndata = 0;
1442                 }else
1443                         stdi->ndata = 0;
1444
1445                 if(stdi->next == iso->stdu || stdi->next->next == iso->stdu){
1446                         memset(iso->stdu->data, 0, iso->stdu->mdata);
1447                         coherence();
1448                         sitdinit(iso, iso->stdu);
1449                         iso->stdu = iso->stdu->next;
1450                         iso->nleft = 0;
1451                 }
1452                 coherence();
1453                 stdi = stdi->next;
1454         }
1455         ddiprint("isofsintr: %d frames processed\n", nframes);
1456         if(i == nframes){
1457                 stdi->csw |= Stdioc;
1458                 coherence();
1459         }
1460         iso->stdi = stdi;
1461         coherence();
1462         if(isocanwrite(iso) || isocanread(iso)){
1463                 diprint("wakeup iso %#p tdi %#p tdu %#p\n", iso,
1464                         iso->stdi, iso->stdu);
1465                 wakeup(iso);
1466         }
1467         return 1;
1468 }
1469
1470 static int
1471 qhinterrupt(Ctlr *ctlr, Qh *qh)
1472 {
1473         Td *td;
1474         int err;
1475
1476         if(qh->state != Qrun)
1477                 panic("qhinterrupt: qh state");
1478         td = qh->tds;
1479         if(td == nil)
1480                 return 0;
1481         if((td->csw & Tdactive) == 0)
1482                 ddqprint("qhinterrupt port %#p qh %#p\n", ctlr->capio, qh);
1483         for(; td != nil; td = td->next){
1484                 if(td->csw & Tdactive)
1485                         return 0;
1486                 err = td->csw & Tderrors;
1487                 if(err != 0){
1488                         if(qh->io->err == nil){
1489                                 qh->io->err = errmsg(err);
1490                                 dqprint("qhintr: td %#p csw %#lux error %#ux %s\n",
1491                                         td, td->csw, err, qh->io->err);
1492                         }
1493                         break;
1494                 }
1495                 td->ndata = tdlen(td);
1496                 coherence();
1497                 if(td->ndata < maxtdlen(td)){   /* EOT */
1498                         td = td->next;
1499                         break;
1500                 }
1501         }
1502         /*
1503          * Done. Make void the Tds not used (errors or EOT) and wakeup epio.
1504          */
1505         for(; td != nil; td = td->next)
1506                 td->ndata = 0;
1507         coherence();
1508         qh->state = Qdone;
1509         coherence();
1510         wakeup(qh->io);
1511         return 1;
1512 }
1513
1514 static int
1515 ctlrinterrupt(Ctlr *ctlr)
1516 {
1517         Eopio *opio;
1518         Isoio *iso;
1519         ulong sts;
1520         Qh *qh;
1521         int i, some;
1522
1523         opio = ctlr->opio;
1524         /*
1525          * Will we know in USB 3.0 who the interrupt was for?.
1526          * Do they still teach indexing in CS?
1527          * This is Intel's doing.
1528          */
1529         sts = opio->sts & Sintrs;
1530         if(sts == 0)            /* not ours; shared intr. */
1531                 return 0;
1532         opio->sts = sts;
1533         coherence();
1534         ctlr->nintr++;
1535         if((sts & Sherr) != 0)
1536                 iprint("ehci: port %#p fatal host system error\n", ctlr->capio);
1537         if((sts & Shalted) != 0)
1538                 iprint("ehci: port %#p: halted\n", ctlr->capio);
1539         if((sts & Sasync) != 0){
1540                 dprint("ehci: doorbell\n");
1541                 wakeup(ctlr);
1542         }
1543         /*
1544          * We enter always this if, even if it seems the
1545          * interrupt does not report anything done/failed.
1546          * Some controllers don't post interrupts right.
1547          */
1548         some = 0;
1549         if((sts & (Serrintr|Sintr)) != 0){
1550                 ctlr->ntdintr++;
1551                 if(ehcidebug > 1){
1552                         iprint("ehci port %#p frames %#p nintr %d ntdintr %d",
1553                                 ctlr->capio, ctlr->frames,
1554                                 ctlr->nintr, ctlr->ntdintr);
1555                         iprint(" nqhintr %d nisointr %d\n",
1556                                 ctlr->nqhintr, ctlr->nisointr);
1557                         iprint("\tcmd %#lux sts %#lux intr %#lux frno %uld",
1558                                 opio->cmd, opio->sts, opio->intr, opio->frno);
1559                 }
1560
1561                 /* process the Iso transfers */
1562                 for(iso = ctlr->iso; iso != nil; iso = iso->next)
1563                         if(iso->state == Qrun || iso->state == Qdone)
1564                                 if(iso->hs != 0)
1565                                         some += isohsinterrupt(ctlr, iso);
1566                                 else
1567                                         some += isofsinterrupt(ctlr, iso);
1568
1569                 /* process the qhs in the periodic tree */
1570                 for(qh = ctlr->intrqhs; qh != nil; qh = qh->inext)
1571                         if(qh->state == Qrun)
1572                                 some += qhinterrupt(ctlr, qh);
1573
1574                 /* process the async Qh circular list */
1575                 qh = ctlr->qhs;
1576                 i = 0;
1577                 do{
1578                         if(qh == nil)
1579                                 break;
1580                         if(qh->state == Qrun)
1581                                 some += qhinterrupt(ctlr, qh);
1582                         qh = qh->next;
1583                 }while(qh != ctlr->qhs && i++ < 100);
1584                 if(i > 100)
1585                         iprint("echi: interrupt: qh loop?\n");
1586         }
1587         return some;
1588 }
1589
1590 static int
1591 ehciintr(Hci *hp)
1592 {
1593         Ctlr *ctlr;
1594         int some;
1595
1596         ctlr = hp->aux;
1597         ilock(ctlr);
1598         some = ctlrinterrupt(ctlr);
1599         iunlock(ctlr);
1600         return some;
1601 }
1602
1603 static void
1604 interrupt(Ureg*, void* a)
1605 {
1606         ehciintr(a);
1607 }
1608
1609 static int
1610 portenable(Hci *hp, int port, int on)
1611 {
1612         Ctlr *ctlr;
1613         Eopio *opio;
1614         int s;
1615
1616         ctlr = hp->aux;
1617         opio = ctlr->opio;
1618         s = opio->portsc[port-1];
1619         eqlock(&ctlr->portlck);
1620         if(waserror()){
1621                 qunlock(&ctlr->portlck);
1622                 nexterror();
1623         }
1624         dprint("ehci %#p port %d enable=%d; sts %#x\n",
1625                 ctlr->capio, port, on, s);
1626         ilock(ctlr);
1627         if(s & (Psstatuschg | Pschange))
1628                 opio->portsc[port-1] = s;
1629         if(on)
1630                 opio->portsc[port-1] |= Psenable;
1631         else
1632                 opio->portsc[port-1] &= ~Psenable;
1633         coherence();
1634         microdelay(64);
1635         iunlock(ctlr);
1636         tsleep(&up->sleep, return0, 0, Enabledelay);
1637         dprint("ehci %#p port %d enable=%d: sts %#lux\n",
1638                 ctlr->capio, port, on, opio->portsc[port-1]);
1639         qunlock(&ctlr->portlck);
1640         poperror();
1641         return 0;
1642 }
1643
1644 /*
1645  * If we detect during status that the port is low-speed or
1646  * during reset that it's full-speed, the device is not for
1647  * ourselves. The companion controller will take care.
1648  * Low-speed devices will not be seen by usbd. Full-speed
1649  * ones are seen because it's only after reset that we know what
1650  * they are (usbd may notice a device not enabled in this case).
1651  */
1652 static void
1653 portlend(Ctlr *ctlr, int port, char *ss)
1654 {
1655         Eopio *opio;
1656         ulong s;
1657
1658         opio = ctlr->opio;
1659
1660         dprint("ehci %#p port %d: %s speed device: no longer owned\n",
1661                 ctlr->capio, port, ss);
1662         s = opio->portsc[port-1] & ~(Pschange|Psstatuschg);
1663         opio->portsc[port-1] = s | Psowner;
1664         coherence();
1665 }
1666
1667 static int
1668 portreset(Hci *hp, int port, int on)
1669 {
1670         ulong *portscp;
1671         Eopio *opio;
1672         Ctlr *ctlr;
1673         int i;
1674
1675         if(on == 0)
1676                 return 0;
1677
1678         ctlr = hp->aux;
1679         opio = ctlr->opio;
1680         eqlock(&ctlr->portlck);
1681         if(waserror()){
1682                 iunlock(ctlr);
1683                 qunlock(&ctlr->portlck);
1684                 nexterror();
1685         }
1686         portscp = &opio->portsc[port-1];
1687         dprint("ehci %#p port %d reset; sts %#lux\n", ctlr->capio, port, *portscp);
1688         ilock(ctlr);
1689         /* Shalted must be zero, else Psreset will stay set */
1690         if (opio->sts & Shalted)
1691                 iprint("ehci %#p: halted yet trying to reset port\n",
1692                         ctlr->capio);
1693
1694         *portscp = (*portscp & ~Psenable) | Psreset;    /* initiate reset */
1695         /*
1696          * usb 2 spec: reset must finish within 20 ms.
1697          * linux says spec says it can take 50 ms. for hubs.
1698          */
1699         delay(50);
1700         *portscp &= ~Psreset;   /* terminate reset */
1701
1702         delay(10);
1703         for(i = 0; *portscp & Psreset && i < 10; i++)
1704                 delay(10);
1705
1706         if (*portscp & Psreset)
1707                 iprint("ehci %#p: port %d didn't reset; sts %#lux\n",
1708                         ctlr->capio, port, *portscp);
1709
1710         delay(10);                      /* ehci spec: enable within 2 ms. */
1711         if((*portscp & Psenable) == 0)
1712                 portlend(ctlr, port, "full");
1713
1714         iunlock(ctlr);
1715         dprint("ehci %#p after port %d reset; sts %#lux\n",
1716                 ctlr->capio, port, *portscp);
1717         qunlock(&ctlr->portlck);
1718         poperror();
1719         return 0;
1720 }
1721
1722 static int
1723 portstatus(Hci *hp, int port)
1724 {
1725         int s, r;
1726         Eopio *opio;
1727         Ctlr *ctlr;
1728
1729         ctlr = hp->aux;
1730         opio = ctlr->opio;
1731         eqlock(&ctlr->portlck);
1732         if(waserror()){
1733                 iunlock(ctlr);
1734                 qunlock(&ctlr->portlck);
1735                 nexterror();
1736         }
1737         ilock(ctlr);
1738         s = opio->portsc[port-1];
1739         if(s & (Psstatuschg | Pschange)){
1740                 opio->portsc[port-1] = s;
1741                 coherence();
1742                 ddprint("ehci %#p port %d status %#x\n", ctlr->capio, port, s);
1743         }
1744         /*
1745          * If the port is a low speed port we yield ownership now
1746          * to the [uo]hci companion controller and pretend it's not here.
1747          */
1748         if((s & Pspresent) != 0 && (s & Pslinemask) == Pslow){
1749                 portlend(ctlr, port, "low");
1750                 s &= ~Pspresent;                /* not for us this time */
1751         }
1752         iunlock(ctlr);
1753         qunlock(&ctlr->portlck);
1754         poperror();
1755
1756         /*
1757          * We must return status bits as a
1758          * get port status hub request would do.
1759          */
1760         r = 0;
1761         if(s & Pspresent)
1762                 r |= HPpresent|HPhigh;
1763         if(s & Psenable)
1764                 r |= HPenable;
1765         if(s & Pssuspend)
1766                 r |= HPsuspend;
1767         if(s & Psreset)
1768                 r |= HPreset;
1769         if(s & Psstatuschg)
1770                 r |= HPstatuschg;
1771         if(s & Pschange)
1772                 r |= HPchange;
1773         return r;
1774 }
1775
1776 static char*
1777 seprintio(char *s, char *e, Qio *io, char *pref)
1778 {
1779         s = seprint(s,e,"%s io %#p qh %#p id %#x", pref, io, io->qh, io->usbid);
1780         s = seprint(s,e," iot %ld", io->iotime);
1781         s = seprint(s,e," tog %#x tok %#x err %s", io->toggle, io->tok, io->err);
1782         return s;
1783 }
1784
1785 static char*
1786 seprintep(char *s, char *e, Ep *ep)
1787 {
1788         Qio *io;
1789         Ctlio *cio;
1790         Ctlr *ctlr;
1791
1792         ctlr = ep->hp->aux;
1793         ilock(ctlr);
1794         if(ep->aux == nil){
1795                 *s = 0;
1796                 iunlock(ctlr);
1797                 return s;
1798         }
1799         switch(ep->ttype){
1800         case Tctl:
1801                 cio = ep->aux;
1802                 s = seprintio(s, e, cio, "c");
1803                 s = seprint(s, e, "\trepl %d ndata %d\n", ep->rhrepl, cio->ndata);
1804                 break;
1805         case Tbulk:
1806         case Tintr:
1807                 io = ep->aux;
1808                 if(ep->mode != OWRITE)
1809                         s = seprintio(s, e, &io[OREAD], "r");
1810                 if(ep->mode != OREAD)
1811                         s = seprintio(s, e, &io[OWRITE], "w");
1812                 break;
1813         case Tiso:
1814                 *s = 0;
1815                 break;
1816         }
1817         iunlock(ctlr);
1818         return s;
1819 }
1820
1821 /*
1822  * halt condition was cleared on the endpoint. update our toggles.
1823  */
1824 static void
1825 clrhalt(Ep *ep)
1826 {
1827         Qio *io;
1828
1829         ep->clrhalt = 0;
1830         coherence();
1831         switch(ep->ttype){
1832         case Tintr:
1833         case Tbulk:
1834                 io = ep->aux;
1835                 if(ep->mode != OREAD){
1836                         qlock(&io[OWRITE]);
1837                         io[OWRITE].toggle = Tddata0;
1838                         deprint("ep clrhalt for io %#p\n", io+OWRITE);
1839                         qunlock(&io[OWRITE]);
1840                 }
1841                 if(ep->mode != OWRITE){
1842                         qlock(&io[OREAD]);
1843                         io[OREAD].toggle = Tddata0;
1844                         deprint("ep clrhalt for io %#p\n", io+OREAD);
1845                         qunlock(&io[OREAD]);
1846                 }
1847                 break;
1848         }
1849 }
1850
1851 static void
1852 xdump(char* pref, void *qh)
1853 {
1854         int i;
1855         ulong *u;
1856
1857         u = qh;
1858         print("%s %#p:", pref, u);
1859         for(i = 0; i < 16; i++)
1860                 if((i%4) == 0)
1861                         print("\n %#8.8ulx", u[i]);
1862                 else
1863                         print(" %#8.8ulx", u[i]);
1864         print("\n");
1865 }
1866
1867 static long
1868 episohscpy(Ctlr *ctlr, Ep *ep, Isoio* iso, uchar *b, long count)
1869 {
1870         int nr;
1871         long tot;
1872         Itd *tdu;
1873
1874         for(tot = 0; iso->tdi != iso->tdu && tot < count; tot += nr){
1875                 tdu = iso->tdu;
1876                 if(itdactive(tdu))
1877                         break;
1878                 nr = tdu->ndata;
1879                 if(tot + nr > count)
1880                         nr = count - tot;
1881                 if(nr == 0)
1882                         print("ehci: ep%d.%d: too many polls\n",
1883                                 ep->dev->nb, ep->nb);
1884                 else{
1885                         iunlock(ctlr);          /* We could page fault here */
1886                         memmove(b+tot, tdu->data, nr);
1887                         ilock(ctlr);
1888                         if(iso->tdu != tdu)
1889                                 continue;
1890                         if(nr < tdu->ndata)
1891                                 memmove(tdu->data, tdu->data+nr, tdu->ndata - nr);
1892                         tdu->ndata -= nr;
1893                         coherence();
1894                 }
1895                 if(tdu->ndata == 0){
1896                         itdinit(iso, tdu);
1897                         iso->tdu = tdu->next;
1898                 }
1899         }
1900         return tot;
1901 }
1902
1903 static long
1904 episofscpy(Ctlr *ctlr, Ep *ep, Isoio* iso, uchar *b, long count)
1905 {
1906         int nr;
1907         long tot;
1908         Sitd *stdu;
1909
1910         for(tot = 0; iso->stdi != iso->stdu && tot < count; tot += nr){
1911                 stdu = iso->stdu;
1912                 if(stdu->csw & Stdactive){
1913                         diprint("ehci: episoread: %#p tdu active\n", iso);
1914                         break;
1915                 }
1916                 nr = stdu->ndata;
1917                 if(tot + nr > count)
1918                         nr = count - tot;
1919                 if(nr == 0)
1920                         print("ehci: ep%d.%d: too many polls\n",
1921                                 ep->dev->nb, ep->nb);
1922                 else{
1923                         iunlock(ctlr);          /* We could page fault here */
1924                         memmove(b+tot, stdu->data, nr);
1925                         ilock(ctlr);
1926                         if(iso->stdu != stdu)
1927                                 continue;
1928                         if(nr < stdu->ndata)
1929                                 memmove(stdu->data, stdu->data+nr,
1930                                         stdu->ndata - nr);
1931                         stdu->ndata -= nr;
1932                         coherence();
1933                 }
1934                 if(stdu->ndata == 0){
1935                         sitdinit(iso, stdu);
1936                         iso->stdu = stdu->next;
1937                 }
1938         }
1939         return tot;
1940 }
1941
1942 static long
1943 episoread(Ep *ep, Isoio *iso, void *a, long count)
1944 {
1945         Ctlr *ctlr;
1946         uchar *b;
1947         long tot;
1948
1949         iso->debug = ep->debug;
1950         diprint("ehci: episoread: %#p ep%d.%d\n", iso, ep->dev->nb, ep->nb);
1951
1952         b = a;
1953         ctlr = ep->hp->aux;
1954         eqlock(iso);
1955         if(waserror()){
1956                 qunlock(iso);
1957                 nexterror();
1958         }
1959         iso->err = nil;
1960         iso->nerrs = 0;
1961         ilock(ctlr);
1962         if(iso->state == Qclose){
1963                 iunlock(ctlr);
1964                 error(iso->err ? iso->err : Eio);
1965         }
1966         iso->state = Qrun;
1967         coherence();
1968         while(isocanread(iso) == 0){
1969                 iunlock(ctlr);
1970                 diprint("ehci: episoread: %#p sleep\n", iso);
1971                 if(waserror()){
1972                         if(iso->err == nil)
1973                                 iso->err = "I/O timed out";
1974                         ilock(ctlr);
1975                         break;
1976                 }
1977                 tsleep(iso, isocanread, iso, ep->tmout);
1978                 poperror();
1979                 ilock(ctlr);
1980         }
1981         if(iso->state == Qclose){
1982                 iunlock(ctlr);
1983                 error(iso->err ? iso->err : Eio);
1984         }
1985         iso->state = Qdone;
1986         coherence();
1987         assert(iso->tdu != iso->tdi);
1988
1989         if(iso->hs != 0)
1990                 tot = episohscpy(ctlr, ep, iso, b, count);
1991         else
1992                 tot = episofscpy(ctlr, ep, iso, b, count);
1993         iunlock(ctlr);
1994         qunlock(iso);
1995         poperror();
1996         diprint("uhci: episoread: %#p %uld bytes err '%s'\n", iso, tot, iso->err);
1997         if(iso->err != nil)
1998                 error(iso->err);
1999         return tot;
2000 }
2001
2002 /*
2003  * iso->tdu is the next place to put data. When it gets full
2004  * it is activated and tdu advanced.
2005  */
2006 static long
2007 putsamples(Ctlr *ctlr, Isoio *iso, uchar *b, long count)
2008 {
2009         long left, tot, n;
2010         Sitd *stdu;
2011         Itd *tdu;
2012
2013         for(tot = 0; isocanwrite(iso) && tot < count; tot += n){
2014                 n = count-tot;
2015                 left = iso->nleft;
2016                 if(iso->hs != 0){
2017                         tdu = iso->tdu;
2018                         if(n > tdu->mdata - left)
2019                                 n = tdu->mdata - left;
2020                         iunlock(ctlr);          /* We could page fault here */
2021                         memmove(tdu->data + left, b + tot, n);
2022                         ilock(ctlr);
2023                         if(iso->tdu != tdu)
2024                                 continue;
2025                         iso->nleft += n;
2026                         if(iso->nleft == tdu->mdata){
2027                                 itdinit(iso, tdu);
2028                                 iso->tdu = tdu->next;
2029                                 iso->nleft = 0;
2030                         }
2031                 }else{
2032                         stdu = iso->stdu;
2033                         if(n > stdu->mdata - left)
2034                                 n = stdu->mdata - left;
2035                         iunlock(ctlr);          /* We could page fault here */
2036                         memmove(stdu->data + left, b + tot, n);
2037                         ilock(ctlr);
2038                         if(iso->stdu != stdu)
2039                                 continue;
2040                         iso->nleft += n;
2041                         if(iso->nleft == stdu->mdata){
2042                                 sitdinit(iso, stdu);
2043                                 iso->stdu = stdu->next;
2044                                 iso->nleft = 0;
2045                         }
2046                 }
2047         }
2048         return tot;
2049 }
2050
2051 /*
2052  * Queue data for writing and return error status from
2053  * last writes done, to maintain buffered data.
2054  */
2055 static long
2056 episowrite(Ep *ep, Isoio *iso, void *a, long count)
2057 {
2058         Ctlr *ctlr;
2059         uchar *b;
2060         int tot, nw;
2061         char *err;
2062
2063         iso->delay = ep->sampledelay * ep->samplesz;
2064         iso->debug = ep->debug;
2065         diprint("ehci: episowrite: %#p ep%d.%d\n", iso, ep->dev->nb, ep->nb);
2066
2067         ctlr = ep->hp->aux;
2068         eqlock(iso);
2069         if(waserror()){
2070                 qunlock(iso);
2071                 nexterror();
2072         }
2073         ilock(ctlr);
2074         if(iso->state == Qclose){
2075                 iunlock(ctlr);
2076                 error(iso->err ? iso->err : Eio);
2077         }
2078         iso->state = Qrun;
2079         coherence();
2080         b = a;
2081         for(tot = 0; tot < count; tot += nw){
2082                 while(isocanwrite(iso) == 0){
2083                         iunlock(ctlr);
2084                         diprint("ehci: episowrite: %#p sleep\n", iso);
2085                         if(waserror()){
2086                                 if(iso->err == nil)
2087                                         iso->err = "I/O timed out";
2088                                 ilock(ctlr);
2089                                 break;
2090                         }
2091                         tsleep(iso, isocanwrite, iso, ep->tmout);
2092                         poperror();
2093                         ilock(ctlr);
2094                 }
2095                 err = iso->err;
2096                 iso->err = nil;
2097                 if(iso->state == Qclose || err != nil){
2098                         iunlock(ctlr);
2099                         error(err ? err : Eio);
2100                 }
2101                 if(iso->state != Qrun)
2102                         panic("episowrite: iso not running");
2103                 nw = putsamples(ctlr, iso, b+tot, count-tot);
2104         }
2105         while(isodelay(iso) == 0){
2106                 iunlock(ctlr);
2107                 sleep(iso, isodelay, iso);
2108                 ilock(ctlr);
2109         }
2110         if(iso->state != Qclose)
2111                 iso->state = Qdone;
2112         iunlock(ctlr);
2113         err = iso->err;         /* in case it failed early */
2114         iso->err = nil;
2115         qunlock(iso);
2116         poperror();
2117         if(err != nil)
2118                 error(err);
2119         diprint("ehci: episowrite: %#p %d bytes\n", iso, tot);
2120         return tot;
2121 }
2122
2123 static int
2124 nexttoggle(int toggle, int count, int maxpkt)
2125 {
2126         int np;
2127
2128         np = count / maxpkt;
2129         if(np == 0)
2130                 np = 1;
2131         if((np % 2) == 0)
2132                 return toggle;
2133         if(toggle == Tddata1)
2134                 return Tddata0;
2135         else
2136                 return Tddata1;
2137 }
2138
2139 static Td*
2140 epgettd(Qio *io, int flags, void *a, int count, int maxpkt)
2141 {
2142         Td *td;
2143         ulong pa;
2144         int i;
2145
2146         if(count > Tdmaxpkt)
2147                 panic("ehci: epgettd: too many bytes");
2148         td = tdalloc();
2149         td->csw = flags | io->toggle | io->tok | count << Tdlenshift |
2150                 Tderr2 | Tderr1;
2151         coherence();
2152
2153         /*
2154          * use the space wasted by alignment as an
2155          * embedded buffer if count bytes fit in there.
2156          */
2157         assert(Align > sizeof(Td));
2158         if(count <= Align - sizeof(Td)){
2159                 td->data = td->sbuff;
2160                 td->buff = nil;
2161         } else if(count <= 0x4000){
2162                 td->buff = td->data = smalloc(count);
2163         } else {
2164                 td->buff = smalloc(count + 0x1000);
2165                 td->data = (uchar*)ROUND((uintptr)td->buff, 0x1000);
2166         }
2167
2168         pa = PADDR(td->data);
2169         for(i = 0; i < nelem(td->buffer); i++){
2170                 td->buffer[i] = pa;
2171                 pa &= ~0xFFF;
2172                 pa += 0x1000;
2173         }
2174         td->ndata = count;
2175         if(a != nil && count > 0)
2176                 memmove(td->data, a, count);
2177         coherence();
2178         io->toggle = nexttoggle(io->toggle, count, maxpkt);
2179         coherence();
2180         return td;
2181 }
2182
2183 /*
2184  * Try to get them idle
2185  */
2186 static void
2187 aborttds(Qh *qh)
2188 {
2189         Td *td;
2190
2191         if(qh->sched >= 0 && (qh->eps0 & Qhspeedmask) != Qhhigh)
2192                 qh->eps0 |= Qhint;      /* inactivate on next pass */
2193         qh->csw = (qh->csw & ~Tdactive) | Tdhalt;
2194         coherence();
2195         for(td = qh->tds; td != nil; td = td->next){
2196                 if(td->csw & Tdactive){
2197                         td->ndata = 0;
2198                         td->csw |= Tdhalt;
2199                         coherence();
2200                 }
2201         }
2202 }
2203
2204 /*
2205  * Some controllers do not post the usb/error interrupt after
2206  * the work has been done. It seems that we must poll for them.
2207  */
2208 static int
2209 workpending(void *a)
2210 {
2211         Ctlr *ctlr;
2212
2213         ctlr = a;
2214         return ctlr->nreqs > 0;
2215 }
2216
2217 static void
2218 ehcipoll(void* a)
2219 {
2220         Hci *hp;
2221         Ctlr *ctlr;
2222         Poll *poll;
2223         int i;
2224
2225         hp = a;
2226         ctlr = hp->aux;
2227         poll = &ctlr->poll;
2228         for(;;){
2229                 if(ctlr->nreqs == 0){
2230                         if(0)ddprint("ehcipoll %#p sleep\n", ctlr->capio);
2231                         sleep(poll, workpending, ctlr);
2232                         if(0)ddprint("ehcipoll %#p awaken\n", ctlr->capio);
2233                 }
2234                 for(i = 0; i < 16 && ctlr->nreqs > 0; i++)
2235                         if(ehciintr(hp) == 0)
2236                                  break;
2237                 do{
2238                         tsleep(&up->sleep, return0, 0, 1);
2239                         ehciintr(hp);
2240                 }while(ctlr->nreqs > 0);
2241         }
2242 }
2243
2244 static void
2245 pollcheck(Hci *hp)
2246 {
2247         Ctlr *ctlr;
2248         Poll *poll;
2249
2250         ctlr = hp->aux;
2251         poll = &ctlr->poll;
2252
2253         if(poll->must != 0 && poll->does == 0){
2254                 lock(poll);
2255                 if(poll->must != 0 && poll->does == 0){
2256                         poll->does++;
2257                         print("ehci %#p: polling\n", ctlr->capio);
2258                         kproc("ehcipoll", ehcipoll, hp);
2259                 }
2260                 unlock(poll);
2261         }
2262 }
2263
2264 static int
2265 epiodone(void *a)
2266 {
2267         Qh *qh;
2268
2269         qh = a;
2270         return qh->state != Qrun;
2271 }
2272
2273 static void
2274 epiowait(Hci *hp, Qio *io, int tmout, ulong load)
2275 {
2276         Qh *qh;
2277         int timedout;
2278         Ctlr *ctlr;
2279
2280         ctlr = hp->aux;
2281         qh = io->qh;
2282         ddqprint("ehci io %#p sleep on qh %#p state %s\n",
2283                 io, qh, qhsname[qh->state]);
2284         timedout = 0;
2285         if(waserror()){
2286                 dqprint("ehci io %#p qh %#p timed out\n", io, qh);
2287                 timedout++;
2288         }else{
2289                 if(tmout == 0)
2290                         sleep(io, epiodone, qh);
2291                 else
2292                         tsleep(io, epiodone, qh, tmout);
2293                 poperror();
2294         }
2295
2296         ilock(ctlr);
2297         /* Are we missing interrupts? */
2298         if(qh->state == Qrun){
2299                 ctlrinterrupt(ctlr);
2300                 if(qh->state == Qdone){
2301                         dqprint("ehci %#p: polling required\n", ctlr->capio);
2302                         ctlr->poll.must = 1;
2303                         pollcheck(hp);
2304                 }
2305         }
2306
2307         if(qh->state == Qrun){
2308                 dqprint("ehci io %#p qh %#p timed out (no intr?)\n", io, qh);
2309                 timedout = 1;
2310         }else if(qh->state != Qdone && qh->state != Qclose)
2311                 panic("ehci: epio: queue state %d", qh->state);
2312         if(timedout){
2313                 aborttds(qh);
2314                 qh->state = Qdone;
2315                 if(io->err == nil)
2316                         io->err = "request timed out";
2317                 iunlock(ctlr);
2318                 while(waserror())
2319                         ;
2320                 tsleep(&up->sleep, return0, 0, Abortdelay);
2321                 poperror();
2322                 ilock(ctlr);
2323         }
2324         if(qh->state != Qclose)
2325                 qh->state = Qidle;
2326         qhlinktd(qh, nil);
2327         ctlr->load -= load;
2328         ctlr->nreqs--;
2329         iunlock(ctlr);
2330 }
2331
2332 /*
2333  * Non iso I/O.
2334  * To make it work for control transfers, the caller may
2335  * lock the Qio for the entire control transfer.
2336  */
2337 static long
2338 epio(Ep *ep, Qio *io, void *a, long count, int mustlock)
2339 {
2340         int saved, ntds, tmout;
2341         long n, tot;
2342         ulong load;
2343         char *err;
2344         char buf[128];
2345         uchar *c;
2346         Ctlr *ctlr;
2347         Qh* qh;
2348         Td *td, *ltd, *td0, *ntd;
2349
2350         ctlr = ep->hp->aux;
2351         io->debug = ep->debug;
2352         tmout = ep->tmout;
2353         ddeprint("epio: %s ep%d.%d io %#p count %ld load %uld\n",
2354                 io->tok == Tdtokin ? "in" : "out",
2355                 ep->dev->nb, ep->nb, io, count, ctlr->load);
2356         if((ehcidebug > 1 || ep->debug > 1) && io->tok != Tdtokin){
2357                 seprintdata(buf, buf+sizeof(buf), a, count);
2358                 print("echi epio: user data: %s\n", buf);
2359         }
2360         if(mustlock){
2361                 eqlock(io);
2362                 if(waserror()){
2363                         qunlock(io);
2364                         nexterror();
2365                 }
2366         }
2367         io->err = nil;
2368         ilock(ctlr);
2369         qh = io->qh;
2370         if(qh == nil || qh->state == Qclose){   /* Tds released by cancelio */
2371                 iunlock(ctlr);
2372                 error(io->err ? io->err : Eio);
2373         }
2374         if(qh->state != Qidle)
2375                 panic("epio: qh not idle");
2376         qh->state = Qinstall;
2377         iunlock(ctlr);
2378
2379         c = a;
2380         td0 = ltd = nil;
2381         load = tot = 0;
2382         do{
2383                 n = (Tdmaxpkt / ep->maxpkt) * ep->maxpkt;
2384                 if(count-tot < n)
2385                         n = count-tot;
2386                 if(c != nil && io->tok != Tdtokin)
2387                         td = epgettd(io, Tdactive, c+tot, n, ep->maxpkt);
2388                 else
2389                         td = epgettd(io, Tdactive, nil, n, ep->maxpkt);
2390                 if(td0 == nil)
2391                         td0 = td;
2392                 else
2393                         tdlinktd(ltd, td);
2394                 ltd = td;
2395                 tot += n;
2396                 load += ep->load;
2397         }while(tot < count);
2398         if(td0 == nil || ltd == nil)
2399                 panic("epio: no td");
2400
2401         ltd->csw |= Tdioc;              /* the last one interrupts */
2402         coherence();
2403
2404         ddeprint("ehci: load %uld ctlr load %uld\n", load, ctlr->load);
2405         if(ehcidebug > 1 || ep->debug > 1)
2406                 dumptd(td0, "epio: put: ");
2407
2408         ilock(ctlr);
2409         if(qh->state != Qclose){
2410                 io->iotime = TK2MS(MACHP(0)->ticks);
2411                 qh->state = Qrun;
2412                 coherence();
2413                 qhlinktd(qh, td0);
2414                 ctlr->nreqs++;
2415                 ctlr->load += load;
2416         }
2417         iunlock(ctlr);
2418
2419         if(ctlr->poll.does)
2420                 wakeup(&ctlr->poll);
2421
2422         epiowait(ep->hp, io, tmout, load);
2423         if(ehcidebug > 1 || ep->debug > 1){
2424                 dumptd(td0, "epio: got: ");
2425                 qhdump(qh);
2426         }
2427         err = io->err;
2428
2429         tot = 0;
2430         c = a;
2431         saved = 0;
2432         ntds = 0;
2433         for(td = td0; td != nil; td = ntd){
2434                 ntds++;
2435                 /*
2436                  * Use td tok, not io tok, because of setup packets.
2437                  * Also, we must save the next toggle value from the
2438                  * last completed Td (in case of a short packet, or
2439                  * fewer than the requested number of packets in the
2440                  * Td being transferred).
2441                  */
2442                 if(td->csw & (Tdhalt|Tdactive))
2443                         saved++;
2444                 else{
2445                         if(!saved){
2446                                 io->toggle = td->csw & Tddata1;
2447                                 coherence();
2448                         }
2449                         if(err == nil && (n = td->ndata) > 0 && tot < count){
2450                                 if((tot + n) > count)
2451                                         n = count - tot;
2452                                 if(c != nil && (td->csw & Tdtok) == Tdtokin){
2453                                         memmove(c, td->data, n);
2454                                         c += n;
2455                                 }
2456                                 tot += n;
2457                         }
2458                 }
2459                 ntd = td->next;
2460                 tdfree(td);
2461         }
2462         if(mustlock){
2463                 qunlock(io);
2464                 poperror();
2465         }
2466         ddeprint("epio: io %#p: %d tds: return %ld err '%s'\n",
2467                 io, ntds, tot, err);
2468         if(err == Estalled)
2469                 return 0;       /* that's our convention */
2470         if(err != nil)
2471                 error(err);
2472         return tot;
2473 }
2474
2475 static long
2476 epread(Ep *ep, void *a, long count)
2477 {
2478         Ctlio *cio;
2479         Qio *io;
2480         Isoio *iso;
2481         char buf[160];
2482         ulong delta;
2483
2484         ddeprint("ehci: epread\n");
2485         if(ep->aux == nil)
2486                 panic("epread: not open");
2487
2488         pollcheck(ep->hp);
2489
2490         switch(ep->ttype){
2491         case Tctl:
2492                 cio = ep->aux;
2493                 eqlock(cio);
2494                 if(waserror()){
2495                         qunlock(cio);
2496                         nexterror();
2497                 }
2498                 ddeprint("epread ctl ndata %d\n", cio->ndata);
2499                 if(cio->ndata < 0)
2500                         error("request expected");
2501                 else if(cio->ndata == 0){
2502                         cio->ndata = -1;
2503                         count = 0;
2504                 }else{
2505                         if(count > cio->ndata)
2506                                 count = cio->ndata;
2507                         if(count > 0)
2508                                 memmove(a, cio->data, count);
2509                         /* BUG for big transfers */
2510                         free(cio->data);
2511                         cio->data = nil;
2512                         cio->ndata = 0; /* signal EOF next time */
2513                 }
2514                 qunlock(cio);
2515                 poperror();
2516                 if(ehcidebug>1 || ep->debug){
2517                         seprintdata(buf, buf+sizeof(buf), a, count);
2518                         print("epread: %s\n", buf);
2519                 }
2520                 return count;
2521         case Tbulk:
2522                 io = ep->aux;
2523                 if(ep->clrhalt)
2524                         clrhalt(ep);
2525                 return epio(ep, &io[OREAD], a, count, 1);
2526         case Tintr:
2527                 io = ep->aux;
2528                 delta = TK2MS(MACHP(0)->ticks) - io[OREAD].iotime + 1;
2529                 if(delta < ep->pollival / 2)
2530                         tsleep(&up->sleep, return0, 0, ep->pollival/2 - delta);
2531                 if(ep->clrhalt)
2532                         clrhalt(ep);
2533                 return epio(ep, &io[OREAD], a, count, 1);
2534         case Tiso:
2535                 iso = ep->aux;
2536                 return episoread(ep, iso, a, count);
2537         }
2538         return -1;
2539 }
2540
2541 /*
2542  * Control transfers are one setup write (data0)
2543  * plus zero or more reads/writes (data1, data0, ...)
2544  * plus a final write/read with data1 to ack.
2545  * For both host to device and device to host we perform
2546  * the entire transfer when the user writes the request,
2547  * and keep any data read from the device for a later read.
2548  * We call epio three times instead of placing all Tds at
2549  * the same time because doing so leads to crc/tmout errors
2550  * for some devices.
2551  * Upon errors on the data phase we must still run the status
2552  * phase or the device may cease responding in the future.
2553  */
2554 static long
2555 epctlio(Ep *ep, Ctlio *cio, void *a, long count)
2556 {
2557         uchar *c;
2558         long len;
2559
2560         ddeprint("epctlio: cio %#p ep%d.%d count %ld\n",
2561                 cio, ep->dev->nb, ep->nb, count);
2562         if(count < Rsetuplen)
2563                 error("short usb comand");
2564         eqlock(cio);
2565         free(cio->data);
2566         cio->data = nil;
2567         cio->ndata = 0;
2568         if(waserror()){
2569                 free(cio->data);
2570                 cio->data = nil;
2571                 cio->ndata = 0;
2572                 qunlock(cio);
2573                 nexterror();
2574         }
2575
2576         /* set the address if unset and out of configuration state */
2577         if(ep->dev->state != Dconfig && ep->dev->state != Dreset)
2578                 if(cio->usbid == 0){
2579                         cio->usbid = (ep->nb&Epmax) << 7 | ep->dev->nb&Devmax;
2580                         coherence();
2581                         qhsetaddr(cio->qh, cio->usbid);
2582                 }
2583         /* adjust maxpkt if the user has learned a different one */
2584         if(qhmaxpkt(cio->qh) != ep->maxpkt)
2585                 qhsetmaxpkt(cio->qh, ep->maxpkt);
2586         c = a;
2587         cio->tok = Tdtoksetup;
2588         cio->toggle = Tddata0;
2589         coherence();
2590         if(epio(ep, cio, a, Rsetuplen, 0) < Rsetuplen)
2591                 error(Eio);
2592         a = c + Rsetuplen;
2593         count -= Rsetuplen;
2594
2595         cio->toggle = Tddata1;
2596         if(c[Rtype] & Rd2h){
2597                 cio->tok = Tdtokin;
2598                 len = GET2(c+Rcount);
2599                 if(len <= 0)
2600                         error("bad length in d2h request");
2601                 if(len > Maxctllen)
2602                         error("d2h data too large to fit in ehci");
2603                 a = cio->data = smalloc(len+1);
2604         }else{
2605                 cio->tok = Tdtokout;
2606                 len = count;
2607         }
2608         coherence();
2609         if(len > 0)
2610                 if(waserror())
2611                         len = -1;
2612                 else{
2613                         len = epio(ep, cio, a, len, 0);
2614                         poperror();
2615                 }
2616         if(c[Rtype] & Rd2h){
2617                 count = Rsetuplen;
2618                 cio->ndata = len;
2619                 cio->tok = Tdtokout;
2620         }else{
2621                 if(len < 0)
2622                         count = -1;
2623                 else
2624                         count = Rsetuplen + len;
2625                 cio->tok = Tdtokin;
2626         }
2627         cio->toggle = Tddata1;
2628         coherence();
2629         epio(ep, cio, nil, 0, 0);
2630         qunlock(cio);
2631         poperror();
2632         ddeprint("epctlio cio %#p return %ld\n", cio, count);
2633         return count;
2634 }
2635
2636 static long
2637 epwrite(Ep *ep, void *a, long count)
2638 {
2639         Qio *io;
2640         Ctlio *cio;
2641         Isoio *iso;
2642         ulong delta;
2643
2644         pollcheck(ep->hp);
2645
2646         ddeprint("ehci: epwrite ep%d.%d\n", ep->dev->nb, ep->nb);
2647         if(ep->aux == nil)
2648                 panic("ehci: epwrite: not open");
2649         switch(ep->ttype){
2650         case Tctl:
2651                 cio = ep->aux;
2652                 return epctlio(ep, cio, a, count);
2653         case Tbulk:
2654                 io = ep->aux;
2655                 if(ep->clrhalt)
2656                         clrhalt(ep);
2657                 return epio(ep, &io[OWRITE], a, count, 1);
2658         case Tintr:
2659                 io = ep->aux;
2660                 delta = TK2MS(MACHP(0)->ticks) - io[OWRITE].iotime + 1;
2661                 if(delta < ep->pollival)
2662                         tsleep(&up->sleep, return0, 0, ep->pollival - delta);
2663                 if(ep->clrhalt)
2664                         clrhalt(ep);
2665                 return epio(ep, &io[OWRITE], a, count, 1);
2666         case Tiso:
2667                 iso = ep->aux;
2668                 return episowrite(ep, iso, a, count);
2669         }
2670         return -1;
2671 }
2672
2673 static void
2674 isofsinit(Ep *ep, Isoio *iso)
2675 {
2676         long left;
2677         Sitd *td, *ltd;
2678         int i;
2679         ulong frno;
2680
2681         left = 0;
2682         ltd = nil;
2683         frno = iso->td0frno;
2684         for(i = 0; i < iso->nframes; i++){
2685                 td = sitdalloc();
2686                 td->data = iso->data + i * ep->maxpkt;
2687                 td->epc = ep->dev->port << Stdportshift;
2688                 td->epc |= ep->dev->hub << Stdhubshift;
2689                 td->epc |= ep->nb << Stdepshift;
2690                 td->epc |= ep->dev->nb << Stddevshift;
2691                 td->mfs = 034 << Stdscmshift | 1 << Stdssmshift;
2692                 if(ep->mode == OREAD){
2693                         td->epc |= Stdin;
2694                         td->mdata = ep->maxpkt;
2695                 }else{
2696                         td->mdata = (ep->hz+left) * ep->pollival / 1000;
2697                         td->mdata *= ep->samplesz;
2698                         left = (ep->hz+left) * ep->pollival % 1000;
2699                         if(td->mdata > ep->maxpkt){
2700                                 print("ehci: ep%d.%d: size > maxpkt\n",
2701                                         ep->dev->nb, ep->nb);
2702                                 print("size = %ld max = %ld\n",
2703                                         td->mdata,ep->maxpkt);
2704                                 td->mdata = ep->maxpkt;
2705                         }
2706                 }
2707                 coherence();
2708
2709                 iso->sitdps[frno] = td;
2710                 coherence();
2711                 sitdinit(iso, td);
2712                 if(ltd != nil)
2713                         ltd->next = td;
2714                 ltd = td;
2715                 frno = TRUNC(frno+ep->pollival, Nisoframes);
2716         }
2717         ltd->next = iso->sitdps[iso->td0frno];
2718         coherence();
2719 }
2720
2721 static void
2722 isohsinit(Ep *ep, Isoio *iso)
2723 {
2724         int ival, p;
2725         long left;
2726         ulong frno, i, pa;
2727         Itd *ltd, *td;
2728
2729         iso->hs = 1;
2730         ival = 1;
2731         if(ep->pollival > 8)
2732                 ival = ep->pollival/8;
2733         left = 0;
2734         ltd = nil;
2735         frno = iso->td0frno;
2736         for(i = 0; i < iso->nframes; i++){
2737                 td = itdalloc();
2738                 td->data = iso->data + i * 8 * iso->maxsize;
2739                 pa = PADDR(td->data) & ~0xFFF;
2740                 for(p = 0; p < nelem(td->buffer); p++){
2741                         td->buffer[p] = pa;
2742                         pa += 0x1000;
2743                 }
2744                 td->buffer[0] |= ep->nb << Itdepshift | ep->dev->nb << Itddevshift;
2745                 if(ep->mode == OREAD)
2746                         td->buffer[1] |= Itdin;
2747                 else
2748                         td->buffer[1] |= Itdout;
2749                 td->buffer[1] |= ep->maxpkt << Itdmaxpktshift;
2750                 td->buffer[2] |= ep->ntds << Itdntdsshift;
2751
2752                 if(ep->mode == OREAD)
2753                         td->mdata = 8 * iso->maxsize;
2754                 else{
2755                         td->mdata = (ep->hz + left) * ep->pollival / 1000;
2756                         td->mdata *= ep->samplesz;
2757                         left = (ep->hz + left) * ep->pollival % 1000;
2758                 }
2759                 coherence();
2760                 iso->itdps[frno] = td;
2761                 coherence();
2762                 itdinit(iso, td);
2763                 if(ltd != nil)
2764                         ltd->next = td;
2765                 ltd = td;
2766                 frno = TRUNC(frno + ival, Nisoframes);
2767         }
2768 }
2769
2770 static void
2771 isoopen(Ctlr *ctlr, Ep *ep)
2772 {
2773         int ival;               /* pollival in ms */
2774         int tpf;                /* tds per frame */
2775         int i, n, w, woff;
2776         ulong frno;
2777         Isoio *iso;
2778
2779         iso = ep->aux;
2780         switch(ep->mode){
2781         case OREAD:
2782                 iso->tok = Tdtokin;
2783                 break;
2784         case OWRITE:
2785                 iso->tok = Tdtokout;
2786                 break;
2787         default:
2788                 error("iso i/o is half-duplex");
2789         }
2790         iso->usbid = ep->nb << 7 | ep->dev->nb & Devmax;
2791         iso->state = Qidle;
2792         coherence();
2793         iso->debug = ep->debug;
2794         ival = ep->pollival;
2795         tpf = 1;
2796         if(ep->dev->speed == Highspeed){
2797                 tpf = 8;
2798                 if(ival <= 8)
2799                         ival = 1;
2800                 else
2801                         ival /= 8;
2802         }
2803         assert(ival != 0);
2804         iso->nframes = Nisoframes / ival;
2805         if(iso->nframes < 3)
2806                 error("uhci isoopen bug");      /* we need at least 3 tds */
2807         iso->maxsize = ep->ntds * ep->maxpkt;
2808         if(ctlr->load + ep->load > 800)
2809                 print("usb: ehci: bandwidth may be exceeded\n");
2810         ilock(ctlr);
2811         ctlr->load += ep->load;
2812         ctlr->isoload += ep->load;
2813         ctlr->nreqs++;
2814         dprint("ehci: load %uld isoload %uld\n", ctlr->load, ctlr->isoload);
2815         diprint("iso nframes %d pollival %uld ival %d maxpkt %uld ntds %d\n",
2816                 iso->nframes, ep->pollival, ival, ep->maxpkt, ep->ntds);
2817         iunlock(ctlr);
2818         if(ctlr->poll.does)
2819                 wakeup(&ctlr->poll);
2820
2821         /*
2822          * From here on this cannot raise errors
2823          * unless we catch them and release here all memory allocated.
2824          */
2825         assert(ep->maxpkt > 0 && ep->ntds > 0 && ep->ntds < 4);
2826         assert(ep->maxpkt <= 1024);
2827         iso->tdps = smalloc(sizeof(uintptr) * Nisoframes);
2828         iso->data = smalloc(iso->nframes * tpf * ep->ntds * ep->maxpkt);
2829         iso->td0frno = TRUNC(ctlr->opio->frno + 10, Nisoframes);
2830         /* read: now; write: 1s ahead */
2831
2832         if(ep->dev->speed == Highspeed)
2833                 isohsinit(ep, iso);
2834         else
2835                 isofsinit(ep, iso);
2836         iso->tdu = iso->tdi = iso->itdps[iso->td0frno];
2837         iso->stdu = iso->stdi = iso->sitdps[iso->td0frno];
2838         coherence();
2839
2840         ilock(ctlr);
2841         frno = iso->td0frno;
2842         for(i = 0; i < iso->nframes; i++){
2843                 *iso->tdps[frno] = ctlr->frames[frno];
2844                 frno = TRUNC(frno+ival, Nisoframes);
2845         }
2846
2847         /*
2848          * Iso uses a virtual frame window of Nisoframes, and we must
2849          * fill the actual ctlr frame array by placing ctlr->nframes/Nisoframes
2850          * copies of the window in the frame array.
2851          */
2852         assert(ctlr->nframes >= Nisoframes && Nisoframes >= iso->nframes);
2853         assert(Nisoframes >= Nintrleafs);
2854         n = ctlr->nframes / Nisoframes;
2855         for(w = 0; w < n; w++){
2856                 frno = iso->td0frno;
2857                 woff = w * Nisoframes;
2858                 for(i = 0; i < iso->nframes ; i++){
2859                         assert(woff+frno < ctlr->nframes);
2860                         assert(iso->tdps[frno] != nil);
2861                         if(ep->dev->speed == Highspeed)
2862                                 ctlr->frames[woff+frno] = PADDR(iso->tdps[frno])
2863                                         |Litd;
2864                         else
2865                                 ctlr->frames[woff+frno] = PADDR(iso->tdps[frno])
2866                                         |Lsitd;
2867                         coherence();
2868                         frno = TRUNC(frno+ep->pollival, Nisoframes);
2869                 }
2870         }
2871         coherence();
2872         iso->next = ctlr->iso;
2873         ctlr->iso = iso;
2874         coherence();
2875         iso->state = Qdone;
2876         iunlock(ctlr);
2877         if(ehcidebug > 1 || iso->debug >1)
2878                 isodump(iso, 0);
2879 }
2880
2881 /*
2882  * Allocate the endpoint and set it up for I/O
2883  * in the controller. This must follow what's said
2884  * in Ep regarding configuration, including perhaps
2885  * the saved toggles (saved on a previous close of
2886  * the endpoint data file by epclose).
2887  */
2888 static void
2889 epopen(Ep *ep)
2890 {
2891         Ctlr *ctlr;
2892         Ctlio *cio;
2893         Qio *io;
2894         int usbid;
2895
2896         ctlr = ep->hp->aux;
2897         deprint("ehci: epopen ep%d.%d\n", ep->dev->nb, ep->nb);
2898         if(ep->aux != nil)
2899                 panic("ehci: epopen called with open ep");
2900         if(waserror()){
2901                 free(ep->aux);
2902                 ep->aux = nil;
2903                 nexterror();
2904         }
2905         switch(ep->ttype){
2906         case Tnone:
2907                 error("endpoint not configured");
2908         case Tiso:
2909                 ep->aux = smalloc(sizeof(Isoio));
2910                 isoopen(ctlr, ep);
2911                 break;
2912         case Tctl:
2913                 cio = ep->aux = smalloc(sizeof(Ctlio));
2914                 cio->debug = ep->debug;
2915                 cio->ndata = -1;
2916                 cio->data = nil;
2917                 if(ep->dev->isroot != 0 && ep->nb == 0) /* root hub */
2918                         break;
2919                 cio->qh = qhalloc(ctlr, ep, cio, "epc");
2920                 break;
2921         case Tbulk:
2922                 ep->pollival = 1;       /* assume this; doesn't really matter */
2923                 /* and fall... */
2924         case Tintr:
2925                 io = ep->aux = smalloc(sizeof(Qio)*2);
2926                 io[OREAD].debug = io[OWRITE].debug = ep->debug;
2927                 usbid = (ep->nb&Epmax) << 7 | ep->dev->nb &Devmax;
2928                 assert(ep->pollival != 0);
2929                 if(ep->mode != OREAD){
2930                         if(ep->toggle[OWRITE] != 0)
2931                                 io[OWRITE].toggle = Tddata1;
2932                         else
2933                                 io[OWRITE].toggle = Tddata0;
2934                         io[OWRITE].tok = Tdtokout;
2935                         io[OWRITE].usbid = usbid;
2936                         io[OWRITE].bw = ep->maxpkt*1000/ep->pollival; /* bytes/s */
2937                         io[OWRITE].qh = qhalloc(ctlr, ep, io+OWRITE, "epw");
2938                 }
2939                 if(ep->mode != OWRITE){
2940                         if(ep->toggle[OREAD] != 0)
2941                                 io[OREAD].toggle = Tddata1;
2942                         else
2943                                 io[OREAD].toggle = Tddata0;
2944                         io[OREAD].tok = Tdtokin;
2945                         io[OREAD].usbid = usbid;
2946                         io[OREAD].bw = ep->maxpkt*1000/ep->pollival; /* bytes/s */
2947                         io[OREAD].qh = qhalloc(ctlr, ep, io+OREAD, "epr");
2948                 }
2949                 break;
2950         }
2951         coherence();
2952         if(ehcidebug>1 || ep->debug)
2953                 dump(ep->hp);
2954         deprint("ehci: epopen done\n");
2955         poperror();
2956 }
2957
2958 static void
2959 cancelio(Ctlr *ctlr, Qio *io)
2960 {
2961         Qh *qh;
2962
2963         ilock(ctlr);
2964         qh = io->qh;
2965         if(qh == nil || qh->state == Qclose){
2966                 iunlock(ctlr);
2967                 return;
2968         }
2969         dqprint("ehci: cancelio for qh %#p state %s\n",
2970                 qh, qhsname[qh->state]);
2971         aborttds(qh);
2972         qh->state = Qclose;
2973         iunlock(ctlr);
2974         while(waserror())
2975                 ;
2976         tsleep(&up->sleep, return0, 0, Abortdelay);
2977         poperror();
2978         wakeup(io);
2979         qlock(io);
2980         /* wait for epio if running */
2981         if(io->qh == qh)
2982                 io->qh = nil;
2983         qunlock(io);
2984
2985         qhfree(ctlr, qh);
2986 }
2987
2988 static void
2989 cancelisoio(Ctlr *ctlr, Isoio *iso, int pollival, ulong load)
2990 {
2991         int frno, i, n, t, w, woff;
2992         ulong *lp, *tp;
2993         Isoio **il;
2994         Itd *td;
2995         Sitd *std;
2996
2997         ilock(ctlr);
2998         if(iso->state == Qclose){
2999                 iunlock(ctlr);
3000                 return;
3001         }
3002         ctlr->nreqs--;
3003         if(iso->state != Qrun && iso->state != Qdone)
3004                 panic("bad iso state");
3005         iso->state = Qclose;
3006         coherence();
3007         if(ctlr->isoload < load)
3008                 panic("ehci: low isoload");
3009         ctlr->isoload -= load;
3010         ctlr->load -= load;
3011         for(il = &ctlr->iso; *il != nil; il = &(*il)->next)
3012                 if(*il == iso)
3013                         break;
3014         if(*il == nil)
3015                 panic("cancleiso: not found");
3016         *il = iso->next;
3017
3018         frno = iso->td0frno;
3019         for(i = 0; i < iso->nframes; i++){
3020                 tp = iso->tdps[frno];
3021                 if(iso->hs != 0){
3022                         td = iso->itdps[frno];
3023                         for(t = 0; t < nelem(td->csw); t++)
3024                                 td->csw[t] &= ~(Itdioc|Itdactive);
3025                 }else{
3026                         std = iso->sitdps[frno];
3027                         std->csw &= ~(Stdioc|Stdactive);
3028                 }
3029                 coherence();
3030                 for(lp = &ctlr->frames[frno]; !(*lp & Lterm);
3031                     lp = &LPTR(*lp)[0])
3032                         if(LPTR(*lp) == tp)
3033                                 break;
3034                 if(*lp & Lterm)
3035                         panic("cancelisoio: td not found");
3036                 *lp = tp[0];
3037                 /*
3038                  * Iso uses a virtual frame window of Nisoframes, and we must
3039                  * restore pointers in copies of the window kept at ctlr->frames.
3040                  */
3041                 if(lp == &ctlr->frames[frno]){
3042                         n = ctlr->nframes / Nisoframes;
3043                         for(w = 1; w < n; w++){
3044                                 woff = w * Nisoframes;
3045                                 ctlr->frames[woff+frno] = *lp;
3046                         }
3047                 }
3048                 coherence();
3049                 frno = TRUNC(frno+pollival, Nisoframes);
3050         }
3051         iunlock(ctlr);
3052
3053         /*
3054          * wakeup anyone waiting for I/O and
3055          * wait to be sure no I/O is in progress in the controller.
3056          * and then wait to be sure episo* is no longer running.
3057          */
3058         wakeup(iso);
3059         diprint("cancelisoio iso %#p waiting for I/O to cease\n", iso);
3060         tsleep(&up->sleep, return0, 0, 5);
3061         qlock(iso);
3062         qunlock(iso);
3063         diprint("cancelisoio iso %#p releasing iso\n", iso);
3064
3065         frno = iso->td0frno;
3066         for(i = 0; i < iso->nframes; i++){
3067                 if(iso->hs != 0)
3068                         itdfree(iso->itdps[frno]);
3069                 else
3070                         sitdfree(iso->sitdps[frno]);
3071                 iso->tdps[frno] = nil;
3072                 frno = TRUNC(frno+pollival, Nisoframes);
3073         }
3074         free(iso->tdps);
3075         iso->tdps = nil;
3076         free(iso->data);
3077         iso->data = nil;
3078         coherence();
3079 }
3080
3081 static void
3082 epclose(Ep *ep)
3083 {
3084         Qio *io;
3085         Ctlio *cio;
3086         Isoio *iso;
3087         Ctlr *ctlr;
3088
3089         ctlr = ep->hp->aux;
3090         deprint("ehci: epclose ep%d.%d\n", ep->dev->nb, ep->nb);
3091
3092         if(ep->aux == nil)
3093                 panic("ehci: epclose called with closed ep");
3094         switch(ep->ttype){
3095         case Tctl:
3096                 cio = ep->aux;
3097                 cancelio(ctlr, cio);
3098                 free(cio->data);
3099                 cio->data = nil;
3100                 break;
3101         case Tintr:
3102         case Tbulk:
3103                 io = ep->aux;
3104                 ep->toggle[OREAD] = ep->toggle[OWRITE] = 0;
3105                 if(ep->mode != OWRITE){
3106                         cancelio(ctlr, &io[OREAD]);
3107                         if(io[OREAD].toggle == Tddata1)
3108                                 ep->toggle[OREAD] = 1;
3109                 }
3110                 if(ep->mode != OREAD){
3111                         cancelio(ctlr, &io[OWRITE]);
3112                         if(io[OWRITE].toggle == Tddata1)
3113                                 ep->toggle[OWRITE] = 1;
3114                 }
3115                 coherence();
3116                 break;
3117         case Tiso:
3118                 iso = ep->aux;
3119                 cancelisoio(ctlr, iso, ep->pollival, ep->load);
3120                 break;
3121         default:
3122                 panic("epclose: bad ttype");
3123         }
3124         free(ep->aux);
3125         ep->aux = nil;
3126 }
3127
3128 /*
3129  * return smallest power of 2 >= n
3130  */
3131 static int
3132 flog2(int n)
3133 {
3134         int i;
3135
3136         for(i = 0; (1 << i) < n; i++)
3137                 ;
3138         return i;
3139 }
3140
3141 /*
3142  * build the periodic scheduling tree:
3143  * framesize must be a multiple of the tree size
3144  */
3145 static void
3146 mkqhtree(Ctlr *ctlr)
3147 {
3148         int i, n, d, o, leaf0, depth;
3149         ulong leafs[Nintrleafs];
3150         Qh *qh;
3151         Qh **tree;
3152         Qtree *qt;
3153
3154         depth = flog2(Nintrleafs);
3155         n = (1 << (depth+1)) - 1;
3156         qt = mallocz(sizeof(*qt), 1);
3157         if(qt == nil)
3158                 panic("ehci: mkqhtree: no memory");
3159         qt->nel = n;
3160         qt->depth = depth;
3161         qt->bw = mallocz(n * sizeof(qt->bw), 1);
3162         qt->root = tree = mallocz(n * sizeof(Qh *), 1);
3163         if(qt->bw == nil || tree == nil)
3164                 panic("ehci: mkqhtree: no memory");
3165         for(i = 0; i < n; i++){
3166                 tree[i] = qh = edalloc();
3167                 if(qh == nil)
3168                         panic("ehci: mkqhtree: no memory");
3169                 qh->nlink = qh->alink = qh->link = Lterm;
3170                 qh->csw = Tdhalt;
3171                 qh->state = Qidle;
3172                 coherence();
3173                 if(i > 0)
3174                         qhlinkqh(tree[i], tree[(i-1)/2]);
3175         }
3176         ctlr->ntree = i;
3177         dprint("ehci: tree: %d endpoints allocated\n", i);
3178
3179         /* distribute leaves evenly round the frame list */
3180         leaf0 = n / 2;
3181         for(i = 0; i < Nintrleafs; i++){
3182                 o = 0;
3183                 for(d = 0; d < depth; d++){
3184                         o <<= 1;
3185                         if(i & (1 << d))
3186                                 o |= 1;
3187                 }
3188                 if(leaf0 + o >= n){
3189                         print("leaf0=%d o=%d i=%d n=%d\n", leaf0, o, i, n);
3190                         break;
3191                 }
3192                 leafs[i] = PADDR(tree[leaf0 + o]) | Lqh;
3193         }
3194         assert((ctlr->nframes % Nintrleafs) == 0);
3195         for(i = 0; i < ctlr->nframes; i += Nintrleafs){
3196                 memmove(ctlr->frames + i, leafs, sizeof leafs);
3197                 coherence();
3198         }
3199         ctlr->tree = qt;
3200         coherence();
3201 }
3202
3203 void
3204 ehcimeminit(Ctlr *ctlr)
3205 {
3206         int i, frsize;
3207         Eopio *opio;
3208
3209         opio = ctlr->opio;
3210         frsize = ctlr->nframes * sizeof(ulong);
3211         assert((frsize & 0xFFF) == 0);          /* must be 4k aligned */
3212         ctlr->frames = xspanalloc(frsize, frsize, 0);
3213         if(ctlr->frames == nil)
3214                 panic("ehci reset: no memory");
3215
3216         for (i = 0; i < ctlr->nframes; i++)
3217                 ctlr->frames[i] = Lterm;
3218         opio->frbase = PADDR(ctlr->frames);
3219         opio->frno = 0;
3220         coherence();
3221
3222         qhalloc(ctlr, nil, nil, nil);   /* init async list */
3223         mkqhtree(ctlr);                 /* init sync list */
3224         edfree(edalloc());              /* try to get some ones pre-allocated */
3225
3226         dprint("ehci %#p flb %#lux frno %#lux\n",
3227                 ctlr->capio, opio->frbase, opio->frno);
3228 }
3229
3230 static void
3231 init(Hci *hp)
3232 {
3233         Ctlr *ctlr;
3234         Eopio *opio;
3235         static int ctlrno;
3236         int i;
3237
3238         hp->highspeed = 1;
3239         ctlr = hp->aux;
3240         opio = ctlr->opio;
3241         dprint("ehci %#p init\n", ctlr->capio);
3242
3243         ilock(ctlr);
3244         /*
3245          * Unless we activate frroll interrupt
3246          * some machines won't post other interrupts.
3247          */
3248         opio->intr = Iusb|Ierr|Iportchg|Ihcerr|Iasync;
3249         coherence();
3250         opio->cmd |= Cpse;
3251         coherence();
3252         opio->cmd |= Case;
3253         coherence();
3254         ehcirun(ctlr, 1);
3255
3256         /* route all ports to us */
3257         opio->config = Callmine;
3258         coherence();
3259
3260         for (i = 0; i < hp->nports; i++)
3261                 opio->portsc[i] = Pspower;
3262         iunlock(ctlr);
3263         if(ehcidebug > 1)
3264                 dump(hp);
3265         ctlrno++;
3266 }
3267
3268 void
3269 ehcilinkage(Hci *hp)
3270 {
3271         hp->init = init;
3272         hp->dump = dump;
3273         hp->interrupt = interrupt;
3274         hp->epopen = epopen;
3275         hp->epclose = epclose;
3276         hp->epread = epread;
3277         hp->epwrite = epwrite;
3278         hp->seprintep = seprintep;
3279         hp->portenable = portenable;
3280         hp->portreset = portreset;
3281         hp->portstatus = portstatus;
3282 //      hp->shutdown = shutdown;
3283 //      hp->debug = setdebug;
3284         hp->type = "ehci";
3285 }