]> git.lizzy.rs Git - rust.git/commitdiff
start SOA parser interface
authorAleksey Kladov <aleksey.kladov@gmail.com>
Sun, 14 Nov 2021 13:47:13 +0000 (16:47 +0300)
committerAleksey Kladov <aleksey.kladov@gmail.com>
Sun, 12 Dec 2021 13:54:09 +0000 (16:54 +0300)
crates/parser/src/lib.rs
crates/parser/src/tokens.rs [new file with mode: 0644]

index 51ee96920483378a1a16d669dc4056ef7c306dd9..720ecf6fb62598613880c238e17b68b454bb6695 100644 (file)
@@ -20,6 +20,7 @@
 mod event;
 mod parser;
 mod grammar;
+mod tokens;
 
 pub(crate) use token_set::TokenSet;
 
diff --git a/crates/parser/src/tokens.rs b/crates/parser/src/tokens.rs
new file mode 100644 (file)
index 0000000..053d90a
--- /dev/null
@@ -0,0 +1,58 @@
+use crate::SyntaxKind;
+
+type bits = u64;
+
+pub type IdentKind = u8;
+
+/// Main input to the parser.
+///
+/// A sequence of tokens represented internally as a struct of arrays.
+#[derive(Default)]
+pub struct Tokens {
+    kind: Vec<SyntaxKind>,
+    joint: Vec<bits>,
+    ident_kind: Vec<IdentKind>,
+}
+
+impl Tokens {
+    pub fn push(&mut self, was_joint: bool, kind: SyntaxKind) {
+        self.push_impl(was_joint, kind, 0)
+    }
+    pub fn push_ident(&mut self, ident_kind: IdentKind) {
+        self.push_impl(false, SyntaxKind::IDENT, ident_kind)
+    }
+    fn push_impl(&mut self, was_joint: bool, kind: SyntaxKind, ctx: IdentKind) {
+        let idx = self.len();
+        if idx % (bits::BITS as usize) == 0 {
+            self.joint.push(0);
+        }
+        if was_joint && idx > 0 {
+            self.set_joint(idx - 1);
+        }
+        self.kind.push(kind);
+        self.ident_kind.push(ctx);
+    }
+    fn set_joint(&mut self, n: usize) {
+        let (idx, b_idx) = self.bit_index(n);
+        self.joint[idx] |= 1 << b_idx;
+    }
+    fn get_joint(&self, n: usize) -> bool {
+        let (idx, b_idx) = self.bit_index(n);
+        self.joint[idx] & 1 << b_idx != 0
+    }
+    fn bit_index(&self, n: usize) -> (usize, usize) {
+        let idx = n / (bits::BITS as usize);
+        let b_idx = n % (bits::BITS as usize);
+        (idx, b_idx)
+    }
+
+    pub fn len(&self) -> usize {
+        self.kind.len()
+    }
+    pub(crate) fn get(&self, idx: usize) -> Option<(SyntaxKind, bool, IdentKind)> {
+        let kind = *self.kind.get(idx)?;
+        let joint = self.get_joint(idx);
+        let ident_kind = *self.ident_kind.get(idx)?;
+        Some((kind, joint, ident_kind))
+    }
+}