Improve float type tokenizer

2019-07-25 13:02:33 +02:00
parent 0657214aa3
commit 6222dccaac
2 changed files with 27 additions and 19 deletions
--- a/smnp/token/tokenizers/float.py
+++ b/smnp/token/tokenizers/float.py
@@ -1,25 +1,17 @@
 from smnp.token.model import Token
-from smnp.token.tools import regexPatternTokenizer, keywordTokenizer
+from smnp.token.tools import regexPatternTokenizer, keywordTokenizer, allOf
 from smnp.token.type import TokenType


-def floatTokenizer(input, current, line):
-    consumedChars = 0
-    value = ""
-    consumed, token = regexPatternTokenizer(TokenType.INTEGER, r'\d')(input, current, line)
-    if consumed > 0:
-        consumedChars += consumed
-        value += token.value
-        consumed, token = keywordTokenizer(TokenType.DOT, ".")(input, current+consumedChars, line)
-        if consumed > 0:
-            consumedChars += consumed
-            value += token.value
-            consumed, token = regexPatternTokenizer(TokenType.INTEGER, r'\d')(input, current+consumedChars, line)
-            if consumed > 0:
-                consumedChars += consumed
-                value += token.value
-                print(value)
-                return (consumedChars, Token(TokenType.FLOAT, float(value), (current, line), value))
+def createToken(pos, beforeDot, dot, afterDot):
+    rawValue = f"{beforeDot.value}.{afterDot.value}"
+    value = float(rawValue)
+    return Token(TokenType.FLOAT, value, pos, rawValue)


-    return (0, None)
+floatTokenizer = allOf(
+    regexPatternTokenizer(TokenType.INTEGER, r'\d'),
+    keywordTokenizer(None, "."),
+    regexPatternTokenizer(TokenType.INTEGER, r'\d'),
+    createToken=createToken
+)
--- a/smnp/token/tools.py
+++ b/smnp/token/tools.py
@@ -61,3 +61,19 @@ def mapValue(tokenizer, mapper):
        return (0, None)

    return tokenize
+
+def allOf(*tokenizers, createToken):
+    def combinedTokenizer(input, current, line):
+        consumedChars = 0
+        tokens = []
+        for tokenizer in tokenizers:
+            consumed, token = tokenizer(input, current+consumedChars, line)
+            if consumed > 0:
+                consumedChars += consumed
+                tokens.append(token)
+            else:
+                return (0, None)
+
+        return (consumedChars, createToken((current, line), *tokens))
+
+    return combinedTokenizer