這裡先展示了程式的幫助訊息,然後是幾個簡單的四則運算測試,看起來是沒問題了(我可不敢保證,程式沒有bug!)。
這個格式化的JSON 資訊太長了,不利於直接看到。我們將它渲染出來看最後生成的樹形圖(方法見前兩個部落格)。儲存下面這個JSON 在一個檔案中,這裡我叫做demo.json,然後執行如下指令:pytm-cli -d LR -i demo.json -o demo.html
,然後再瀏覽器開啟生成的html 檔。
#所有的程式碼都在這裡了,只需要一個檔案my_eval.py
,想要運行的話,複製、貼上,然後按照演示的步驟執行即可。
Node、BinOp、Constan 是用來表示節點的類別.
Calculator 中lexizer 方法是進行分詞的,本來我是打算使用正則的,如果你看過我前面的博客的話,可以發現我是用的正規來分詞的(因為Python 的官方文檔正規表示式中有一個簡易的分詞程式)。不過我看其他人都是手寫的分詞,所以我也這麼做了,不過感覺並不是很好,很繁瑣,而且容易出錯。
parse 方法是進行解析的,主要是解析表達式的結構,判斷是否符合四則運算的文法,最後產生表達式樹(它的 AST)。
""" Grammar G -> E E -> T E' E' -> '+' T E' | '-' T E' | ɛ T -> F T' T' -> '*' F T' | '/' F T' | ɛ F -> '(' E ')' | num | name """ import json import argparse class Node: """ 简单的抽象语法树节点,定义一些需要使用到的具有层次结构的节点 """ def eval(self) -> float: ... # 节点的计算方法 def visit(self): ... # 节点的访问方法 class BinOp(Node): """ BinOp Node """ def __init__(self, left, op, right) -> None: self.left = left self.op = op self.right = right def eval(self) -> float: if self.op == "+": return self.left.eval() + self.right.eval() if self.op == "-": return self.left.eval() - self.right.eval() if self.op == "*": return self.left.eval() * self.right.eval() if self.op == "/": return self.left.eval() / self.right.eval() return 0 def visit(self): """ 遍历树的各个节点,并生成 JSON 表示 """ return { "name": "BinOp", "children": [ self.left.visit(), { "name": "OP", "children": [ { "name": self.op } ] }, self.right.visit() ] } class Constant(Node): """ Constant Node """ def __init__(self, value) -> None: self.value = value def eval(self) -> float: return self.value def visit(self): return { "name": "NUMBER", "children": [ { "name": str(self.value) # 转成字符是因为渲染成图像时,需要该字段为 str } ] } class Calculator: """ Simple Expression Parser """ def __init__(self, expr) -> None: self.expr = expr # 输入的表达式 self.parse_end = False # 解析是否结束,默认未结束 self.toks = [] # 解析的 tokens self.index = 0 # 解析的下标 def lexizer(self): """ 分词 """ index = 0 while index < len(self.expr): ch = self.expr[index] if ch in [" ", "\r", "\n"]: index += 1 continue if '0' <= ch <= '9': num_str = ch index += 1 while index < len(self.expr): n = self.expr[index] if '0' <= n <= '9': if ch == '0': raise Exception("Invalid number!") num_str = n index += 1 continue break self.toks.append({ "kind": "INT", "value": int(num_str) }) elif ch in ['+', '-', '*', '/', '(', ')']: self.toks.append({ "kind": ch, "value": ch }) index += 1 else: raise Exception("Unkonwn character!") def get_token(self): """ 获取当前位置的 token """ if 0 <= self.index < len(self.toks): tok = self.toks[self.index] return tok if self.index == len(self.toks): # token解析结束 return { "kind": "EOF", "value": "EOF" } raise Exception("Encounter Error, invalid index = ", self.index) def move_token(self): """ 下标向后移动一位 """ self.index += 1 def parse(self) -> Node: """ G -> E """ # 分词 self.lexizer() # 解析 expr_tree = self.parse_expr() if self.parse_end: return expr_tree else: raise Exception("Invalid expression!") def parse_expr(self): """ E -> T E' E' -> + T E' | - T E' | ɛ """ # E -> E E' left = self.parse_term() # E' -> + T E' | - T E' | ɛ while True: tok = self.get_token() kind = tok["kind"] value = tok["value"] if tok["kind"] == "EOF": # 解析结束的标志 self.parse_end = True break if kind in ["+", "-"]: self.move_token() left = BinOp(left, value, self.parse_term()) else: break return left def parse_term(self): """ T -> F T' T' -> * F T' | / F T' | ɛ """ # T -> F T' left = self.parse_factor() # T' -> * F T' | / F T' | ɛ while True: tok = self.get_token() kind = tok["kind"] value = tok["value"] if kind in ["*", "/"]: self.move_token() right = self.parse_factor() left = BinOp(left, value, right) else: break return left def parse_factor(self): """ F -> '(' E ')' | num | name """ tok = self.get_token() kind = tok["kind"] value = tok["value"] if kind == '(': self.move_token() expr_node = self.parse_expr() if self.get_token()["kind"] != ")": raise Exception("Encounter Error, expected )!") self.move_token() return expr_node if kind == "INT": self.move_token() return Constant(value=value) raise Exception("Encounter Error, unknown factor: ", kind) if __name__ == "__main__": # 添加命令行参数解析器 cmd_parser = argparse.ArgumentParser( description="Simple Expression Interpreter!") group = cmd_parser.add_mutually_exclusive_group() group.add_argument("--tokens", help="print tokens", action="store_true") group.add_argument("--ast", help="print ast in JSON", action="store_true") cmd_parser.add_argument( "expr", help="expression, contains ['+', '-', '*', '/', '(', ')', 'num']") args = cmd_parser.parse_args() calculator = Calculator(expr=args.expr) tree = calculator.parse() if args.tokens: # 输出 tokens for t in calculator.toks: print(f"{t['kind']:3s} ==> {t['value']}") elif args.ast: # 输出 JSON 表示的 AST print(json.dumps(tree.visit(), indent=4)) else: # 计算结果 print(tree.eval())
本來想在前面說一下為什麼叫 my_eval.py
,但是感覺看到後面的人不多,那就在這裡說好了。如果寫了一個複雜的表達式,那麼怎麼驗證是否正確的。這裡我們直接用 Python 這個最完美的解譯器就好了,哈哈。這裡用 Python 的 eval 函數,你當然是不需要呼叫這個函數,直接複製計算的表達式即可。我用 eval 函數,只是想表達為什麼我的程式會叫 my_eval
這個名字。
這樣實作下來,也算是完成了一個簡單的四則運算解釋器了。不過,如果你也做一遍的話,也估計會跟我一樣感覺到整個過程很繁瑣。因為分詞和文法解析都有現成的工具可以完成,而且不容易出錯,可以大幅減少工作量。不過,自己來一遍也是有必要的,在使用工具之前,至少也要了解工具的作用。
以上是使用Python實作一個簡單的四則運算解釋器的詳細內容。更多資訊請關注PHP中文網其他相關文章!