


Wie sollte der abstrakte Syntaxbaum von Python Ast verwendet werden?
Einführung
Abstrakte Syntaxbäume sind abstrakte Syntaxbäume. Ast ist ein Zwischenprodukt vom Python-Quellcode zum Bytecode. Mit Hilfe des ast-Moduls kann die Quellcodestruktur aus der Perspektive eines Syntaxbaums analysiert werden.
Darüber hinaus können wir nicht nur den Syntaxbaum ändern und ausführen, sondern auch den von Source generierten Syntaxbaum in Python-Quellcode entparsen. Daher lässt ast genügend Raum für die Überprüfung des Python-Quellcodes, die Syntaxanalyse, die Codeänderung und das Code-Debugging.
1. Einführung in AST
Der von Python offiziell bereitgestellte CPython-Interpreter verarbeitet Python-Quellcode wie folgt:
Parse-Quellcode in einen Parse-Baum (Parser/pgen.c)
Transformiere den Parse-Baum in einen abstrakten Syntaxbaum (Python/ast.c)
AST in ein Kontrollflussdiagramm umwandeln (Python/compile.c)
Bytecode basierend auf dem Kontrollflussdiagramm ausgeben (Python/compile.c)
Das heißt, der Verarbeitungsprozess von Der eigentliche Python-Code lautet wie folgt:
Quellcode-Analyse--> Abstrakter Syntaxbaum (AST)--> Kontrollflussdiagramm--> 5. Der Python-Quellcode wird zunächst in einen Syntaxbaum analysiert und dann in einen abstrakten Syntaxbaum umgewandelt. Im abstrakten Syntaxbaum können wir die Syntaxstruktur von Python in der Quellcodedatei sehen.
In den meisten Fällen werden abstrakte Syntaxbäume für die Programmierung möglicherweise nicht benötigt, aber unter bestimmten Bedingungen und Anforderungen bietet AST seine eigenen besonderen Vorteile.
Das Folgende ist ein einfaches Beispiel für abstrakte Syntax.
Module(body=[ Print( dest=None, values=[BinOp( left=Num(n=1),op=Add(),right=Num(n=2))], nl=True, )])
2. AST erstellen
2.1 Kompilierungsfunktion
Lassen Sie uns zunächst kurz die Kompilierungsfunktion verstehen.
compile(source, filename, mode[, flags[, dont_inherit]])- source – String oder AST-Objekt (Abstract Syntax Trees). Im Allgemeinen kann der gesamte Inhalt der PY-Datei an file.read() übergeben werden.
- Dateiname – der Name der Codedatei oder ein identifizierbarer Wert, wenn der Code nicht aus einer Datei gelesen wird.
- mode – Geben Sie den Typ des kompilierten Codes an. Kann als exec, eval, single angegeben werden.
- Flags – Variablenbereich, lokaler Namespace, falls angegeben, kann ein beliebiges Zuordnungsobjekt sein.
- flags und dont_inherit sind Flags, die zur Steuerung beim Kompilieren des Quellcodes verwendet werden.
func_def = \ """ def add(x, y): return x + y print add(3, 5) """
Nach dem Login kopierenVerwenden Sie Compile zum Kompilieren und Ausführen:
>>> cm = compile(func_def, '<string>', 'exec') >>> exec cm >>> 8
Die obige func_def wird durch Kompilieren kompiliert, um den Bytecode zu erhalten. cm ist das Codeobjekt.
compile(source, filename, mode, ast.PyCF_ONLY_AST) <==> ast.parse(source, filename='2.2 ast generieren', mode='exec')
Das Folgende ist die ast-Struktur, die func_def entspricht:Verwenden Sie das obige func_def, um ast zu generieren.
r_node = ast.parse(func_def) print astunparse.dump(r_node) # print ast.dump(r_node)Nach dem Login kopieren
Module(body=[
FunctionDef(
name='add',
args=arguments(
args=[Name(id='x',ctx=Param()),Name(id='y',ctx=Param())],
vararg=None,
kwarg=None,
defaults=[]),
body=[Return(value=BinOp(
left=Name(id='x',ctx=Load()),
op=Add(),
right=Name(id='y',ctx=Load())))],
decorator_list=[]),
Print(
dest=None,
values=[Call(
func=Name(id='add',ctx=Load()),
args=[Num(n=3),Num(n=5)],
keywords=[],
starargs=None,
kwargs=None)],
nl=True)
])
Nach dem Login kopieren
Zusätzlich zu ast.dump gibt es viele Bibliotheken von Drittanbietern, die ast ausgeben, z. B. astunparse, codegen und unparse , usw. Diese Bibliotheken von Drittanbietern können nicht nur die AST-Struktur besser anzeigen, sondern AST auch umgekehrt in Python-Quellcode exportieren. Module(body=[ FunctionDef( name='add', args=arguments( args=[Name(id='x',ctx=Param()),Name(id='y',ctx=Param())], vararg=None, kwarg=None, defaults=[]), body=[Return(value=BinOp( left=Name(id='x',ctx=Load()), op=Add(), right=Name(id='y',ctx=Load())))], decorator_list=[]), Print( dest=None, values=[Call( func=Name(id='add',ctx=Load()), args=[Num(n=3),Num(n=5)], keywords=[], starargs=None, kwargs=None)], nl=True) ])
module Python version "$Revision$" { mod = Module(stmt* body)| Expression(expr body) stmt = FunctionDef(identifier name, arguments args, stmt* body, expr* decorator_list) | ClassDef(identifier name, expr* bases, stmt* body, expr* decorator_list) | Return(expr? value) | Print(expr? dest, expr* values, bool nl)| For(expr target, expr iter, stmt* body, stmt* orelse) expr = BoolOp(boolop op, expr* values) | BinOp(expr left, operator op, expr right)| Lambda(arguments args, expr body)| Dict(expr* keys, expr* values)| Num(object n) -- a number as a PyObject. | Str(string s) -- need to specify raw, unicode, etc?| Name(identifier id, expr_context ctx) | List(expr* elts, expr_context ctx) -- col_offset is the byte offset in the utf8 string the parser uses attributes (int lineno, int col_offset) expr_context = Load | Store | Del | AugLoad | AugStore | Param boolop = And | Or operator = Add | Sub | Mult | Div | Mod | Pow | LShift | RShift | BitOr | BitXor | BitAnd | FloorDiv arguments = (expr* args, identifier? vararg, identifier? kwarg, expr* defaults) }
class CodeVisitor(ast.NodeVisitor): def visit_BinOp(self, node): if isinstance(node.op, ast.Add): node.op = ast.Sub() self.generic_visit(node) def visit_FunctionDef(self, node): print 'Function Name:%s'% node.name self.generic_visit(node) func_log_stmt = ast.Print( dest = None, values = [ast.Str(s = 'calling func: %s' % node.name, lineno = 0, col_offset = 0)], nl = True, lineno = 0, col_offset = 0, ) node.body.insert(0, func_log_stmt) r_node = ast.parse(func_def) visitor = CodeVisitor() visitor.visit(r_node) # print astunparse.dump(r_node) print astunparse.unparse(r_node) exec compile(r_node, '<string>', 'exec')
Function Name:add
def add(x, y):
print 'calling func: add'
return (x - y)
print add(3, 5)
calling func: add
-2
Nach dem Login kopieren
3.2 ast.NodeTransformerDie Verwendung von NodeVisitor ändert hauptsächlich die AST-Struktur durch Ändern der Knoten im Syntaxbaum, und NodeTransformer ersetzt hauptsächlich die Knoten in ast. Da nun das in func_def definierte Add in eine Subtraktionsfunktion geändert wurde, gehen wir gründlicher vor und ändern den Funktionsnamen, die Parameter und die aufgerufenen Funktionen in ast und machen das Aufrufprotokoll der hinzugefügten Funktion komplizierter. Einige versuchen, es zu ändern bis zur Unkenntlichkeit:-) Function Name:add def add(x, y): print 'calling func: add' return (x - y) print add(3, 5) calling func: add -2
class CodeTransformer(ast.NodeTransformer):
def visit_BinOp(self, node):
if isinstance(node.op, ast.Add):
node.op = ast.Sub()
self.generic_visit(node)
return node
def visit_FunctionDef(self, node):
self.generic_visit(node)
if node.name == 'add':
node.name = 'sub'
args_num = len(node.args.args)
args = tuple([arg.id for arg in node.args.args])
func_log_stmt = ''.join(["print 'calling func: %s', " % node.name, "'args:'", ", %s" * args_num % args])
node.body.insert(0, ast.parse(func_log_stmt))
return node
def visit_Name(self, node):
replace = {'add': 'sub', 'x': 'a', 'y': 'b'}
re_id = replace.get(node.id, None)
node.id = re_id or node.id
self.generic_visit(node)
return node
r_node = ast.parse(func_def)
transformer = CodeTransformer()
r_node = transformer.visit(r_node)
# print astunparse.dump(r_node)
source = astunparse.unparse(r_node)
print source
# exec compile(r_node, '<string>', 'exec') # 新加入的node func_log_stmt 缺少lineno和col_offset属性
exec compile(source, '<string>', 'exec')
exec compile(ast.parse(source), '<string>', 'exec')
Nach dem Login kopieren
Ergebnis: class CodeTransformer(ast.NodeTransformer): def visit_BinOp(self, node): if isinstance(node.op, ast.Add): node.op = ast.Sub() self.generic_visit(node) return node def visit_FunctionDef(self, node): self.generic_visit(node) if node.name == 'add': node.name = 'sub' args_num = len(node.args.args) args = tuple([arg.id for arg in node.args.args]) func_log_stmt = ''.join(["print 'calling func: %s', " % node.name, "'args:'", ", %s" * args_num % args]) node.body.insert(0, ast.parse(func_log_stmt)) return node def visit_Name(self, node): replace = {'add': 'sub', 'x': 'a', 'y': 'b'} re_id = replace.get(node.id, None) node.id = re_id or node.id self.generic_visit(node) return node r_node = ast.parse(func_def) transformer = CodeTransformer() r_node = transformer.visit(r_node) # print astunparse.dump(r_node) source = astunparse.unparse(r_node) print source # exec compile(r_node, '<string>', 'exec') # 新加入的node func_log_stmt 缺少lineno和col_offset属性 exec compile(source, '<string>', 'exec') exec compile(ast.parse(source), '<string>', 'exec')
def sub(a, b): print 'calling func: sub', 'args:', a, b return (a - b) print sub(3, 5) calling func: sub args: 3 5 -2 calling func: sub args: 3 5 -2
Verwenden Sie den Unicode-Bereich
u4e00 - u9fff, um chinesische Schriftzeichen zu identifizieren (z. B. u';' == u'uff1b').
Das Folgende ist Eine Möglichkeit, festzustellen, ob eine Zeichenfolge chinesische Zeichen enthält. Eine Klasse von CNCheckHelper:Die Schnittstelle is_any_chinese verfügt über zwei Beurteilungsmodi. Die strikte Erkennung kann überprüft werden, solange sie chinesische Zeichenfolgen enthält, und die nicht strikte Erkennung muss alle chinesischen Zeichen enthalten.class CNCheckHelper(object): # 待检测文本可能的编码方式列表 VALID_ENCODING = ('utf-8', 'gbk') def _get_unicode_imp(self, value, idx = 0): if idx < len(self.VALID_ENCODING): try: return value.decode(self.VALID_ENCODING[idx]) except: return self._get_unicode_imp(value, idx + 1) def _get_unicode(self, from_str): if isinstance(from_str, unicode): return None return self._get_unicode_imp(from_str) def is_any_chinese(self, check_str, is_strict = True): unicode_str = self._get_unicode(check_str) if unicode_str: c_func = any if is_strict else all return c_func(u'\u4e00' <= char <= u'\u9fff' for char in unicode_str) return FalseNach dem Login kopieren
下面我们利用ast来遍历源文件的抽象语法树,并检测其中字符串是否包含中文字符。
class CodeCheck(ast.NodeVisitor): def __init__(self): self.cn_checker = CNCheckHelper() def visit_Str(self, node): self.generic_visit(node) # if node.s and any(u'\u4e00' <= char <= u'\u9fff' for char in node.s.decode('utf-8')): if self.cn_checker.is_any_chinese(node.s, True): print 'line no: %d, column offset: %d, CN_Str: %s' % (node.lineno, node.col_offset, node.s) project_dir = './your_project/script' for root, dirs, files in os.walk(project_dir): print root, dirs, files py_files = filter(lambda file: file.endswith('.py'), files) checker = CodeCheck() for file in py_files: file_path = os.path.join(root, file) print 'Checking: %s' % file_path with open(file_path, 'r') as f: root_node = ast.parse(f.read()) checker.visit(root_node)
上面这个例子比较的简单,但大概就是这个意思。
关于CPython解释器执行源码的过程可以参考官网描述:PEP 339
4.2 Closure 检查
一个函数中定义的函数或者lambda中引用了父函数中的local variable,并且当做返回值返回。特定场景下闭包是非常有用的,但是也很容易被误用。
关于python闭包的概念可以参考我的另一篇文章:理解Python闭包概念
这里简单介绍一下如何借助ast来检测lambda中闭包的引用。代码如下:
class LambdaCheck(ast.NodeVisitor): def __init__(self): self.illegal_args_list = [] self._cur_file = None self._cur_lambda_args = [] def set_cur_file(self, cur_file): assert os.path.isfile(cur_file), cur_file self._cur_file = os.path.realpath(cur_file) def visit_Lambda(self, node): """ lambda 闭包检查原则: 只需检测lambda expr body中args是否引用了lambda args list之外的参数 """ self._cur_lambda_args =[a.id for a in node.args.args] print astunparse.unparse(node) # print astunparse.dump(node) self.get_lambda_body_args(node.body) self.generic_visit(node) def record_args(self, name_node): if isinstance(name_node, ast.Name) and name_node.id not in self._cur_lambda_args: self.illegal_args_list.append((self._cur_file, 'line no:%s' % name_node.lineno, 'var:%s' % name_node.id)) def _is_args(self, node): if isinstance(node, ast.Name): self.record_args(node) return True if isinstance(node, ast.Call): map(self.record_args, node.args) return True return False def get_lambda_body_args(self, node): if self._is_args(node): return # for cnode in ast.walk(node): for cnode in ast.iter_child_nodes(node): if not self._is_args(cnode): self.get_lambda_body_args(cnode)
遍历工程文件:
project_dir = './your project/script' for root, dirs, files in os.walk(project_dir): py_files = filter(lambda file: file.endswith('.py'), files) checker = LambdaCheck() for file in py_files: file_path = os.path.join(root, file) checker.set_cur_file(file_path) with open(file_path, 'r') as f: root_node = ast.parse(f.read()) checker.visit(root_node) res = '\n'.join([' ## '.join(info) for info in checker.illegal_args_list]) print res
由于Lambda(arguments args, expr body)中的body expression可能非常复杂,上面的例子中仅仅处理了比较简单的body expr。可根据自己工程特点修改和扩展检查规则。为了更加一般化可以单独写一个visitor类来遍历lambda节点。
Das obige ist der detaillierte Inhalt vonWie sollte der abstrakte Syntaxbaum von Python Ast verwendet werden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Detaillierte Erläuterung von Deepseekapi -Zugriff und -anruf: Quick Start Guide In diesem Artikel können Sie ausführlich auf Deepseekapi zugreifen und anrufen und Ihnen helfen, leistungsstarke KI -Modelle problemlos zu verwenden. Schritt 1: Holen Sie sich den API -Schlüssel, um auf die offizielle Website von Deepseek zuzugreifen, und klicken Sie in der oberen rechten Ecke auf die "Plattform". Sie erhalten eine bestimmte Anzahl freier Token (zur Messung der API -Verwendung verwendet). Klicken Sie im Menü links auf "Apikeys" und dann auf "Apikey erstellen". Nennen Sie Ihren Apikey (z. B. "Test") und kopieren Sie den generierten Schlüssel sofort. Stellen Sie sicher, dass Sie diesen Schlüssel richtig speichern, da er nur einmal angezeigt wird

In diesem Artikel werden die quantitativen Handelsfunktionen der drei Hauptbörsen Binance, OKX und Gate.io untersucht, um quantitative Händler zu helfen, die richtige Plattform auszuwählen. Der Artikel stellt zunächst die Konzepte, Vorteile und Herausforderungen des quantitativen Handels ein und erklärt die Funktionen, dass eine hervorragende quantitative Handelssoftware wie API -Unterstützung, Datenquellen, Backtesting -Tools und Risikokontrollfunktionen haben sollte. Anschließend wurden die quantitativen Handelsfunktionen der drei Börsen ausführlich verglichen und analysiert, wobei sie auf ihre Vor- und Nachteile hingewiesen und schließlich Plattformauswahlvorschläge für quantitative Händler unterschiedlicher Erfahrungsstufen und Betonung der Bedeutung der Risikobewertung und des strategischen Backtests. Unabhängig davon

Lokaler Bereitstellungshandbuch für Deepseekl1 -Modell: Entsperren von Datenanalysen und Vorhersagepotential Deepseek ist ein leistungsstarkes Datenanalyse- und Vorhersage -Tool, und sein R1 -Modell kann eine effiziente und genaue Modellunterstützung für verschiedene Anwendungsszenarien bieten. Mit diesem Leitfaden wird Ihnen detaillierte Anweisungen zur Bereitstellung des DeepseEKR1-Modells in Ihrer lokalen Umgebung bereitgestellt, damit Sie schnell loslegen und seine Leistung nutzen können. Systemanforderungen für die lokale Bereitstellungsschrittvorbereitungsstufe des Deepr1 -Modells: Stellen Sie sicher, dass Ihre lokale Maschine die Mindestanforderungen für Systemkonfiguration von Deepseek erfüllt (für bestimmte Anforderungen finden Sie im offiziellen Deepseek -Dokument). Software -Installation: Laden Sie das von Deepseek bereitgestellte Installationspaket herunter und installieren Sie die Installationshandbuch

Deepseek Deep Learning Library Python Call Guide Deepseek ist eine leistungsstarke Deep -Learning -Bibliothek, mit der verschiedene neuronale Netzwerkmodelle erstellt und trainiert werden können. In diesem Artikel wird ausführlich vorgestellt, wie man Python verwendet, um Deepseek für Deep Learning Development anzurufen. Schritte, um Deepseek mit Python anzurufen. 1. Installieren Sie Deepseek stellen Sie sicher, dass die Python -Umgebung und die PIP -Tools installiert sind. Installieren Sie Deepseek mit dem folgenden Befehl: Pipinstalldeepseek2.

Anbi Alpha ist eine Tool- und Serviceaggregationsplattform für professionelle Händler und Investoren auf der Binance -Plattform. Zu den Kernfunktionen gehören: 1. Strategy Square, das verschiedene Handelsstrategien zusammenbringt; 2. Strategy Builder, der benutzerdefinierte Handelsstrategien ermöglicht; 3.. Erweiterte Datenanalyse, Bereitstellung von Marktanalysetools; 4. Dienste auf institutioneller Ebene, um den Bedürfnissen professioneller Investoren zu erfüllen.

Ab 2024 stützt der Mainstream-Kryptowährungsbörsen, die die direkte Sendung der Optionsabsicherungsanweisungen durch Handelsanschlüsse unterstützen: 1. Deribit unterstützt fortgeschrittene Strategien wie Delta-Absicherung und Gamma-Skalpaie und liefert Webversion/API One-Click-Absicherung. 2. OKX unterstützt Volatilitätsabsicherungs- und Strategie-Kombinationstools sowie ein integriertes Absicherungspanel im Web/der App. 3.. Binance unterstützt die Schutzabsicherung, die manuelle oder API -Kombinationspositionen erfordern. V. 5. Ledgerx, das Absicherungsinstrumente auf professioneller Ebene bietet und eine institutionelle Zertifizierung erfordert.

Viele Website -Entwickler stehen vor dem Problem der Integration von Node.js oder Python Services unter der Lampenarchitektur: Die vorhandene Lampe (Linux Apache MySQL PHP) Architekturwebsite benötigt ...

Python Parse Latex Multi-Layer-Klammern: Bauen Sie mehrdimensionales Wörterbuch viele Latex ...
