Die einstündige Ausdruckssprache
Dieser Blogbeitrag lässt sich am besten im Originalformat ansehen.
Dieser Beitrag fasst eine Präsentation mit dem Titel The One Hour Expression Language zusammen, in der sowohl die Konzepte als auch der Code besprochen werden.1
Eine Ausdruckssprache2 wertet in diesem Zusammenhang einen Ausdruck aus – eine Folge von Bytes, höchstwahrscheinlich UTF-8-Zeichen.3 Beispiele sind:
1 1
//article[@title="foobar"]//image
.items[].foo|select(.bar = "foo")
a.comments > 1 and a.category not in ["misc"]
Beispiele für Ausdruckssprachen (oder DSLs4) sind:
- JQ
- Kibana-Abfragesprache
- XPath-Sprache
- Symfony Expression Language
Warum eine eigene Ausdruckssprache aufbauen? Warum nicht? Zu beschäftigt? Mach dir keine Sorge! Es sind keine Monate, Wochen oder gar Tage erforderlich. Erstellen Sie eines in einer Stunde mit der One Hour Expression Language!5
ProCalc2000
Wir werden die Ausdruckssprache ProCalc2000 entwickeln – einen nichtwissenschaftlichen Rechenrechner der nächsten Generation für das Jahr 2000 und darüber hinaus.
Es wertet Ausdrücke wie 1 1
oder 1 2
aus und kann Divisionsprobleme wie 1 3 2 / 2
verarbeiten.
Godzilla
Godzilla mag Divisionen aufgrund von Gleitkommazahlen nicht.Die Sprache besteht aus Zahlen (z. B. 1, 2) und Operatoren ( , -, ). Es wird keine Operatorpriorität (siehe Anhang I) oder Division unterstützen.
Trotz seiner Einfachheit bietet es eine Grundlage für das Hinzufügen von Funktionen: Variablen, Funktionen, Pipe-Operatoren, Suffixe, String-Verkettung und sogar (gegen Godzillas Willen) Division.
Was ist bitte in einem?
Es gibt viele Möglichkeiten, eine Bytesequenz auszuwerten, aber wir verwenden einen Tokenizer, Parser und Evaluator:
<code> +-----------+ tokens +--------+ ast +-----------+ EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE +-----------+ +--------+ +-----------+</code>
Tokenizer
Auch als Lexer oder Scanner bekannt. Diese Klasse teilt die Zeichenfolge in kategorisierte Blöcke, sogenannte Token, auf.
class Tokenizer { public function tokenize(string $expression): Tokens { // ... } }
Zum Beispiel ergibt 1 2 3
fünf Token:
<code>Token(Integer, 1) Token(Plus) Token(Integer, 2) Token(Plus) Token(Integer, 3)</code>
Der Tokenizer scannt von links nach rechts und identifiziert interessante Blöcke: positive ganze Zahlen und die Operatoren , - und *. Leerzeichen werden ignoriert; andere Zeichen verursachen Fehler. Token-Typen sind Ganzzahl, Plus, Minus und Multiplizieren.
Godzilla
Godzilla schlägt einen Tokenizer und eine Stack-Maschine vor, aber wir werden einen Parser und einen Evaluator verwenden, weil Godzilla sich darum kümmert.Der Tokenizer überprüft die Gültigkeit des Ausdrucks nicht. es kategorisiert nur Chunks.6 Die Token werden an den Parser übergeben.
Parser
Der Parser interpretiert die Token und wandelt sie in einen Abstract Syntax Tree (AST) um.
<code> +-----------+ tokens +--------+ ast +-----------+ EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE +-----------+ +--------+ +-----------+</code>
Anhand einer Token-Liste gibt der Parser einen AST zurück – einen Wurzelknoten eines Baums. Jeder Knoten ist ein auswertbarer Ausdruck; Knotentypen sind BinaryOp und Integer.
Eine binäre Operation hat zwei Operanden (z. B. könnte
foo or bar
BinaryOp(Variable('foo'), 'or', Variable('bar'))
sein).Unäre Operationen haben einen Operanden (z. B.
-1
).Ternäre Operationen haben drei Operanden (z. B.
foo ? bar : baz
).
Der Ausdruck 1 1 / 5
ist ein BinaryOp mit
als Operator, wobei ein Operand 1 und der andere ein anderer BinaryOp (1 / 5
) ist.
class Tokenizer { public function tokenize(string $expression): Tokens { // ... } }
Gutachter
Der Evaluator akzeptiert einen Knoten und gibt einen Wert zurück (hier eine Ganzzahl). Es ist ein baumwandelnder Dolmetscher.
<code>Token(Integer, 1) Token(Plus) Token(Integer, 2) Token(Plus) Token(Integer, 3)</code>
Zeigen Sie mir bitte Ihren Code?
Dieser Code entstand bei einem PHPSW-Treffen, basierend auf Unit-Tests (hier weggelassen). Siehe das Repository.
Godzilla
Godzilla wäre über diesen Code verärgert und schlägt eine Umgestaltung vor.Tokenizer
Zuerst eine Token
-Klasse mit einer TokenType
-Aufzählung und einem optionalen Wert:
class Parser { public function parse(Tokens $tokens): Node { // ... } }
<code> +-------------+ | Binary Op + | <p>In PHP:</p> ```php $ast = new BinaryOp( left: new Integer(1), operator: '+', right: new BinaryOp( left: new Integer(1), operator: '/', right: new Integer(5), ) );</code>
Token sehen so aus:
class Evaluator { public function evaluate(Node $node): int { // ... } }
Die Tokenizer
Klasse erledigt die Arbeit:7
class Token { public function __construct( public TokenType $type, public ?string $value = null ) {} }
Die Tokens
Kollektion:
enum TokenType { case Plus; case Minus; case Multiply; case Integer; }
Godzilla
Godzilla bevorzugt ein Array und „array_shift“ oder einen Generator für die gleichzeitige Tokenisierung und Analyse.Parser
[ new Token(TokenType::Integer, 50), new Token(TokenType::Plus), // ... ]
Hier würden Operatorpriorität, Suffix-Parsing und Pipe-Operatoren hinzugefügt. Suffix-Parsing würde beispielsweise Ausdrücke wie „5 Meilen“ verarbeiten.
Gutachter
class Tokenizer { public function tokenize(string $expression): Tokens { $offset = 0; $tokens = []; while (isset($expression[$offset])) { $char = $expression[$offset++]; if (is_numeric($char)) { while (is_numeric($expression[$offset] ?? null)) { $char .= $expression[$offset++]; } $tokens[] = new Token(TokenType::Integer, $char); continue; } $token = match ($char) { '+' => new Token(TokenType::Plus), '-' => new Token(TokenType::Minus), '*' => new Token(TokenType::Multiply), ' ' => null, default => throw new RuntimeException(sprintf( 'Invalid operator: "%s"', $char )), }; if ($token === null) { continue; } $tokens[] = $token; } return new Tokens($tokens); } }
Das ist es
Dieser Code wurde live codiert, einschließlich Tests. Der vollständige Code ist im Repository verfügbar.
Bedienerpriorität
Der Ausdruck 1 * 3 4
sollte (1 * 3) 4 = 7
sein, aber unsere Sprache wertet ihn aufgrund der Parsing-Methode als 1 * (3 4) = 7
aus.8 Ein Pratt-Parser korrigiert dies:
<code> +-----------+ tokens +--------+ ast +-----------+ EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE +-----------+ +--------+ +-----------+</code>
Godzilla
Godzilla versteht Rekursion.Weiterführende Literatur
- Crafting Interpreters: Buch (mit kostenloser Web-Ausgabe) von Robert Nystrom
- Ausdrucksanalyse leicht gemacht: Blogbeitrag von Robert Nystrom
- Stack Machine RPN-Rechner: Beitrag 2014 von Igor Wiedler
- Doktrin Lexer
- PHPStan Phpdoc Parser9
- Der Code ändert sich mit jeder Iteration.
- Oder genauer gesagt, ein Ausdruckssprachendolmetscher.
- Wird in PHP oft als String bezeichnet.
- Domänenspezifische Sprache.
- Es existiert kein Patent.
- Ein Tokenizer ist nützlich für die Syntaxhervorhebung.
-
preg_
Methoden sind möglicherweise leistungsfähiger. - Nur falsch, wenn eine andere Antwort erwartet wurde.
- Tree Traversal wurde durch die Abfrageersteller von Doctrine entdeckt.
Das obige ist der detaillierte Inhalt vonDie einstündige Ausdruckssprache. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen











In PHP sollten die Funktionen für Passwort_Hash und passwart_verify verwendet werden, um sicheres Passwort -Hashing zu implementieren, und MD5 oder SHA1 sollte nicht verwendet werden. 1) Passwort_hash generiert einen Hash, der Salzwerte enthält, um die Sicherheit zu verbessern. 2) Passwort_Verify prüfen Sie das Passwort und sicherstellen Sie die Sicherheit, indem Sie die Hash -Werte vergleichen. 3) MD5 und SHA1 sind anfällig und fehlen Salzwerte und sind nicht für die Sicherheit der modernen Passwort geeignet.

PHP und Python haben jeweils ihre eigenen Vorteile und wählen nach den Projektanforderungen. 1.PHP ist für die Webentwicklung geeignet, insbesondere für die schnelle Entwicklung und Wartung von Websites. 2. Python eignet sich für Datenwissenschaft, maschinelles Lernen und künstliche Intelligenz mit prägnanter Syntax und für Anfänger.

PHP wird in E-Commerce, Content Management Systems und API-Entwicklung häufig verwendet. 1) E-Commerce: Wird für die Einkaufswagenfunktion und Zahlungsabwicklung verwendet. 2) Content -Management -System: Wird für die Erzeugung der dynamischen Inhalte und die Benutzerverwaltung verwendet. 3) API -Entwicklung: Wird für die erholsame API -Entwicklung und die API -Sicherheit verwendet. Durch Leistungsoptimierung und Best Practices werden die Effizienz und Wartbarkeit von PHP -Anwendungen verbessert.

PHP -Typ -Eingabeaufforderungen zur Verbesserung der Codequalität und der Lesbarkeit. 1) Tipps zum Skalartyp: Da Php7.0 in den Funktionsparametern wie int, float usw. angegeben werden dürfen. 3) Eingabeaufforderung für Gewerkschaftstyp: Da Php8.0 in Funktionsparametern oder Rückgabetypen angegeben werden dürfen. 4) Nullierstyp Eingabeaufforderung: Ermöglicht die Einbeziehung von Nullwerten und Handlungsfunktionen, die Nullwerte zurückgeben können.

PHP ist immer noch dynamisch und nimmt immer noch eine wichtige Position im Bereich der modernen Programmierung ein. 1) Einfachheit und leistungsstarke Unterstützung von PHP machen es in der Webentwicklung weit verbreitet. 2) Seine Flexibilität und Stabilität machen es ausstehend bei der Behandlung von Webformularen, Datenbankoperationen und Dateiverarbeitung; 3) PHP entwickelt sich ständig weiter und optimiert, geeignet für Anfänger und erfahrene Entwickler.

PHP ist hauptsächlich prozedurale Programmierung, unterstützt aber auch die objektorientierte Programmierung (OOP). Python unterstützt eine Vielzahl von Paradigmen, einschließlich OOP, funktionaler und prozeduraler Programmierung. PHP ist für die Webentwicklung geeignet, und Python eignet sich für eine Vielzahl von Anwendungen wie Datenanalyse und maschinelles Lernen.

PHP und Python haben ihre eigenen Vor- und Nachteile, und die Wahl hängt von den Projektbedürfnissen und persönlichen Vorlieben ab. 1.PHP eignet sich für eine schnelle Entwicklung und Wartung großer Webanwendungen. 2. Python dominiert das Gebiet der Datenwissenschaft und des maschinellen Lernens.

Die Verwendung von Vorverarbeitungsanweisungen und PDO in PHP kann SQL -Injektionsangriffe effektiv verhindern. 1) Verwenden Sie PDO, um eine Verbindung zur Datenbank herzustellen und den Fehlermodus festzulegen. 2) Erstellen Sie Vorverarbeitungsanweisungen über die Vorbereitungsmethode und übergeben Sie Daten mit Platzhaltern und führen Sie Methoden aus. 3) Abfrageergebnisse verarbeiten und die Sicherheit und Leistung des Codes sicherstellen.
