Inhaltsverzeichnis
ProCalc2000
Was ist bitte in einem?
Tokenizer
Parser
Gutachter
Zeigen Sie mir bitte Ihren Code?
Das ist es
Bedienerpriorität
Weiterführende Literatur
Heim Backend-Entwicklung PHP-Tutorial Die einstündige Ausdruckssprache

Die einstündige Ausdruckssprache

Jan 21, 2025 am 08:16 AM

The One Hour Expression Language

Dieser Blogbeitrag lässt sich am besten im Originalformat ansehen.

Dieser Beitrag fasst eine Präsentation mit dem Titel The One Hour Expression Language zusammen, in der sowohl die Konzepte als auch der Code besprochen werden.1

Eine Ausdruckssprache2 wertet in diesem Zusammenhang einen Ausdruck aus – eine Folge von Bytes, höchstwahrscheinlich UTF-8-Zeichen.3 Beispiele sind:

  • 1 1
  • //article[@title="foobar"]//image
  • .items[].foo|select(.bar = "foo")
  • a.comments > 1 and a.category not in ["misc"]

Beispiele für Ausdruckssprachen (oder DSLs4) sind:

  • JQ
  • Kibana-Abfragesprache
  • XPath-Sprache
  • Symfony Expression Language

Warum eine eigene Ausdruckssprache aufbauen? Warum nicht? Zu beschäftigt? Mach dir keine Sorge! Es sind keine Monate, Wochen oder gar Tage erforderlich. Erstellen Sie eines in einer Stunde mit der One Hour Expression Language!5

ProCalc2000

Wir werden die Ausdruckssprache ProCalc2000 entwickeln – einen nichtwissenschaftlichen Rechenrechner der nächsten Generation für das Jahr 2000 und darüber hinaus.

Es wertet Ausdrücke wie 1 1 oder 1 2 aus und kann Divisionsprobleme wie 1 3 2 / 2 verarbeiten.

Godzilla Godzilla mag Divisionen aufgrund von Gleitkommazahlen nicht.

Die Sprache besteht aus Zahlen (z. B. 1, 2) und Operatoren ( , -, ). Es wird keine Operatorpriorität (siehe Anhang I) oder Division unterstützen.

Trotz seiner Einfachheit bietet es eine Grundlage für das Hinzufügen von Funktionen: Variablen, Funktionen, Pipe-Operatoren, Suffixe, String-Verkettung und sogar (gegen Godzillas Willen) Division.

Was ist bitte in einem?

Es gibt viele Möglichkeiten, eine Bytesequenz auszuwerten, aber wir verwenden einen Tokenizer, Parser und Evaluator:

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Tokenizer

Auch als Lexer oder Scanner bekannt. Diese Klasse teilt die Zeichenfolge in kategorisierte Blöcke, sogenannte Token, auf.

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
Nach dem Login kopieren
Nach dem Login kopieren

Zum Beispiel ergibt 1 2 3 fünf Token:

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
Nach dem Login kopieren
Nach dem Login kopieren

Der Tokenizer scannt von links nach rechts und identifiziert interessante Blöcke: positive ganze Zahlen und die Operatoren , - und *. Leerzeichen werden ignoriert; andere Zeichen verursachen Fehler. Token-Typen sind Ganzzahl, Plus, Minus und Multiplizieren.

Godzilla Godzilla schlägt einen Tokenizer und eine Stack-Maschine vor, aber wir werden einen Parser und einen Evaluator verwenden, weil Godzilla sich darum kümmert.

Der Tokenizer überprüft die Gültigkeit des Ausdrucks nicht. es kategorisiert nur Chunks.6 Die Token werden an den Parser übergeben.

Parser

Der Parser interpretiert die Token und wandelt sie in einen Abstract Syntax Tree (AST) um.

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Anhand einer Token-Liste gibt der Parser einen AST zurück – einen Wurzelknoten eines Baums. Jeder Knoten ist ein auswertbarer Ausdruck; Knotentypen sind BinaryOp und Integer.

Eine binäre Operation hat zwei Operanden (z. B. könnte foo or bar BinaryOp(Variable('foo'), 'or', Variable('bar')) sein).

Unäre Operationen haben einen Operanden (z. B. -1).

Ternäre Operationen haben drei Operanden (z. B. foo ? bar : baz).

Der Ausdruck 1 1 / 5 ist ein BinaryOp mit als Operator, wobei ein Operand 1 und der andere ein anderer BinaryOp (1 / 5) ist.

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
Nach dem Login kopieren
Nach dem Login kopieren

Gutachter

Der Evaluator akzeptiert einen Knoten und gibt einen Wert zurück (hier eine Ganzzahl). Es ist ein baumwandelnder Dolmetscher.

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
Nach dem Login kopieren
Nach dem Login kopieren

Zeigen Sie mir bitte Ihren Code?

Dieser Code entstand bei einem PHPSW-Treffen, basierend auf Unit-Tests (hier weggelassen). Siehe das Repository.

Godzilla Godzilla wäre über diesen Code verärgert und schlägt eine Umgestaltung vor.

Tokenizer

Zuerst eine Token-Klasse mit einer TokenType-Aufzählung und einem optionalen Wert:

class Parser
{
    public function parse(Tokens $tokens): Node
    {
        // ...
    }
}
Nach dem Login kopieren
<code>                        +-------------+
                        | Binary Op + | 



<p>In PHP:</p>

```php
$ast = new BinaryOp(
    left:     new Integer(1),
    operator: '+',
    right:    new BinaryOp(
        left:     new Integer(1),
        operator: '/',
        right:    new Integer(5),
    )
);</code>
Nach dem Login kopieren

Token sehen so aus:

class Evaluator
{
    public function evaluate(Node $node): int
    {
        // ...
    }
}
Nach dem Login kopieren

Die Tokenizer Klasse erledigt die Arbeit:7

class Token
{
    public function __construct(
        public TokenType $type,
        public ?string $value = null
    ) {}
}
Nach dem Login kopieren

Die Tokens Kollektion:

enum TokenType
{
    case Plus;
    case Minus;
    case Multiply;
    case Integer;
}
Nach dem Login kopieren
Godzilla Godzilla bevorzugt ein Array und „array_shift“ oder einen Generator für die gleichzeitige Tokenisierung und Analyse.

Parser

[
    new Token(TokenType::Integer, 50),
    new Token(TokenType::Plus),
    // ...
]
Nach dem Login kopieren

Hier würden Operatorpriorität, Suffix-Parsing und Pipe-Operatoren hinzugefügt. Suffix-Parsing würde beispielsweise Ausdrücke wie „5 Meilen“ verarbeiten.

Gutachter

class Tokenizer
{
    public function tokenize(string $expression): Tokens 
    {
        $offset = 0;
        $tokens = [];
        while (isset($expression[$offset])) {
            $char = $expression[$offset++];
            if (is_numeric($char)) {
                while (is_numeric($expression[$offset] ?? null)) {
                    $char .= $expression[$offset++];
                }
                $tokens[] = new Token(TokenType::Integer, $char);
                continue;
            }
            $token = match ($char) {
                '+' => new Token(TokenType::Plus),
                '-' => new Token(TokenType::Minus),
                '*' => new Token(TokenType::Multiply),
                ' ' => null,
                default => throw new RuntimeException(sprintf(
                    'Invalid operator: "%s"', $char
                )),
            };
            if ($token === null) {
                continue;
            }
            $tokens[] = $token;
        }
        return new Tokens($tokens);
    }
}
Nach dem Login kopieren

Das ist es

Dieser Code wurde live codiert, einschließlich Tests. Der vollständige Code ist im Repository verfügbar.

Bedienerpriorität

Der Ausdruck 1 * 3 4 sollte (1 * 3) 4 = 7 sein, aber unsere Sprache wertet ihn aufgrund der Parsing-Methode als 1 * (3 4) = 7 aus.8 Ein Pratt-Parser korrigiert dies:

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Godzilla Godzilla versteht Rekursion.

Weiterführende Literatur

  • Crafting Interpreters: Buch (mit kostenloser Web-Ausgabe) von Robert Nystrom
  • Ausdrucksanalyse leicht gemacht: Blogbeitrag von Robert Nystrom
  • Stack Machine RPN-Rechner: Beitrag 2014 von Igor Wiedler
  • Doktrin Lexer
  • PHPStan Phpdoc Parser9

  1. Der Code ändert sich mit jeder Iteration.
  2. Oder genauer gesagt, ein Ausdruckssprachendolmetscher.
  3. Wird in PHP oft als String bezeichnet.
  4. Domänenspezifische Sprache.
  5. Es existiert kein Patent.
  6. Ein Tokenizer ist nützlich für die Syntaxhervorhebung.
  7. preg_Methoden sind möglicherweise leistungsfähiger.
  8. Nur ​​falsch, wenn eine andere Antwort erwartet wurde.
  9. Tree Traversal wurde durch die Abfrageersteller von Doctrine entdeckt.

Das obige ist der detaillierte Inhalt vonDie einstündige Ausdruckssprache. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Crossplay haben?
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Erklären Sie JSON Web Tokens (JWT) und ihren Anwendungsfall in PHP -APIs. Erklären Sie JSON Web Tokens (JWT) und ihren Anwendungsfall in PHP -APIs. Apr 05, 2025 am 12:04 AM

JWT ist ein offener Standard, der auf JSON basiert und zur sicheren Übertragung von Informationen zwischen Parteien verwendet wird, hauptsächlich für die Identitätsauthentifizierung und den Informationsaustausch. 1. JWT besteht aus drei Teilen: Header, Nutzlast und Signatur. 2. Das Arbeitsprinzip von JWT enthält drei Schritte: Generierung von JWT, Überprüfung von JWT und Parsingnayload. 3. Bei Verwendung von JWT zur Authentifizierung in PHP kann JWT generiert und überprüft werden, und die Funktionen und Berechtigungsinformationen der Benutzer können in die erweiterte Verwendung aufgenommen werden. 4. Häufige Fehler sind Signaturüberprüfungsfehler, Token -Ablauf und übergroße Nutzlast. Zu Debugging -Fähigkeiten gehört die Verwendung von Debugging -Tools und Protokollierung. 5. Leistungsoptimierung und Best Practices umfassen die Verwendung geeigneter Signaturalgorithmen, das Einstellen von Gültigkeitsperioden angemessen.

Beschreiben Sie die soliden Prinzipien und wie sie sich für die PHP -Entwicklung anwenden. Beschreiben Sie die soliden Prinzipien und wie sie sich für die PHP -Entwicklung anwenden. Apr 03, 2025 am 12:04 AM

Die Anwendung des soliden Prinzips in der PHP -Entwicklung umfasst: 1. Prinzip der Einzelverantwortung (SRP): Jede Klasse ist nur für eine Funktion verantwortlich. 2. Open and Close Principle (OCP): Änderungen werden eher durch Erweiterung als durch Modifikation erreicht. 3.. Lischs Substitutionsprinzip (LSP): Unterklassen können Basisklassen ersetzen, ohne die Programmgenauigkeit zu beeinträchtigen. 4. Schnittstellen-Isolationsprinzip (ISP): Verwenden Sie feinkörnige Schnittstellen, um Abhängigkeiten und nicht verwendete Methoden zu vermeiden. 5. Abhängigkeitsinversionsprinzip (DIP): Hoch- und niedrige Module beruhen auf der Abstraktion und werden durch Abhängigkeitsinjektion implementiert.

Erklären Sie das Konzept der späten statischen Bindung in PHP. Erklären Sie das Konzept der späten statischen Bindung in PHP. Mar 21, 2025 pm 01:33 PM

In Artikel wird die in PHP 5.3 eingeführte LSB -Bindung (LSB) erörtert, die die Laufzeitauflösung der statischen Methode ermöglicht, um eine flexiblere Vererbung zu erfordern. Die praktischen Anwendungen und potenziellen Perfo von LSB

Wie sende ich eine Postanforderung mit JSON -Daten mithilfe der Curl -Bibliothek von PHP? Wie sende ich eine Postanforderung mit JSON -Daten mithilfe der Curl -Bibliothek von PHP? Apr 01, 2025 pm 03:12 PM

Senden von JSON -Daten mithilfe der Curl -Bibliothek von PHP in der PHP -Entwicklung müssen häufig mit externen APIs interagieren. Eine der gängigen Möglichkeiten besteht darin, die Curl Library zu verwenden, um Post � ...

Rahmensicherheitsmerkmale: Schutz vor Schwachstellen. Rahmensicherheitsmerkmale: Schutz vor Schwachstellen. Mar 28, 2025 pm 05:11 PM

In Artikel werden wichtige Sicherheitsfunktionen in Frameworks erörtert, um vor Schwachstellen zu schützen, einschließlich Eingabevalidierung, Authentifizierung und regelmäßigen Aktualisierungen.

Wie setze ich nach dem Neustart des Systems automatisch Berechtigungen von Unixsocket fest? Wie setze ich nach dem Neustart des Systems automatisch Berechtigungen von Unixsocket fest? Mar 31, 2025 pm 11:54 PM

So setzen Sie die Berechtigungen von Unixsocket automatisch nach dem Neustart des Systems. Jedes Mal, wenn das System neu startet, müssen wir den folgenden Befehl ausführen, um die Berechtigungen von Unixsocket: sudo ...

Anpassung/Erweiterung von Frameworks: So fügen Sie benutzerdefinierte Funktionen hinzu. Anpassung/Erweiterung von Frameworks: So fügen Sie benutzerdefinierte Funktionen hinzu. Mar 28, 2025 pm 05:12 PM

In dem Artikel werden Frameworks hinzugefügt, das sich auf das Verständnis der Architektur, das Identifizieren von Erweiterungspunkten und Best Practices für die Integration und Debuggierung hinzufügen.

See all articles