目录
ProCalc2000
请问,One 里有什么?
分词器
解析器
评估者
请显示您的代码?
就是这样
运算符优先级
延伸阅读
首页 后端开发 php教程 一小时表达语言

一小时表达语言

Jan 21, 2025 am 08:16 AM

The One Hour Expression Language

这篇博文最好以其原始格式查看。

这篇文章回顾了题为一小时表达语言的演示,回顾了概念和代码。1

表达式语言2,在此上下文中,计算表达式 - 字节序列,很可能是 UTF-8 字符。3 示例包括:

  • 1 1
  • //article[@title="foobar"]//image
  • .items[].foo|select(.bar = "foo")
  • a.comments > 1 and a.category not in ["misc"]

表达式语言(或 DSL4)的示例是:

  • JQ
  • Kibana 查询语言
  • XPath 语言
  • Symfony 表达语言

为什么要构建自己的表达语言? 为什么不呢? 太忙? 不用担心!它不需要几个月、几周甚至几天。 使用一小时表达语言在一小时内创建一个!5

ProCalc2000

我们将构建 ProCalc2000 表达式语言 - 2000 年及以后的下一代非科学算术计算器。

它评估诸如 1 11 2 之类的表达式,并且可以处理诸如 1 3 2 / 2.

之类的除法问题
哥斯拉 由于浮点数,哥斯拉不喜欢除法。

该语言包含数字(例如 1、2)和运算符(、-、)。 它不会*支持运算符优先级(参见附录一)或除法。

尽管它很简单,但它为添加功能提供了基础:变量、函数、管道运算符、后缀、字符串连接,甚至(违背哥斯拉的意愿)除法。

请问,One 里有什么?

评估字节序列的方法有很多,但我们将使用分词器、解析器和评估器:

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
登录后复制
登录后复制
登录后复制

分词器

也称为词法分析器或扫描器。此类将字符串拆分为称为标记的分类块。

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
登录后复制
登录后复制

例如,1 2 3 产生五个标记:

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
登录后复制
登录后复制

分词器从左到右扫描,识别有趣的块:正整数以及 、 - 和 * 运算符。空白被忽略;其他字符会导致错误。 令牌类型有整数、加号、减号和乘号。

哥斯拉 哥斯拉建议使用分词器和堆栈机,但我们将使用解析器和评估器,因为哥斯拉关心。

分词器不检查表达式的有效性;它仅对块进行分类。6 标记将传递给解析器。

解析器

解析器解释标记,将它们转换为抽象语法树(AST)。

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
登录后复制
登录后复制
登录后复制

给定一个标记列表,解析器返回一个 AST——树的根节点。 每个节点都是一个可评估的表达式;节点类型有 BinaryOp 和 Integer。

二元运算有两个操作数(例如,foo or bar 可以是 BinaryOp(Variable('foo'), 'or', Variable('bar')))。

一元运算有一个操作数(例如,-1)。

三元运算有三个操作数(例如,foo ? bar : baz)。

表达式1 1 / 5是一个以 为运算符的BinaryOp,一个操作数为1,另一个为另一个BinaryOp(1 / 5)。

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
登录后复制
登录后复制

评估者

求值器接受一个 Node 并返回一个值(这里是一个整数)。 这是一个树行走翻译器。

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
登录后复制
登录后复制

请显示您的代码?

此代码源自 PHPSW 聚会,由单元测试驱动(此处省略)。查看存储库。

哥斯拉 哥斯拉会对这段代码感到愤怒并建议重构。

分词器

首先,一个带有 Token 枚举和可选值的 TokenType 类:

class Parser
{
    public function parse(Tokens $tokens): Node
    {
        // ...
    }
}
登录后复制
<code>                        +-------------+
                        | Binary Op + | 



<p>In PHP:</p>

```php
$ast = new BinaryOp(
    left:     new Integer(1),
    operator: '+',
    right:    new BinaryOp(
        left:     new Integer(1),
        operator: '/',
        right:    new Integer(5),
    )
);</code>
登录后复制

令牌看起来像:

class Evaluator
{
    public function evaluate(Node $node): int
    {
        // ...
    }
}
登录后复制

Tokenizer 类完成以下工作:7

class Token
{
    public function __construct(
        public TokenType $type,
        public ?string $value = null
    ) {}
}
登录后复制

Tokens系列:

enum TokenType
{
    case Plus;
    case Minus;
    case Multiply;
    case Integer;
}
登录后复制
哥斯拉 Godzilla 更喜欢使用数组和 array_shift 或生成器来同时进行标记化和解析。

解析器

[
    new Token(TokenType::Integer, 50),
    new Token(TokenType::Plus),
    // ...
]
登录后复制

这是添加运算符优先级、后缀解析和管道运算符的地方。 例如,后缀解析可以处理“5 英里”这样的表达式。

评估者

class Tokenizer
{
    public function tokenize(string $expression): Tokens 
    {
        $offset = 0;
        $tokens = [];
        while (isset($expression[$offset])) {
            $char = $expression[$offset++];
            if (is_numeric($char)) {
                while (is_numeric($expression[$offset] ?? null)) {
                    $char .= $expression[$offset++];
                }
                $tokens[] = new Token(TokenType::Integer, $char);
                continue;
            }
            $token = match ($char) {
                '+' => new Token(TokenType::Plus),
                '-' => new Token(TokenType::Minus),
                '*' => new Token(TokenType::Multiply),
                ' ' => null,
                default => throw new RuntimeException(sprintf(
                    'Invalid operator: "%s"', $char
                )),
            };
            if ($token === null) {
                continue;
            }
            $tokens[] = $token;
        }
        return new Tokens($tokens);
    }
}
登录后复制

就是这样

此代码是实时编码的,包括测试。 完整的代码可以在存储库中找到。

运算符优先级

表达式 1 * 3 4 应该是 (1 * 3) 4 = 7,但由于解析方法,我们的语言将其计算为 1 * (3 4) = 78 Pratt 解析器纠正了这一点:

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
登录后复制
登录后复制
登录后复制
哥斯拉 哥斯拉了解递归。

延伸阅读

  • 制作口译员:罗伯特·尼斯特罗姆 (Robert Nystrom) 所著的书籍(免费网络版)
  • 表达式解析变得简单:Robert Nystrom 的博客文章
  • 堆栈机 RPN 计算器:2014 年 Igor Wiedler 发表
  • 学说词法分析器
  • PHPStan Phpdoc 解析器9

  1. 代码随着每次迭代而变化。
  2. 或更具体地说,是一个表达式语言解释器。
  3. 在 PHP 中通常称为字符串。
  4. 领域特定语言。
  5. 不存在专利。
  6. 分词器对于语法突出显示很有用。
  7. preg_方法可能会更高效。
  8. 只有在期望不同的答案时才是错误的。
  9. 树遍历是通过 Doctrine 的查询构建器发现的。

以上是一小时表达语言的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1667
14
CakePHP 教程
1426
52
Laravel 教程
1328
25
PHP教程
1273
29
C# 教程
1255
24
说明PHP中的安全密码散列(例如,password_hash,password_verify)。为什么不使用MD5或SHA1? 说明PHP中的安全密码散列(例如,password_hash,password_verify)。为什么不使用MD5或SHA1? Apr 17, 2025 am 12:06 AM

在PHP中,应使用password_hash和password_verify函数实现安全的密码哈希处理,不应使用MD5或SHA1。1)password_hash生成包含盐值的哈希,增强安全性。2)password_verify验证密码,通过比较哈希值确保安全。3)MD5和SHA1易受攻击且缺乏盐值,不适合现代密码安全。

PHP:网络开发的关键语言 PHP:网络开发的关键语言 Apr 13, 2025 am 12:08 AM

PHP是一种广泛应用于服务器端的脚本语言,特别适合web开发。1.PHP可以嵌入HTML,处理HTTP请求和响应,支持多种数据库。2.PHP用于生成动态网页内容,处理表单数据,访问数据库等,具有强大的社区支持和开源资源。3.PHP是解释型语言,执行过程包括词法分析、语法分析、编译和执行。4.PHP可以与MySQL结合用于用户注册系统等高级应用。5.调试PHP时,可使用error_reporting()和var_dump()等函数。6.优化PHP代码可通过缓存机制、优化数据库查询和使用内置函数。7

PHP和Python:比较两种流行的编程语言 PHP和Python:比较两种流行的编程语言 Apr 14, 2025 am 12:13 AM

PHP和Python各有优势,选择依据项目需求。1.PHP适合web开发,尤其快速开发和维护网站。2.Python适用于数据科学、机器学习和人工智能,语法简洁,适合初学者。

PHP行动:现实世界中的示例和应用程序 PHP行动:现实世界中的示例和应用程序 Apr 14, 2025 am 12:19 AM

PHP在电子商务、内容管理系统和API开发中广泛应用。1)电子商务:用于购物车功能和支付处理。2)内容管理系统:用于动态内容生成和用户管理。3)API开发:用于RESTfulAPI开发和API安全性。通过性能优化和最佳实践,PHP应用的效率和可维护性得以提升。

PHP类型提示如何起作用,包括标量类型,返回类型,联合类型和无效类型? PHP类型提示如何起作用,包括标量类型,返回类型,联合类型和无效类型? Apr 17, 2025 am 12:25 AM

PHP类型提示提升代码质量和可读性。1)标量类型提示:自PHP7.0起,允许在函数参数中指定基本数据类型,如int、float等。2)返回类型提示:确保函数返回值类型的一致性。3)联合类型提示:自PHP8.0起,允许在函数参数或返回值中指定多个类型。4)可空类型提示:允许包含null值,处理可能返回空值的函数。

PHP的持久相关性:它还活着吗? PHP的持久相关性:它还活着吗? Apr 14, 2025 am 12:12 AM

PHP仍然具有活力,其在现代编程领域中依然占据重要地位。1)PHP的简单易学和强大社区支持使其在Web开发中广泛应用;2)其灵活性和稳定性使其在处理Web表单、数据库操作和文件处理等方面表现出色;3)PHP不断进化和优化,适用于初学者和经验丰富的开发者。

PHP与其他语言:比较 PHP与其他语言:比较 Apr 13, 2025 am 12:19 AM

PHP适合web开发,特别是在快速开发和处理动态内容方面表现出色,但不擅长数据科学和企业级应用。与Python相比,PHP在web开发中更具优势,但在数据科学领域不如Python;与Java相比,PHP在企业级应用中表现较差,但在web开发中更灵活;与JavaScript相比,PHP在后端开发中更简洁,但在前端开发中不如JavaScript。

PHP和Python:解释了不同的范例 PHP和Python:解释了不同的范例 Apr 18, 2025 am 12:26 AM

PHP主要是过程式编程,但也支持面向对象编程(OOP);Python支持多种范式,包括OOP、函数式和过程式编程。PHP适合web开发,Python适用于多种应用,如数据分析和机器学习。

See all articles