목차
ProCalc2000
One에는 무엇이 들어있나요?
토크나이저
파서
평가자
코드를 보여주세요
바로 그거예요
연산자 우선순위
추가 자료
백엔드 개발 PHP 튜토리얼 한 시간 표현 언어

한 시간 표현 언어

Jan 21, 2025 am 08:16 AM

The One Hour Expression Language

이 블로그 게시물은 원본 형식으로 보는 것이 가장 좋습니다.

이 게시물은 1시간 표현 언어라는 제목의 프레젠테이션을 요약하여 개념과 코드를 모두 검토했습니다.1

표현식 언어2는 이 맥락에서 표현식(대부분 UTF-8 문자인 바이트 시퀀스)을 평가합니다.3 예는 다음과 같습니다.

  • 1 1
  • //article[@title="foobar"]//image
  • .items[].foo|select(.bar = "foo")
  • a.comments > 1 and a.category not in ["misc"]

표현 언어(또는 DSL4)의 예는 다음과 같습니다.

  • JQ
  • Kibana 쿼리 언어
  • XPath 언어
  • 심포니 표현 언어

자신만의 표현 언어를 만드는 이유는 무엇인가요? 왜 안 돼? 너무 바쁘나요? 괜찮아요! 몇 달, 몇 주, 심지어 며칠이 필요하지 않습니다. 1시간 표현언어로 한 시간에 하나씩 만들어보세요!5

ProCalc2000

우리는 2000년 이후를 위한 차세대 비과학적 산술 계산기인 ProCalc2000 표현식 언어를 구축할 것입니다.

1 1, 1 2 등의 표현식을 평가하고 1 3 2 / 2 등의 분할 문제를 처리할 수 있습니다.

고질라 Godzilla는 부동 소수점 숫자로 인한 나누기를 싫어합니다.

언어는 숫자(예: 1, 2)와 연산자( , -, )로 구성됩니다. 연산자 우선순위(부록 I 참조)나 나누기를 지원하지 않습니다*.

간단함에도 불구하고 변수, 함수, 파이프 연산자, 접미사, 문자열 연결, 심지어 (Godzilla의 희망에 반하여) 나누기 등의 기능을 추가하기 위한 기반을 제공합니다.

One에는 무엇이 들어있나요?

바이트 시퀀스를 평가하는 방법은 여러 가지가 있지만 여기서는 토크나이저, 파서 및 평가기를 사용하겠습니다.

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
로그인 후 복사
로그인 후 복사
로그인 후 복사

토크나이저

렉서 또는 스캐너라고도 합니다. 이 클래스는 문자열을 토큰이라는 분류된 덩어리로 나눕니다.

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
로그인 후 복사
로그인 후 복사

예를 들어 1 2 3는 5개의 토큰을 생성합니다.

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
로그인 후 복사
로그인 후 복사

토큰나이저는 왼쪽에서 오른쪽으로 스캔하여 양의 정수와 , - 및 * 연산자와 같은 흥미로운 덩어리를 식별합니다. 공백은 무시됩니다. 다른 문자는 오류를 발생시킵니다. 토큰 유형은 정수, 더하기, 빼기, 곱하기입니다.

고질라 Godzilla는 토크나이저와 스택 머신을 제안하지만 Godzilla가 관심을 갖고 있기 때문에 파서와 평가기를 사용하겠습니다.

토큰나이저는 표현식의 유효성을 확인하지 않습니다. 청크만 분류합니다.6 토큰이 파서에 전달됩니다.

파서

파서는 토큰을 해석하여 AST(추상 구문 트리)로 변환합니다.

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
로그인 후 복사
로그인 후 복사
로그인 후 복사

토큰 목록이 주어지면 파서는 트리의 루트 노드인 AST를 반환합니다. 각 노드는 평가 가능한 표현식입니다. 노드 유형은 BinaryOp 및 Integer입니다.

이진 연산에는 두 개의 피연산자가 있습니다(예: foo or barBinaryOp(Variable('foo'), 'or', Variable('bar'))일 수 있음).

단항 연산에는 피연산자가 하나 있습니다(예: -1).

삼항 연산에는 세 개의 피연산자가 있습니다(예: foo ? bar : baz).

1 1 / 5 표현식은 연산자를 사용하는 BinaryOp입니다. 피연산자 중 하나는 1이고 다른 하나는 또 다른 BinaryOp(1 / 5)입니다.

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
로그인 후 복사
로그인 후 복사

평가자

평가자는 노드를 승인하고 값(여기서는 정수)을 반환합니다. 나무걷기통역사입니다.

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
로그인 후 복사
로그인 후 복사

코드를 보여주세요

이 코드는 단위 테스트(여기서는 생략됨)에 의해 진행된 PHPSW 모임에서 시작되었습니다. 저장소를 확인하세요.

고질라 Godzilla는 이 코드에 화를 내며 리팩토링을 제안합니다.

토크나이저

첫 번째, Token 열거형과 선택적 값이 있는 TokenType 클래스:

class Parser
{
    public function parse(Tokens $tokens): Node
    {
        // ...
    }
}
로그인 후 복사
<code>                        +-------------+
                        | Binary Op + | 



<p>In PHP:</p>

```php
$ast = new BinaryOp(
    left:     new Integer(1),
    operator: '+',
    right:    new BinaryOp(
        left:     new Integer(1),
        operator: '/',
        right:    new Integer(5),
    )
);</code>
로그인 후 복사

토큰은 다음과 같습니다.

class Evaluator
{
    public function evaluate(Node $node): int
    {
        // ...
    }
}
로그인 후 복사

Tokenizer 클래스가 작업을 수행합니다.7

class Token
{
    public function __construct(
        public TokenType $type,
        public ?string $value = null
    ) {}
}
로그인 후 복사

Tokens 컬렉션:

enum TokenType
{
    case Plus;
    case Minus;
    case Multiply;
    case Integer;
}
로그인 후 복사
고질라 Godzilla는 토큰화와 구문 분석을 동시에 수행하기 위해 배열과 'array_shift' 또는 생성기를 선호합니다.

파서

[
    new Token(TokenType::Integer, 50),
    new Token(TokenType::Plus),
    // ...
]
로그인 후 복사

여기서 연산자 우선 순위, 접미사 구문 분석 및 파이프 연산자가 추가됩니다. 예를 들어 접미사 구문 분석은 "5마일"과 같은 표현을 처리합니다.

평가자

class Tokenizer
{
    public function tokenize(string $expression): Tokens 
    {
        $offset = 0;
        $tokens = [];
        while (isset($expression[$offset])) {
            $char = $expression[$offset++];
            if (is_numeric($char)) {
                while (is_numeric($expression[$offset] ?? null)) {
                    $char .= $expression[$offset++];
                }
                $tokens[] = new Token(TokenType::Integer, $char);
                continue;
            }
            $token = match ($char) {
                '+' => new Token(TokenType::Plus),
                '-' => new Token(TokenType::Minus),
                '*' => new Token(TokenType::Multiply),
                ' ' => null,
                default => throw new RuntimeException(sprintf(
                    'Invalid operator: "%s"', $char
                )),
            };
            if ($token === null) {
                continue;
            }
            $tokens[] = $token;
        }
        return new Tokens($tokens);
    }
}
로그인 후 복사

바로 그거예요

이 코드는 테스트를 포함하여 라이브 코딩되었습니다. 전체 코드는 저장소에서 확인할 수 있습니다.

연산자 우선순위

1 * 3 4 표현식은 (1 * 3) 4 = 7이어야 하지만, 구문 분석 방법으로 인해 우리 언어에서는 이를 1 * (3 4) = 7으로 평가합니다.8 Pratt 파서가 이를 수정합니다.

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
로그인 후 복사
로그인 후 복사
로그인 후 복사
고질라 Godzilla는 재귀를 이해합니다.

추가 자료

  • 통역사 만들기: Robert Nystrom의 책(무료 웹 버전 포함)
  • 손쉬운 표현식 구문 분석: Robert Nystrom의 블로그 게시물
  • 스택 머신 RPN 계산기: 2014 Igor Wiedler 게시
  • 교리 렉서
  • PHPstan Phpdoc 파서9

  1. 코드는 반복될 때마다 변경됩니다.
  2. 더 구체적으로 말하면 표현 언어 해석기입니다.
  3. PHP에서는 문자열을 자주 호출합니다.
  4. 도메인별 언어.
  5. 특허가 없습니다.
  6. 토큰나이저는 구문 강조에 유용합니다.
  7. preg_ 방법이 더 효율적일 수 있습니다.
  8. 다른 답변이 예상되는 경우에만 틀린 답변입니다.
  9. Doctrine의 쿼리 빌더를 통해 트리 순회가 발견되었습니다.

위 내용은 한 시간 표현 언어의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

<gum> : Bubble Gum Simulator Infinity- 로얄 키를 얻고 사용하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Nordhold : Fusion System, 설명
4 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora : 마녀 트리의 속삭임 - Grappling Hook 잠금 해제 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

PHP에서 보안 비밀번호 해싱을 설명하십시오 (예 : Password_hash, Password_Verify). 왜 MD5 또는 SHA1을 사용하지 않습니까? PHP에서 보안 비밀번호 해싱을 설명하십시오 (예 : Password_hash, Password_Verify). 왜 MD5 또는 SHA1을 사용하지 않습니까? Apr 17, 2025 am 12:06 AM

PHP에서 Password_hash 및 Password_Verify 기능을 사용하여 보안 비밀번호 해싱을 구현해야하며 MD5 또는 SHA1을 사용해서는 안됩니다. 1) Password_hash는 보안을 향상시키기 위해 소금 값이 포함 된 해시를 생성합니다. 2) Password_verify 암호를 확인하고 해시 값을 비교하여 보안을 보장합니다. 3) MD5 및 SHA1은 취약하고 소금 값이 부족하며 현대 암호 보안에는 적합하지 않습니다.

PHP 및 Python : 두 가지 인기있는 프로그래밍 언어를 비교합니다 PHP 및 Python : 두 가지 인기있는 프로그래밍 언어를 비교합니다 Apr 14, 2025 am 12:13 AM

PHP와 Python은 각각 고유 한 장점이 있으며 프로젝트 요구 사항에 따라 선택합니다. 1.PHP는 웹 개발, 특히 웹 사이트의 빠른 개발 및 유지 보수에 적합합니다. 2. Python은 간결한 구문을 가진 데이터 과학, 기계 학습 및 인공 지능에 적합하며 초보자에게 적합합니다.

PHP 실행 : 실제 예제 및 응용 프로그램 PHP 실행 : 실제 예제 및 응용 프로그램 Apr 14, 2025 am 12:19 AM

PHP는 전자 상거래, 컨텐츠 관리 시스템 및 API 개발에 널리 사용됩니다. 1) 전자 상거래 : 쇼핑 카트 기능 및 지불 처리에 사용됩니다. 2) 컨텐츠 관리 시스템 : 동적 컨텐츠 생성 및 사용자 관리에 사용됩니다. 3) API 개발 : 편안한 API 개발 및 API 보안에 사용됩니다. 성능 최적화 및 모범 사례를 통해 PHP 애플리케이션의 효율성과 유지 보수 성이 향상됩니다.

스칼라 유형, 반환 유형, 노조 유형 및 무효 유형을 포함한 PHP 유형의 힌트 작업은 어떻게 작동합니까? 스칼라 유형, 반환 유형, 노조 유형 및 무효 유형을 포함한 PHP 유형의 힌트 작업은 어떻게 작동합니까? Apr 17, 2025 am 12:25 AM

PHP 유형은 코드 품질과 가독성을 향상시키기위한 프롬프트입니다. 1) 스칼라 유형 팁 : PHP7.0이므로 int, float 등과 같은 기능 매개 변수에 기본 데이터 유형을 지정할 수 있습니다. 2) 반환 유형 프롬프트 : 기능 반환 값 유형의 일관성을 확인하십시오. 3) Union 유형 프롬프트 : PHP8.0이므로 기능 매개 변수 또는 반환 값에 여러 유형을 지정할 수 있습니다. 4) Nullable 유형 프롬프트 : NULL 값을 포함하고 널 값을 반환 할 수있는 기능을 포함 할 수 있습니다.

PHP의 지속적인 관련성 : 여전히 살아 있습니까? PHP의 지속적인 관련성 : 여전히 살아 있습니까? Apr 14, 2025 am 12:12 AM

PHP는 여전히 역동적이며 현대 프로그래밍 분야에서 여전히 중요한 위치를 차지하고 있습니다. 1) PHP의 단순성과 강력한 커뮤니티 지원으로 인해 웹 개발에 널리 사용됩니다. 2) 유연성과 안정성은 웹 양식, 데이터베이스 작업 및 파일 처리를 처리하는 데 탁월합니다. 3) PHP는 지속적으로 발전하고 최적화하며 초보자 및 숙련 된 개발자에게 적합합니다.

PHP와 Python : 다른 패러다임이 설명되었습니다 PHP와 Python : 다른 패러다임이 설명되었습니다 Apr 18, 2025 am 12:26 AM

PHP는 주로 절차 적 프로그래밍이지만 객체 지향 프로그래밍 (OOP)도 지원합니다. Python은 OOP, 기능 및 절차 프로그래밍을 포함한 다양한 패러다임을 지원합니다. PHP는 웹 개발에 적합하며 Python은 데이터 분석 및 기계 학습과 같은 다양한 응용 프로그램에 적합합니다.

PHP 및 Python : 코드 예제 및 비교 PHP 및 Python : 코드 예제 및 비교 Apr 15, 2025 am 12:07 AM

PHP와 Python은 고유 한 장점과 단점이 있으며 선택은 프로젝트 요구와 개인 선호도에 달려 있습니다. 1.PHP는 대규모 웹 애플리케이션의 빠른 개발 및 유지 보수에 적합합니다. 2. Python은 데이터 과학 및 기계 학습 분야를 지배합니다.

PHP에서 SQL 주입을 어떻게 방지합니까? (준비된 진술, pdo) PHP에서 SQL 주입을 어떻게 방지합니까? (준비된 진술, pdo) Apr 15, 2025 am 12:15 AM

PHP에서 전처리 문과 PDO를 사용하면 SQL 주입 공격을 효과적으로 방지 할 수 있습니다. 1) PDO를 사용하여 데이터베이스에 연결하고 오류 모드를 설정하십시오. 2) 준비 방법을 통해 전처리 명세서를 작성하고 자리 표시자를 사용하여 데이터를 전달하고 방법을 실행하십시오. 3) 쿼리 결과를 처리하고 코드의 보안 및 성능을 보장합니다.

See all articles