PHP7 の抽象構文ツリー (AST) によってもたらされる変更

藏色散人
リリース: 2023-04-05 17:28:01
転載
3788 人が閲覧しました

PHP7 の抽象構文ツリー (AST) によってもたらされる変更

#抽象構文ツリーとは何ですか?

抽象構文ツリー (AST) は、ソース コードの抽象構文構造をツリーで表現したものです。ツリー上の各ノードは、ソース コード内の構造を表します。これが、抽象構文ツリーである理由です。抽象構文ツリーは、実際の文法のすべての詳細を表すわけではありません。たとえば、ネストされた括弧はツリーの構造に暗黙的に含まれており、ノードの形式では表示されません。抽象構文ツリーはソース言語の文法に依存しません。これは、構文分析段階で使用される文脈自由文法を意味します [文法は、言語の文法構造を記述するために使用される正式な規則です。機械語であろうと自然言語であろうと、どの言語にも独自の文法があります。 ]、なぜなら、文法を記述するとき、文法に対して同等の変換 (左再帰、バックトラッキング、あいまいさの除去など) が実行されることがよくあります。これにより、文法分析にいくつかの冗長なコンポーネントが導入され、後続の段階に悪影響が生じ、さらにはステージ全体が混乱する。このため、多くのコンパイラは、フロントエンドとバックエンドの明確なインターフェイスを確立するために、独立して構文解析ツリーを構築する必要があることがよくあります。

PHP-Parser プロジェクトのホームページは、https://github.com/nikic/PHP-パーサー。複数のバージョンの PHP を完全に解析し、抽象構文ツリーを生成できます。

新しい実行プロセス

PHP7 のコアにおける重要な変更は、AST の追加です。 PHP5 では、PHP スクリプトからオペコードまでの実行プロセスは次のとおりです:

1.字句解析: 字句スキャン分析、ソース ファイルをトークン ストリームに変換します;

2. 解析: 構文分析、Op 配列はこの段階で生成されます。

PHP7 では、op 配列は構文分析フェーズ中に直接生成されなくなりましたが、AST が最初に生成されるため、プロセスにはもう 1 つのステップがあります:

1.Lexing: 字句スキャン分析、ソース ファイルをトークン ストリームに変換します;

2.解析: 構文分析、トークン ストリームから抽象構文ツリーを生成します;

3.コンパイル: 抽象構文ツリーから op 配列を生成します。

実行時間とメモリ消費量

上記の手順から、これは前のプロセスよりも 1 つの手順が多いため、常識的には、これによりプログラムの実行時間が増加します。時間とメモリの使用量。しかし実際には、メモリ使用量は確かに増加していますが、実行時間は減少しています。

次の結果は、小規模 (約 100 行のコード)、中規模 (約 700 行)、および大規模 (約 2800 行) の 3 つのスクリプトをテストして得られたものです。テスト スクリプト: https://gist.github .com/nikic/289b0c7538b46c2220bc.

各ファイルを 100 回コンパイルした場合の実行時間 (記事のテスト結果は、PHP7 がまだ PHP-NG と呼ばれていた 14 年間のものであることに注意してください):

PHP7 の抽象構文ツリー (AST) によってもたらされる変更

#単一コンパイルのメモリ ピーク値:

PHP7 の抽象構文ツリー (AST) によってもたらされる変更

単一コンパイルのテスト結果は、実際の使用量を表していない可能性があります。 PhpParser 完全なプロジェクト テストの結果:

PHP7 の抽象構文ツリー (AST) によってもたらされる変更

テストでは、AST の使用後、プログラムの全体的な実行時間が約 10% ~ 15% 改善されたことが示されています。メモリ消費量も増加します。大きなファイルを 1 回コンパイルするだけでは増加は明らかですが、プロジェクト全体の実行中は深刻な問題ではありません。

また、上記の結果はすべて Opcache を使用していないことにも注意してください。運用環境で Opcache がオンになっている場合、メモリ消費量の増加は大きな問題ではありません。

セマンティックな変更

これが単なる時間の最適化である場合、AST を使用する十分な理由にはならないようです。実際、AST の実装は時間の最適化を考慮したものではなく、構文の問題を解決するために行われています。セマンティクスにおけるいくつかの変更を見てみましょう。

yield には括弧は必要ありません

PHP5 実装では、式コンテキスト (代入式の右側など) で yield を使用する場合、 yield 宣言の両側で括弧を使用する必要があります:

<?php
$result = yield fn();   // 不合法的
$result = (yield fn()); // 合法的
ログイン後にコピー

この動作は、PHP5 の実装制限によるものです。PHP7 では、括弧は必要なくなりました。したがって、次の記述方法も合法です:

<?php
$result = yield;
$result = yield $v;
$result = yield $k => $v;
ログイン後にコピー

もちろん、yield のアプリケーション シナリオに従わなければなりません。

括弧は動作に影響しません

PHP5 では、

<?php
($foo)[&#39;bar&#39;] = &#39;baz&#39;;
# PHP Parse error: Syntax error, unexpected &#39;[&#39; on line 1
ログイン後にコピー

しかし、PHP7 では、2 つの記述方法は同じことを意味します。

同様に、関数のパラメータが括弧で囲まれている場合、型チェックに問題があります。この問題は PHP7 でも解決されています:

<?php
function func() {
    return [];
}

function byRef(array &$a) {
}

byRef((func()));
ログイン後にコピー

上記のコードは、次の場合には警告しません。 PHP5 では byRef が使用されていない限り (func())、PHP7 では func() の両側に括弧があるかどうかに関係なく、次のエラーが発生します。

PHP Strict standards:  Only variables should be passed by reference ...
ログイン後にコピー

Changes in list()

list 关键字的行为改变了很多。list 给变量赋值的顺序(等号左右同时的顺序)以前是从右至左,现在是从左到右:

<?php
list($array[], $array[], $array[]) = [1, 2, 3];
var_dump($array);
// PHP5: $array = [3, 2, 1]
// PHP7: $array = [1, 2, 3]
# 注意这里的左右的顺序指的是等号左右同时的顺序,
# list($a, $b) = [1, 2] 这种使用中 $a == 1, $b == 2 是没有疑问的。
ログイン後にコピー

产生上面变化的原因正是因为在 PHP5 的赋值过程中,3 会最先被填入数组,1 最后,但是现在顺序改变了。

同样的变化还有:

<?php
$a = [1, 2];
list($a, $b) = $a;
// PHP5: $a = 1, $b = 2
// PHP7: $a = 1, $b = null + "Undefined index 1"
ログイン後にコピー

这是因为在以前的赋值过程中 $b 先得到 2,然后 $a 的值才变成1,但是现在 $a 先变成了 1,不再是数组,所以 $b 就成了null。

list 现在只会访问每个偏移量一次

<?php
list(list($a, $b)) = $array;
// PHP5:
$b = $array[0][1];
$a = $array[0][0];
// PHP7:
// 会产生一个中间变量,得到 $array[0] 的值
$_tmp = $array[0];
$a = $_tmp[0];
$b = $_tmp[1];
ログイン後にコピー

空的 list 成员现在是全部禁止的,以前只是在某些情况下:

<?php
list() = $a;           // 不合法
list($b, list()) = $a; // 不合法
foreach ($a as list()) // 不合法 (PHP5 中也不合法)
ログイン後にコピー

引用赋值的顺序

引用赋值的顺序在 PHP5 中是从右到左的,现在时从左到右:

<?php
$obj = new stdClass;
$obj->a = &$obj->b;
$obj->b = 1;
var_dump($obj);
// PHP5:
object(stdClass)#1 (2) {
 ["b"] => &int(1)
  ["a"] => &int(1)
}
// PHP7:
object(stdClass)#1 (2) {
 ["a"] => &int(1)
  ["b"] => &int(1)
}
ログイン後にコピー

__clone 方法可以直接调用

现在可以直接使用 $obj->__clone() 的写法去调用 __clone 方法。 __clone 是之前唯一一个被禁止直接调用的魔术方法,之前你会得到一个这样的错误:

Fatal error:Cannot call __clone() method on objects -use &#39;clone $obj&#39; instead in...
ログイン後にコピー

变量语法一致性

AST 也解决了一些语法一致性的问题,这些问题是在另外一个 RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.

在新的实现上,以前的一些语法表达的含义和现在有些不同,具体的可以参照下面的表格:

PHP7 の抽象構文ツリー (AST) によってもたらされる変更

整体上还是以前的顺序是从右到左,现在从左到右,同时也遵循括号不影响行为的原则。这些复杂的变量写法是在实际开发中需要注意的。

相关推荐:《PHP教程

以上がPHP7 の抽象構文ツリー (AST) によってもたらされる変更の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:uckendo
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!