PHP ソース コード - 関数のソース コード分析の内部分解
PHP の implode
- PHP における implode の機能は、1 次元配列の値を文字列に変換することです。 1 次元の配列を思い出してください。それが多次元の場合はどうなるでしょうか?この分析では、それについて説明します。
- 実際、公式ドキュメントから、implode には 2 つの用途があることがわかります。これは関数シグネチャからわかります。
1 2 3 4 |
|
- なぜなら、glue が渡されない 場合によっては、内部実装のデフォルトが空の文字列になることがあります。
- 簡単な例から見ることができます:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
implode ソース コードの実装
- キーワードを検索してください
PHP_FUNCTION(implode)
この関数は、\ext\standard\string.c
ファイルの 1288 行目で定義されていることがわかります。 - 最初の数行は情報関連です。パラメータ宣言に。ここで、 *arg2 は、個の引数を受け取るポインタです。
- 以下の arg2 の判定において、arg2 が空の場合は、駒に相当する値が渡されていないことを意味します
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
|
駒パラメータが渡されていないことを意味します
- Pieces パラメータを渡さない、つまり
arg2 == NULL
の判断では、主にパラメータの何らかの処理が含まれます - glue を空の文字列に初期化して渡す唯一のパラメータで、値を Pieces 変数に代入し、
php_implode(glue, Pieces, return_value);
非常に重要な php_implode
- # を呼び出します。 ##pcs パラメータが渡されているかどうかに関係なく、パラメータを処理した後、最終的には PHPAPI の関連関数 php_implode が呼び出されます。この関数には重要なロジックが実装されていることがわかりますので、詳しく見てみましょう
- php_implode を呼び出すと、宣言されていないように見える変数 return_value が表示されます。そう、それはどこからともなく現れたようです。
- Google で
- PHP ソース コードの return_value
を検索すると、
answer が見つかりました。 この変数はマクロ PHP_FUNCTION とともに表示され、ここでの implode の実装は - PHP_FUNCTION(implode)
を通じて宣言されていることがわかります。 PHP_FUNCTION の定義は次のとおりです:
1 2 3 4 5 6 7 8 9 |
|
- (二重ポンド記号については、コネクタとして機能します。理解するには、
- ここを参照してください) 前処理されると、次のようになります。
1 |
|
- つまり、return_value は、implode 拡張関数全体として定義された仮パラメータです。
- php_implode の定義では、最初に使用する変数をいくつか定義し、それを識別するために
- ALLOCA_FLAG(use_heap)
を使用します。メモリを適用する場合は、ヒープ メモリを適用します
pass - numelems = zend_hash_num_elements(Z_ARRVAL_P(個));
個パラメータの単位数を取得します。空の配列の場合は、空の文字列を直接返します
ここにも判定があり、配列のユニット数が 1 個の場合は、ユニークなユニットをそのまま文字列として返します。 - 最後のステップは、複数の配列ユニットの状況に対処することです。前述したように、メモリを申請する場合は、ヒープ メモリも申請することになります。ヒープ メモリはスタックに比べて効率が低いため、次に、ヒープ メモリが適用されますが、ここでは複数ユニットの配列の状況が説明されます。
- 次に、ピース ループについては、スプライシング用の値を取得します。ソース コードの foreach ループは、次のような固定構造になっています:
1 2 3 |
|
- 私はこれだと思います。は一般的な書き方であり、PHP 拡張機能を記述する場合には不可欠です。ただし、実稼働対応の PHP 拡張機能はまだ 1 つも作成していません。でも、その方向に向かって頑張っていきたいと思います!
- ループ内では、配列ユニットは 3 つのカテゴリに分類されます。
- 字符串
- 整形数据
- 其它
- 事实上,在循环开始之前,源码中,先申请了一块内存,用于存放下面的结构体,并且个数恰好是 pieces 数组单元的个数。
1 2 3 4 |
|
- 可以看到,结构体成员包含 zend 字符串以及 zend 整形数据。这个结构体的出现,恰好是为了存放数组单元中的 zend 字符串/zend 整形数据。
字符串
- 先假设,pieces 数组单元中,都是字符串类型,此时循环中执行的逻辑就是:
1 2 3 4 5 |
|
- 其中,tmp 是循环中的单元值。每经历一次循环,会将单元值放入结构体中,随后进行指针 +1 运算,指针就指向存储下一个结构体数据的地址:
- 并且,在这期间,统计出了字符串的总长度
len += ZSTR_LEN(ptr->str);
整数类型
- 以上,讨论了数组单元中是字符串的情况。接下来看看,如果数组单元的类型是数值类型时会发生什么?
- 判断一个变量是否是数值类型(其实是 zend_long),通用方法是:
Z_TYPE_P(tmp) == IS_LONG
。一旦知道当前的数据类型是 zend_long,则将其赋值给 ptr 的 lval 结构体成员。然后 ptr 指针后移一个单位长度。 - 但是,我们知道我们不能像获取 zend_string 的长度一样去获取 zend_long 的字符长度。如果是 zend_string,则可以通过
len += ZSTR_LEN(val);
的方式获取其字符长度。对于 zend_long,有什么好的方法呢? - 在源码中是通过对 10 做除法运算,得出结果的一部分,再慢慢的累加其长度:
1 2 3 4 |
|
- 如果是负数呢?没有什么特别的办法,直接判断处理:
1 2 3 |
|
字符串的处理和拷贝
- 循环结束后,ptr 就是指向这段内存的尾部的指针。
- 然后,申请了一段内存:
str = zend_string_safe_alloc(numelems - 1, ZSTR_LEN(glue), len, 0);
,用于存放单元字符串总长度加上连接字符的总长度,即(n-1)glue + len
。因为 n 个数组单元,只需要 n-1 个 glue 字符串。然后,将这段内存的尾地址,赋值给 cptr,为什么要指向尾部呢?看下一部分,你就会明白了。 - 接下来,需要循环取出存放在 ptr 中的字符。我们知道,ptr 此时是所处内存区域的尾部,为了能有序展示连接的字符串,源码中,是从后向前循环处理。这也就是为什么需要把 cptr 指向所在内存区域的尾部的原因。
- 进入循环,先进行
ptr--;
,然后针对 ptr->str 的判断if (EXPECTED(ptr->str))
,看了一下此处的 EXPECTED 的作用,可以参考这里。可以简单的将其理解一种汇编层面的优化,当实际执行的情况更偏向于当前条件下的分支而非 else 的分支时,就用 EXPECTED 宏将其包装起来:EXPECTED(ptr->str)
。我敢说,当你调用 implode 传递的数组中都是数字而非字符串,那么这里的 EXPECTED 作用就会失效。 - 接下来的两行是比较核心的:
- cptr 的指针前移一个数组单元字符的长度,然后将
ptr->str
(某数组单元的值)通过 c 标准库函数 memcpy 拷贝到 cptr 内存空间中。 - 当
ptr == strings
满足时,意味着 ptr 不再有可被复制的字符串/数字。因为 strings 是 ptr 所在区域的首地址。 - 通过上面,已经成功将一个数组单元的字符串拷贝到 cptr 对应的内存区域中,接下来如何处理 glue 呢?
- 只需要像处理
ptr->str
一样处理 glue 即可。至少源码中是这么做的。 - 代码中有一段是:
*cptr = 0
,它的作用相当于赋值空字符串。 - cptr 继续前移 glue 的长度,然后,将 glue 字符串拷贝到 cptr 对应的内存区域中。没错,还是用 memcpy 函数。
- 到这里,第一次循环结束了。我应该不需要像实际循环中那样描述这里的循环吧?相信优秀的你,是完全可以参考上方的描述脑补出来的 ^^
- 当然,处理返回的两句还是要提一下:
- strings 的那一片内存空间只是存储临时值的,因此函数结束了,就必须跟 strings 说再见。我们知道 c 语言是手动管理内存的,没有 GC,你要显示的释放内存,即
free_alloca(strings, use_heap);
。 - 在上面的描述中,我们只讲到了 cptr,但这里的返回值却是 str。
- 不用怀疑,这里是对的,我们所讲的 cptr 那一片内存区域的首地址就是 str。并通过宏
RETURN_NEW_STR
会将最终的返回值写入 return_value 中 - 为了可能更加清晰 implode 源码中代码运行时的情况,接下来,我们通过 PHP 扩展的方式对其进行 debug。在这个过程中的代码,我都放在 GitHub 的仓库中,分支名是
debug/implode
,可自行下载运行,看看效果。 - 新建 PHP 扩展模板的操作,可以参考这里。请确保操作完里面描述的步骤。
- 接下来,主要针对 su_dd.c 文件修改代码。为了能通过修改代码来看效果,将 php_implode 函数复制到扩展文件中,并将其命名为 su_php_implode:
- 在扩展中新增一个扩展函数 su_test:
- 因为扩展的编译以及引入,前面的已经提及。因此,此时只需编写 PHP 代码进行调用:
- PHP 运行该脚本,输出:
string(10) "2019-01-01"
,这意味着,你已经成功编写了一个扩展函数。别急,这只是迈出了第一步,别忘记我们的目标:通过调试来学习 implode 源码。 - 接下来,我们通过 gdb 工具,调试以上 PHP 代码在源码层面的运行。为了防止初学者不会用 gdb,这里就繁琐的写出这个过程。如果没有安装 gdb,请自行谷歌。
- 先进入 PHP 脚本所在路径。命令行下:
-
b
即 break,表示打一个断点 -
r
即 run,表示运行脚本 -
s
即 step,表示一步一步调试,遇到方法调用,会进入方法内部单步调试 -
n
即 next,表示一行一行调试。遇到方法,则调试直接略过直接执行返回,调试不会进入其内部。 -
p
即 print,表示打印当前作用域中的一个变量 - 当运行完
r t1.php
,则会定位到第一个断点对应的行,显示如下: - 此时,按下
n
,显示如下: - 此时,当前的作用域中存在变量:
glue
,pieces
,return_value
- 我们可以通过 gdb 调试,查看
pieces
的值。先使用命令:p pieces
,此时在终端会显示类似于如下内容: - 表明
pieces
是一个 zval 类型的指针,0x7ffff1a1d120
是其地址,当然,你运行的时候对应的也是一个地址,只不过跟我的这个会不太一样。 - 我们继续使用
p
去打印存储于改地址的变量内容:p *$1
,$1
可以认为是一个临时变量名,*
是取值运算符。运行完后,此时显示如下: - 打印的内容,看起来是一堆乱糟糟的字符,这实际上是 zval 的结构体,其中的字段刚好是和 zval 的成员一一对应的,为了便于读者阅读,这里直接贴出 zval 的结构体信息:
- 我们直指要害 ——
value
,打印一下其中的内容。打印结构体成员可以使用.
运算符,例如:p $2.value
,运行这个命令,显示如下: - 通过 zval 结构体,我们知道 value 成员的类型是 zend_value,很不幸,这也是一个结构体:
- 我们要打印的变量是 pieces,我们知道它是一个数组,因而此时我们直接取 zend_value 结构体的
*arr
成员,它外表看起来就是一个指针,因此打印其内容,需要使用*
运算符 - 真棒!到目前为止,貌似一切都按照预定的路线进行。通过 zend_value 结构体,可以知道
*arr
的类型是 zend_array: - 了解 PHP 数组的同学一定知道它底层是一个 HashTable,感兴趣的同学,可以去自行了解一下 HashTable。这里,我们打印
*arData
,使用:p *$4.arDaa
: - 到这里,我们已经可以看到 pieces 数组第一个单元的值 —— 2019,就是那段
lval = 2019
。 - 好了,关于 gdb 的简单使用就先介绍到这里。文章开篇,我们提到,如果数组是多维数组,会发生什么?我们实践的主要目标就是简单实现二维数组的 implode
- 在 PHP 的 implode 函数中,如果是多维数组,则会直接把里层的数组显示为 Array 字符串。
- 运行这段脚本,会输出如下:
- 为了能够支持连接数组,我们需要改写 php_implode,因此,先拷贝一下 php_implode 到写扩展代码的文件中:
- 先将函数签名稍微调整成
static void su_php_implode(const zend_string *glue, zval *pieces, zval *return_value)
- 我们可以看到其中有一段循环 pieces 的处理:
- 我们只需将其中的 if 分支新增一个分支:
else if (UNEXPECTED(Z_TYPE_P(tmp) == IS_ARRAY))
,其具体内容如下: - 正如注释中写的,当遇到数组的单元是数组类型时,我们会调用原先的 php_implode,只不过,这个“php_implode”会真的返回一个 zend_string 指针,在此我将其改名为
origin_php_implode
: - 内容大体不变,只有函数签名以及返回值的地方略作调整了。
- 配合前面的
PHP_FUNCTION(su_test)
,功能实现的差不多了。我们去编译看看: - 太棒了,编译通过。我们去执行一下 PHP 脚本:
- 输出如下:
- 恭喜,我们已经大功告成!
1 2 |
|
1 2 |
|
实践
1 2 3 4 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
|
1 2 3 4 5 |
|
1 2 3 |
|
1 2 3 4 |
|
1 |
|
1 |
|
1 2 3 4 5 6 7 8 9 10 11 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 |
|
1 2 3 4 5 6 7 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
|
1 2 3 4 5 6 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
|
1 2 3 4 5 6 7 8 9 |
|
1 2 3 4 |
|
1 2 3 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 |
|
1 2 3 4 5 6 7 8 9 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 |
|
1 2 3 |
|
1 2 3 4 |
|
1 |
|
以上がPHP ソース コード - 関数のソース コード分析の内部分解の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











Laravelは、直感的なフラッシュメソッドを使用して、一時的なセッションデータの処理を簡素化します。これは、アプリケーション内に簡単なメッセージ、アラート、または通知を表示するのに最適です。 データは、デフォルトで次の要求のためにのみ持続します。 $リクエスト -

PHPクライアントURL(CURL)拡張機能は、開発者にとって強力なツールであり、リモートサーバーやREST APIとのシームレスな対話を可能にします。尊敬されるマルチプロトコルファイル転送ライブラリであるLibcurlを活用することにより、PHP Curlは効率的なexecuを促進します

Laravelは簡潔なHTTP応答シミュレーション構文を提供し、HTTP相互作用テストを簡素化します。このアプローチは、テストシミュレーションをより直感的にしながら、コード冗長性を大幅に削減します。 基本的な実装は、さまざまな応答タイプのショートカットを提供します。 Illuminate \ support \ facades \ httpを使用します。 http :: fake([[ 'google.com' => 'hello world'、 'github.com' => ['foo' => 'bar']、 'forge.laravel.com' =>

顧客の最も差し迫った問題にリアルタイムでインスタントソリューションを提供したいですか? ライブチャットを使用すると、顧客とのリアルタイムな会話を行い、すぐに問題を解決できます。それはあなたがあなたのカスタムにより速いサービスを提供することを可能にします

記事では、PHP 5.3で導入されたPHPの後期静的結合(LSB)について説明し、より柔軟な継承を求める静的メソッドコールのランタイム解像度を可能にします。 LSBの実用的なアプリケーションと潜在的なパフォーマ

PHPロギングは、Webアプリケーションの監視とデバッグ、および重要なイベント、エラー、ランタイムの動作をキャプチャするために不可欠です。システムのパフォーマンスに関する貴重な洞察を提供し、問題の特定に役立ち、より速いトラブルシューティングをサポートします

Laravelは、着信リクエストでHTTP動詞処理を簡素化し、アプリケーション内の多様な運用管理を合理化します。 Method()およびisMethod()メソッドは、リクエストタイプを効率的に識別および検証します。 この機能は、建物に不可欠です

ストレージ:: Laravelフレームワークのダウンロード方法は、ファイルストレージの抽象化を管理しながら、ファイルのダウンロードを安全に処理するための簡潔なAPIを提供します。 サンプルコントローラーでストレージ::ダウンロード()を使用する例は次のとおりです。
