PHP是解析型高階語言,事實上從Zend核心的角度來看PHP就是一個普通的C程序,它有main函數,我們寫的PHP程式碼是這個程式的輸入,然後經過核心的處理輸出結果,核心將PHP程式碼"翻譯"為C程式可辨識的過程就是PHP的編譯。
推薦課程:PHP教學
#C程式在編譯時將一行行程式碼編譯為機器碼,每一個運算都認為是一條機器指令,這些指令寫入到編譯後的二進位程式中,執行的時候將二進位程式load進對應的記憶體區域(常數區、資料區、程式碼區)、分配運行棧,然後從程式碼區起始位置開始執行,這是C程式編譯、執行的簡單流程。
同樣,PHP的編譯與普通的C程式類似,只是PHP程式碼沒有編譯成機器碼,而是解析成了若干條opcode數組,每條opcode就是C裡面普通的struct,意義對應C程式的機器指令,執行的過程就是引擎依序執行opcode,例如我們在PHP裡定義一個變數:$a = 123;
,最後到核心執行就是malloc一塊內存,然後把值寫進去。
在zend_compile.h檔中,opcode結構:
struct _zend_op { const void *handler; //对应执行的C语言function,即每条opcode都有一个C function处理 znode_op op1; //操作数1 znode_op op2; //操作数2 znode_op result; //返回值 uint32_t extended_value; uint32_t lineno; zend_uchar opcode; //opcode指令 zend_uchar op1_type; //操作数1类型 zend_uchar op2_type; //操作数2类型 zend_uchar result_type; //返回值类型 };
所以PHP的解析過程任務就是將PHP程式碼(透過詞法分析re2c,語法分析bison)轉換成opcode數組,程式碼裡的所有資訊都保存在opcode中,然後將opcode數組交給zend引擎執行,opcode就是內核具體執行的命令,例如賦值、加減操作、函數呼叫等,每一條opcode都對應一個處理handle,這些handler是提前定義好的C函數。
struct _zend_op_array { //common是普通函数或类成员方法对应的opcodes快速访问时使用的字段 /* Common elements */ zend_uchar type; zend_uchar arg_flags[3]; /* bitset of arg_info.pass_by_reference */ uint32_t fn_flags; zend_string *function_name; zend_class_entry *scope; zend_function *prototype; uint32_t num_args; uint32_t required_num_args; zend_arg_info *arg_info; /* END of common elements */ uint32_t *refcount; uint32_t last; //opcode指令数组 zend_op *opcodes; //PHP代码里定义的变量数:op_type为IS_CV的变量,不含IS_TMP_VAR、IS_VAR的 //编译前此值为0,然后发现一个新变量这个值就加1 int last_var; //临时变量数:op_type为IS_TMP_VAR、IS_VAR的变量 uint32_t T; //PHP变量名数组 zend_string **vars;//这个数组在ast编译期间配合last_var用来确定各个变量的编号,非常重要的一步操作 int last_live_range; int last_try_catch; zend_live_range *live_range; zend_try_catch_element *try_catch_array; //静态变量符号表:通过static声明的 /* static variables support */ HashTable *static_variables; zend_string *filename; uint32_t line_start; uint32_t line_end; zend_string *doc_comment; uint32_t early_binding; /* the linked list of delayed declarations */ //字面量数量 int last_literal; //字面量(常量)数组,这些都是在PHP代码定义的一些值 zval *literals; //运行时缓存数组大小 int cache_size; //运行时缓存,主要用于缓存一些znode_op以便于快速获取数据,后面单独介绍这个机制 void **run_time_cache; void *reserved[ZEND_MAX_RESERVED_RESOURCES]; };
opcode指令:即PHP程式碼具體對應的處理動作,與二進位程式中的程式碼段對應
字面量儲存:PHP程式碼中定義的一些變數初始值、呼叫的函數名稱、類名稱、常數名稱等等稱之為字面量,這些值用於執行時初始化變數、函數呼叫等等
變數分配情況:與字面量類似,這裡指的是當前opcodes定義了多少變數、臨時變數,每個變數都有一個對應的編號,執行初始化按照總的數目一次性分配zval,使用時也完全按照編號索引,而不是根據變數名稱索引
從PHP代碼到opcode是怎麼實現的?
最容易想到的方式就是正規匹配,當然過程沒有這麼簡單。 PHP編譯過程包括詞法分析、語法分析,使用re2c、bison完成,舊的PHP版本直接產生了opcode,PHP7新增了抽象語法樹(AST),在語法分析階段產生AST,然後再產生opcode數組
以上是如何編譯php文件的詳細內容。更多資訊請關注PHP中文網其他相關文章!