深入理解PHP内核(五)函数的内部结构
php的函数包括用户定义的函数、内部函数(print_r count...)、匿名函数、变量函数($func = 'print_r'; $func(array('a','b'));)
PHP内核源码中将函数分为以下类型
<span style="color: #0000ff;">#define</span> ZEND_INTERNAL_FUNCTION 1<span style="color: #0000ff;">#define</span> ZEND_USER_FUNCTION 2 <span style="color: #0000ff;">#define</span> ZEND_OVERLOADED_FUNCTION 3<span style="color: #0000ff;">#define</span> ZEND_EVAL_CODE 4<span style="color: #0000ff;">#define</span> ZEND_OVERLOADED_FUNCTION_TEMPORARY 5
一、用户函数(ZEND_USER_FUNCTION)
函数不一定显式的有返回值,在PHP的实现中即使没有显式的返回,PHP内核也会帮我们返回NULL。
ZEND在执行过程中,会将运行时信息存储于_zend_execute_data中:
<span style="color: #0000ff;">struct</span><span style="color: #000000;"> _zend_execute_data { </span><span style="color: #008000;">//</span><span style="color: #008000;">...省略部分代码</span><span style="color: #000000;"> zend_function_state function_state; zend_function </span>*fbc; <span style="color: #008000;">/*</span><span style="color: #008000;"> Function Being Called </span><span style="color: #008000;">*/</span> <span style="color: #008000;">//</span><span style="color: #008000;">...省略部分代码</span>};
在程序初始化的过程中,function_state也会进行初始化,function_state由两个部分组成:
typedef <span style="color: #0000ff;">struct</span><span style="color: #000000;"> _zend_function_state { zend_function </span>*<span style="color: #000000;">function; </span><span style="color: #0000ff;">void</span> **<span style="color: #000000;">arguments;} zend_function_state;</span>
*arguments是一个指向函数参数的指针,而函数体本事存储于*function中,*function是一个zend_function结构体,它最终存储了用户自定义函数的一切信息,具体结构如下:
<span style="color: #000000;">typedef union _zend_function { zend_uchar type; </span><span style="color: #008000;">/*</span><span style="color: #008000;"> MUST be the first element of this struct! </span><span style="color: #008000;">*/</span> <span style="color: #0000ff;">struct</span><span style="color: #000000;"> { zend_uchar type; </span><span style="color: #008000;">/*</span><span style="color: #008000;"> never used </span><span style="color: #008000;">*/</span> <span style="color: #0000ff;">char</span> *function_name; <span style="color: #008000;">//</span><span style="color: #008000;">函数名称</span> zend_class_entry *scope; <span style="color: #008000;">//</span><span style="color: #008000;">函数所在的类作用域</span> zend_uint fn_flags; <span style="color: #008000;">//</span><span style="color: #008000;">函数类型,如用户自定义则为 #define </span>ZEND_USER_FUNCTION <span style="color: #800080;">2</span><span style="color: #000000;"> union _zend_function </span>*prototype; <span style="color: #008000;">//</span><span style="color: #008000;">函数原型</span> zend_uint num_args; <span style="color: #008000;">//</span><span style="color: #008000;">参数数目</span> zend_uint required_num_args; <span style="color: #008000;">//</span><span style="color: #008000;">需要的参数数目</span> zend_arg_info *arg_info; <span style="color: #008000;">//</span><span style="color: #008000;">参数信息指针</span><span style="color: #000000;"> zend_bool pass_rest_by_reference; unsigned </span><span style="color: #0000ff;">char</span> return_reference; <span style="color: #008000;">//</span><span style="color: #008000;">返回值</span><span style="color: #000000;"> } common; zend_op_array op_array; </span><span style="color: #008000;">//</span><span style="color: #008000;">函数中的操作</span><span style="color: #000000;">? zend_internal_function internal_function; } zend_function;</span>
zend_function的结构体中的op_array存储了该函数中的所有操作,当函数被调用时,ZEND就会将这个op_array中的opline一条条顺序执行,并将最后的结果返回。函数的定义和执行是分开的,一个函数可以作为一个独立的运行单元存在。
二、内部函数(ZEND_INTERNAL_FUNCTION)
ZEND_INTERNAL_FUNCTION函数是由扩展或者Zend/PHP内核提供的,用c/c++编写,可以直接执行的函数,以下为内部函数的结构
typedef <span style="color: #0000ff;">struct</span><span style="color: #000000;"> _zend_internal_function { </span><span style="color: #008000;">/*</span><span style="color: #008000;"> Common elements </span><span style="color: #008000;">*/</span><span style="color: #000000;"> zend_uchar type; </span><span style="color: #0000ff;">char</span> *<span style="color: #000000;"> function_name; zend_class_entry </span>*<span style="color: #000000;">scope; zend_uint fn_flags; union _zend_function </span>*<span style="color: #000000;">prototype; zend_uint num_args; zend_uint required_num_args; zend_arg_info </span>*<span style="color: #000000;">arg_info; zend_bool pass_rest_by_reference; unsigned </span><span style="color: #0000ff;">char</span><span style="color: #000000;"> return_reference; </span><span style="color: #008000;">/*</span><span style="color: #008000;"> END of common elements </span><span style="color: #008000;">*/</span> <span style="color: #0000ff;">void</span> (*<span style="color: #000000;">handler)(INTERNAL_FUNCTION_PARAMETERS); </span><span style="color: #0000ff;">struct</span> _zend_module_entry *<span style="color: #000000;">module;} zend_internal_function;</span>
在模块初始化的时候,ZE会遍历每个载入的扩展模块,然后将模块中function_entry中指明的每一个函数(module->functions),创建一个zend_internal_function结构,并将其type设置为ZEND_INTERNAL_FUNCTION,将这个结构填入全局的函数表(HashTable结构);函数设置及注册过程见Zend/zene_API.c文件中的zend_register_function函数,这个函数除了处理函数页也处理类的方法,包括那些魔术方法。
内部函数的结构与用户自定义函数结构基本类似,有一些不同:
三、变量函数
如果一个变量名后边有圆括号,php将寻找与变量的值同名的函数,并且尝试执行。
变量函数$func
$func = <span style="color: #800000;">'</span><span style="color: #800000;">print_r</span><span style="color: #800000;">'</span><span style="color: #000000;">;$func(</span><span style="color: #800000;">'</span><span style="color: #800000;">i am print_r function.</span><span style="color: #800000;">'</span>);
编译后中间代码
function name: (<span style="color: #0000ff;">null</span><span style="color: #000000;">)number of ops: </span><span style="color: #800080;">9</span><span style="color: #000000;">compiled vars: </span>!<span style="color: #800080;">0</span> =<span style="color: #000000;"> $funcline # </span>* op fetch ext <span style="color: #0000ff;">return</span><span style="color: #000000;"> operands</span>-------------------------------------------------------------------------------- <span style="color: #800080;">2</span> <span style="color: #800080;">0</span> ><span style="color: #000000;"> EXT_STMT </span><span style="color: #800080;">1</span> ASSIGN !<span style="color: #800080;">0</span><span style="color: #000000;">, </span><span style="color: #800000;">'</span><span style="color: #800000;">print_r</span><span style="color: #800000;">'</span> <span style="color: #800080;">3</span> <span style="color: #800080;">2</span><span style="color: #000000;"> EXT_STMT </span><span style="color: #800080;">3</span> INIT_FCALL_BY_NAME !<span style="color: #800080;">0</span> <span style="color: #800080;">4</span><span style="color: #000000;"> EXT_FCALL_BEGIN </span><span style="color: #800080;">5</span><span style="color: #000000;"> SEND_VAL </span><span style="color: #800000;">'</span><span style="color: #800000;">i+am+print_r+function.</span><span style="color: #800000;">'</span> <span style="color: #800080;">6</span> DO_FCALL_BY_NAME <span style="color: #800080;">1</span> <span style="color: #800080;">7</span><span style="color: #000000;"> EXT_FCALL_END </span><span style="color: #800080;">8</span> > RETURN 1
内部函数
print_r(<span style="color: #800000;">'</span><span style="color: #800000;">i am print_r function.</span><span style="color: #800000;">'</span>);
编译后中间代码
function name: (<span style="color: #0000ff;">null</span><span style="color: #000000;">)number of ops: </span><span style="color: #800080;">6</span><span style="color: #000000;">compiled vars: noneline # </span>* op fetch ext <span style="color: #0000ff;">return</span><span style="color: #000000;"> operands</span>--------------------------------------------------------------------------------- <span style="color: #800080;">2</span> <span style="color: #800080;">0</span> ><span style="color: #000000;"> EXT_STMT </span><span style="color: #800080;">1</span><span style="color: #000000;"> EXT_FCALL_BEGIN </span><span style="color: #800080;">2</span><span style="color: #000000;"> SEND_VAL </span><span style="color: #800000;">'</span><span style="color: #800000;">i+am+print_r+function.</span><span style="color: #800000;">'</span> <span style="color: #800080;">3</span> DO_FCALL <span style="color: #800080;">1</span> <span style="color: #800000;">'</span><span style="color: #800000;">print_r</span><span style="color: #800000;">'</span> <span style="color: #800080;">4</span><span style="color: #000000;"> EXT_FCALL_END </span><span style="color: #800080;">5</span> > RETURN <span style="color: #800080;">1</span>
对比发现,二者在调用中间代码上存在一些区别,变量函数是DO_FCALL_BY_NAME,而内部函数是DO_FCALL。这在语法解析时就已经决定了,见Zend/zend_complie.c文件的zend_do_end_function_call函数中部分代码:
<span style="color: #0000ff;">if</span> (!is_method && !is_dynamic_fcall && function_name->op_type==<span style="color: #000000;">IS_CONST) { opline</span>->opcode =<span style="color: #000000;"> ZEND_DO_FCALL; opline</span>->op1 = *<span style="color: #000000;">function_name; ZVAL_LONG(</span>&opline-><span style="color: #000000;">op2.u.constant, zend_hash_func(Z_STRVAL(function_name</span>->u.constant), Z_STRLEN(function_name->u.constant) + <span style="color: #800080;">1</span><span style="color: #000000;">)); } </span><span style="color: #0000ff;">else</span><span style="color: #000000;"> { opline</span>->opcode =<span style="color: #000000;"> ZEND_DO_FCALL_BY_NAME; SET_UNUSED(opline</span>-><span style="color: #000000;">op1); }</span>
如果不是方法,并且不是动态调用,并且函数名为字符串变量,则其生成的中间代码为ZEND_DO_FCALL。其他情况则为ZEND_DO_FCALL_BY_NAME。另外将变量函数作为回调函数,其处理过程在Zend/zend_complie.c文件的zend_do_pass_param函数中,最终会体现在中间代码执行过程中的ZEND_SEND_VAL_SPEC_CONST_HADNLER等函数中。
四、匿名函数
匿名函数是一类不需要指定表示符,而又可以被调用的函数或子例程,匿名函数可以方便的作为参数传递给其他函数。