深入理解PHP传参原理-php手册-PHP中文网

EG(argument_stack)简介

初始化argument_stack

参数入栈

参数个数

获取参数

清理argument_stack

回到文章刚开始的问题...

首页

php教程

php手册

深入理解PHP传参原理

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 16, 2016 am 09:16 AM

php 。下原理参数在扩展深入理解的编写问题首先

首先说下今天想到的一个问题。在编写php扩展的时候，似乎参数（即传给zend_parse_parameters的变量）是不需要free的。举例：

<span PHP_FUNCTION(test)
{
    </span><span char</span>*<span   str;
    </span><span int</span><span     str_len;

    </span><span if</span> (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, <span "</span><span s</span><span "</span>, &str, &str_len) ==<span  FAILURE) {
        RETURN_FALSE;
    }

    php_printf(str);<br />    <br />    </span><span //</span><span  无需free(str)   </span>
}

登录后复制

运行正常：

test("Hello World"); <span //</span><span  打印Hello World</span>

登录后复制

这里不用担心test函数会发生内存泄露，php会自动帮我们回收这些用于保存参数的变量。

那php究竟是如何做到的呢？要解释这个问题，还是得看php是怎么传递参数的。

EG(argument_stack)简介

简单来讲，在php中的EG中保存了一个专门用于存放参数的栈，名为argument_stack。每当发生函数调用的时候，php会将传入的参数压进EG(argument_stack)。一旦函数调用结束，则EG(argument_stack)被清理，并且等待下一次的函数调用。

关于EG(argument_stack)的struct结构、用途，php5.2和5.3实现有一些区别。本文主要以5.2为例，5.3+的变化后面抽空再说。

上图是5.2中argument_stack的大概示意图，看起来简单明了。其中，栈顶和栈底固定为NULL。函数接收的参数按照从左到右的顺序，依次被压入栈。注意，最后会被额外压入一个long型的值，表示栈里的参数个数（上图中为10）。

那被压入argument_stack的参数究竟是什么呢？其实是一个个zval类型的指针。它们指向的zva有可能是CV变量，有可能是is_ref=1的变量，还有可能是一个常量数字，或者常量字符串。

EG(argument_stack)在php5.2中被具体实现为zend_ptr_stack类型:

typedef <span struct</span><span  _zend_ptr_stack {
    </span><span int</span><span  top;                       // 栈中当前元素的个数
    </span><span int</span><span  max;                       // 栈中最多存放元素的个数
    </span><span void</span> **<span elements;               // 栈底
    </span><span void</span> **<span top_element;            // 栈顶
} zend_ptr_stack;</span>

登录后复制

初始化argument_stack

初始化argument_stack的工作是发生在php处理具体的请求之前，更准确说是处于php解释器的启动过程之中。

在init_executor函数里我们发现如下2行：

zend_ptr_stack_init(&<span EG(argument_stack));
zend_ptr_stack_push(</span>&EG(argument_stack), (<span void</span> *) NULL);

登录后复制

这2行分别代表着，初始化EG(argument_stack)，紧接着压入一个NULL。由于EG是个全局变量，因此在实际调用zend_ptr_stack_init之前，EG(argument_stack)中的所有数据全部为0。

zend_ptr_stack_init实现很简单。

ZEND_API <span void</span> zend_ptr_stack_init(zend_ptr_stack *<span stack)
{
    stack</span>->top_element = stack->elements = (<span void</span> **) emalloc(<span sizeof</span>(<span void</span> *)*<span PTR_STACK_BLOCK_SIZE);
    stack</span>->max =<span  PTR_STACK_BLOCK_SIZE;   // 栈的大小被初始化成64
    stack</span>->top = <span 0</span><span ;                      // 当前元素个数为0
}</span>

登录后复制

一旦argument_stack被初始化完，则立即会被压入NULL。这里无须深究，这个NULL其实没有任何的含义。

NULL入栈之后，整个argument_stack的实际内存分布如下：

参数入栈

在压入第一个NULL之后，一旦再有参数入栈，则argument_stack会发生如下动作：

stack->top++<span ;
</span>*(stack->top_element++) =<span  参数;</span>

登录后复制

我们用一段简单的php代码来说明问题：

<span function</span> foo( <span $str</span><span  ){
    </span><span print_r</span>(<span 123</span><span );
}
foo(</span>"hello world");

登录后复制

上述代码在调用foo的时候，传入了一个字符串常量。因此，实际上被压入栈的是一个指向存储“hello world”的zval。用vld来查看编译之后的opcode：

line     # *  op                           fetch          ext  return  operands
---------------------------------------------------------------------------------
   3     0  >   NOP
   6     1      SEND_VAL                                                  OP1[  IS_CONST (458754) 'hello world' ]
         2      DO_FCALL                                      1           OP1[  IS_CONST (458752) 'foo' ]
  15     3    > RETURN                                                    OP1[  IS_CONST (0) 1 ]

登录后复制

SEND_VAL指令实际上做的事情就是将“hello world”压入argument_stack。

<span int</span><span  ZEND_SEND_VAL_SPEC_CONST_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
{
        &hellip;&hellip;</span><span 
        zval </span>*<span valptr, </span>*<span value;

        value </span>= &opline-><span op1.u.constant;
        ALLOC_ZVAL(valptr);
        INIT_PZVAL_COPY(valptr, value);
        </span><span if</span> (!<span 0</span><span ) {
            zval_copy_ctor(valptr);
        }<br /><br />        <span // 入栈，<span valptr</span>指向存放hello world的zval</span>
        zend_ptr_stack_push(</span>&<span EG(argument_stack), valptr);  
<span         &hellip;&hellip;</span>
}</span>

登录后复制

入栈完成之后的argument_stack为：

参数个数

前文说到，实际上并非把所有参数入栈就完事了。php还会额外压入一个数字，表示参数的个数，这个工作并非发生在SEND_XXX指令的时候。实际上，在真正执行函数之前，php会将参数个数入栈。

继续沿用上面的例子，DO_FCALL 指令用于调用foo函数。在调用foo之前，php会自动填入argument_stack最后一块。

<span static</span> <span int</span><span  zend_do_fcall_common_helper_SPEC(ZEND_OPCODE_HANDLER_ARGS)
{
    &hellip;&hellip;
    </span><span //</span><span  在argument_stack中压入2个值
    </span><span //</span><span  一个是参数个数（即opline->extended_value）
    </span><span //</span><span  一个是标识栈顶的NULL</span>
    zend_ptr_stack_2_push(&EG(argument_stack), (<span void</span> *)(zend_uintptr_t)opline-><span extended_value, NULL);
    &hellip;&hellip;
    </span><span if</span> (EX(function_state).function->type ==<span  ZEND_INTERNAL_FUNCTION) {
        &hellip;&hellip;
    }
    </span><span else</span> <span if</span> (EX(function_state).function->type ==<span  ZEND_USER_FUNCTION) {
        &hellip;&hellip;
        </span><span //</span><span  调用foo函数</span>
<span         zend_execute(EG(active_op_array) TSRMLS_CC);
    }
    </span><span else</span> { <span /*</span><span  ZEND_OVERLOADED_FUNCTION </span><span */</span><span 
        &hellip;&hellip;
    }
    &hellip;&hellip;
    </span><span //</span><span  清理<span argument_stack</span></span>
<span     zend_ptr_stack_clear_multiple(TSRMLS_C);
    &hellip;&hellip;
    ZEND_VM_NEXT_OPCODE();
}</span>

登录后复制

压入参数个数和NULL之后，用于foo调用的整个argument_stack已然完成。

获取参数

继续跟进上面的例子。让我们深入到foo函数，看看foo的opcode是什么样子的。

line     # *  op                           fetch          ext  return  operands
---------------------------------------------------------------------------------
   3     0  >   RECV                                                      OP1[  IS_CONST (0) 1 ]
   4     1      SEND_VAL                                                  OP1[  IS_CONST (5) 123 ]
         2      DO_FCALL                                      1           OP1[  IS_CONST (459027) 'print_r' ]
   5     3    > RETURN                                                    OP1[  IS_CONST (0) null ]

登录后复制

第一条指令是RECV，从字面上理解便是用于获取栈中参数的。实际上，SEND_VAL和RECV有点对应的感觉。每次函数调用之前SEND_VAL，在函数内部进行RECV。为什么不说是完全对应，实际上RECV指令并非一定需要。只有当用户定义的函数被调用是，才会产生RECV。我们编写的扩展函数，php自带的内建函数，都不会有RECV。

需要额外指出的是，每次SEND_VAL和RECV 均只能处理一个参数。也就是说如果传参的过程中有多个参数，那么会产生若干SEND_VAL以及若干RECV。这里引出一个很有趣的话题，传入参数和获取参数的顺序是怎样的呢？

答案是，SEND_VAL会将参数从左至右的进行压栈，而RECV一样的从左至右获取参数。

<span static</span> <span int</span><span  ZEND_RECV_SPEC_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
{
    &hellip;&hellip;</span><span //</span><span  param拿参数的顺序是沿着栈顶-->栈底</span>
    <span if</span> (zend_ptr_stack_get_arg(arg_num, (<span void</span> **) &param TSRMLS_CC)==<span FAILURE) {
        &hellip;&hellip;
    } </span><span else</span><span  {
        zend_free_op free_res;
        zval </span>**<span var_ptr;

        </span><span //</span><span  验证参数</span>
        zend_verify_arg_type((zend_function *) EG(active_op_array), arg_num, *<span param TSRMLS_CC);
        var_ptr </span>= get_zval_ptr_ptr(&opline->result, EX(Ts), &<span free_res, BP_VAR_W);
        
        </span><span //</span><span  获取参数</span>
        <span if</span> (PZVAL_IS_REF(*<span param)) {
            zend_assign_to_variable_reference(var_ptr, param TSRMLS_CC);
        } </span><span else</span><span  {
            zend_receive(var_ptr, </span>*<span param TSRMLS_CC);
        }
    }

    ZEND_VM_NEXT_OPCODE();
}</span>

登录后复制

zend_assign_to_variable_reference 和 zend_receive 都会完成“获取参数” 。“获取参数”不太好理解，实际它究竟是做哪些事情呢？

说到底很简单，“获取参数”就是将这个参数添加到当前函数执行期间的“符号表”中，具体对应为EG(current_execute_data)->symbol_table。本示例中，RECV完成之后，函数体内的symbol_table中有了一个符号‘str’，它的值为“hello world”。

但argument_stack并没有发生一丝变化，因为RECV仅仅是读取参数，而不会对栈产生类似pop操作。

清理argument_stack

foo内部的print_r也是一个函数调用，因此也会产生压栈-->清栈的操作。因此print_r执行之前的argument_stack为：

print_r执行之后argument_stack又回到了foo刚RECV完的状态。

具体调用print_r的过程并非本文阐述的重点。我们关心的是当调用foo结束之后，php是如何清理argument_stack的。

上面展示的do_fcall代码片段中可以看出，清理工作由

<span static</span> inline <span void</span><span  zend_ptr_stack_clear_multiple(TSRMLS_D)
{
    </span><span void</span> **p = EG(argument_stack).top_element-<span 2</span><span ;
    </span><span //</span><span  取栈顶保存的参数个数</span>
    <span int</span> delete_count = (<span int</span>)(zend_uintptr_t) *<span p; 
    EG(argument_stack).top </span>-= (delete_count+<span 2</span><span );
    
    </span><span //</span><span  从上至下，依次清理</span>
    <span while</span> (--delete_count>=<span 0</span><span ) {
        zval </span>*q = *(zval **)(--<span p);
        </span>*p =<span  NULL;
        zval_ptr_dtor(</span>&<span q);
    }
    EG(argument_stack).top_element </span>=<span  p;
}</span>

登录后复制

注意这里清理栈中zval指针，使用的是zval_ptr_dtor。zval_ptr_dtor会将refcount减1，一旦refcount减为0，则保存该变量的内存区域会被真正的回收掉。

在本文示例中，foo调用完毕之后，保存“hello world”的zval状态为：

value        "hello world"
refcount     1
type         6
is_ref       0

登录后复制

由于refcount只剩1，因此，zval_ptr_dtor会将“hello world”真正从内存中销毁。

消栈完毕之后的argument_stack内存状态为：

可以看出上图中的argument_stack与刚被初始化之后是一样的。此时argument_stack真正做好了迎接下一次函数调用的准备。

回到文章刚开始的问题...

为何无需free(str)呢？弄明白了argument_stack之后就很好理解这个问题了。

因为str指向的是zval中实际存放“hello world”的内存地址。假设扩展函数如下：

<span PHP_FUNCTION(test)
{
    </span><span char</span>*<span   str;
    </span><span int</span><span     str_len;

    </span><span if</span> (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, <span "</span><span s</span><span "</span>, &str, &str_len) ==<span  FAILURE) {
        RETURN_FALSE;
    }

    str[</span><span 0</span>] = <span '</span><span H</span><span '</span><span ;
}</span>

登录后复制

则调用

$a = <span "</span><span hello world</span><span "</span><span ;
test($a);
echo $a;</span>

登录后复制

会输出“Hello world”。尽管我们调用test的时候，并非是传$a的引用，但实际效果相当于test(&$a)。

简单来说，内存中只有一份$a，不管是CV数组中，还是在argument_stack中。而zend_parse_parameters并没有拷贝一份数据用于函数执行，事实上它也不能这么做。因此，当函数完毕之后，如果没有其他地方会用到$a，php清理argument_stack时会帮我们free。如果仍然其他代码在使用，就更加不能手动free了，否则会破坏$a的内存区域。

需要注意的是，并非写扩展函数中用到的每个变量，php都会自动回收。所以该free的时候，切勿手软:)

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn