PHP 학습을 위한 변수: 참조 이해

WBOY
풀어 주다: 2016-08-08 09:33:12
원래의
1068명이 탐색했습니다.

PHP 학습의 변수: 참조 이해.

PHP 참조(즉, 변수, 함수, 객체 등 앞에 앰퍼샌드를 추가하는 것) //가장 중요한 것은 참조된 변수를 삭제하는 것인데 단지 참조된 변수에 접근할 수 없다는 점입니다. 내용은 파괴되지 않습니다. PHP에서 참조의 의미는 다음과 같습니다. 다른 이름은 동일한 변수 내용에 액세스합니다.

이 기사의 주요 내용:

  1. 소개
  2. 심볼 테이블과 zval
  3. 인용원칙
  4. 원래 질문으로 돌아가기

1. 소개

오래전에 인용에 관한 글을 썼는데, 피상적으로 쓰여졌고 많은 원리가 명확하게 설명되지 않았습니다. 최근 Derick Rethans가 작성한 이전 보고서(집: http://derickrethans.nl/ Github: https://github.com/derickr)를 보다가 PHP 참조 메커니즘을 설명하는 기사를 발견했습니다. 이 PDF는 참조 카운팅, 참조 전달, 참조 반환, 전역 매개변수 등을 zval 및 기호 테이블의 관점에서 설명합니다. 이는 설명이 풍부하고 텍스트가 풍부하며 매우 흥미롭습니다. 시간이 있는 아이들에게 원작을 읽어보라고 권한다. 많은 이득이 있을 것이다.

더 이상 고민하지 말고 오늘의 주제에 대해 이야기해 보겠습니다.

우리는 많은 언어가 서로 다른 이름(또는 기호)을 사용하여 동일한 콘텐츠에 액세스할 수 있는 참조 메커니즘을 제공한다는 것을 알고 있습니다. PHP 매뉴얼의 참조 정의는 다음과 같습니다. "PHP의 참조는 동일한 변수의 내용에 다른 이름으로 액세스하는 것을 의미합니다. 이는 C의 포인터와 다릅니다. 대신 참조는 기호 테이블 별칭입니다." 즉, 참조 "바인딩"의 일부 형태가 구현됩니다. 예를 들어 우리가 흔히 접하는 이런 면접 질문이 대표적인 예입니다.

$a = array(1,2,3,4);
foreach($a as &$v){
     $v *= $v;
}

foreach($a as $v){
     echo $v;
}
로그인 후 복사

오늘은 이 질문의 결과는 차치하고, 오늘은 Derick Rethans 선배님의 발자취를 따라가며 인용의 미스터리를 차근차근 파헤쳐보겠습니다.

2. 심볼 테이블과 zval

원리 인용을 시작하기 전에 기사에 반복적으로 나타나는 용어에 대해 간략하게 설명해야 합니다. 가장 중요하고 중요한 것은 1. 기호 표 2. zval입니다.

1. 기호표

컴퓨터 언어는 인간과 기계 사이의 의사소통을 위한 도구이지만 안타깝게도 우리가 의존하고 자랑스러워하는 고급 언어는 컴퓨터에서 직접 실행할 수 없습니다. 왜냐하면 컴퓨터는 기계어의 어떤 형태만 이해할 수 있기 때문입니다. 이는 고급 언어가 컴퓨터에서 이해되고 실행되기 전에 컴파일(또는 해석) 과정을 거쳐야 함을 의미합니다. 이 과정에서 어휘분석, 구문분석, 의미분석, 중간코드 생성, 최적화 등 복잡한 과정이 많이 요구되며, 이러한 과정에서 컴파일러는 소스 프로그램에 나타나는 식별자(변수 등) 등의 정보를 반복적으로 사용할 수 있다. . 유형 확인, 의미 분석 단계의 의미 확인) 이 정보는 서로 다른 기호 테이블에 저장됩니다. 기호 테이블은 소스 프로그램에 있는 식별자의 이름과 속성 정보를 저장합니다. 이 정보에는 유형, 저장소 유형, 범위, 저장소 할당 정보 및 기타 추가 정보가 포함될 수 있습니다. 기호 테이블 항목을 효율적으로 삽입하고 쿼리하기 위해 많은 컴파일러 기호 테이블이 Hashtable을 사용하여 구현됩니다. 우리는 이를 간단히 다음과 같이 이해할 수 있습니다. 기호 테이블은 기호 이름과 기호의 다양한 속성을 저장하는 해시 테이블 또는 맵입니다. 예를 들어 프로그램의 경우:

$str = 'this is a test';

function foo( $a, $b ){
    $tmp = 12;
    return $tmp + $a + $b;
}
 
function to(){

}
로그인 후 복사

가능한 기호 테이블(실제 기호 테이블이 아님)은 다음과 같은 구조입니다.

우리는 심볼 테이블의 특정 구조에 주의를 기울이지 않습니다. 각 함수, 클래스, 네임스페이스 등에 고유한 독립적인 심볼 테이블이 있다는 것만 알면 됩니다(전역 심볼 테이블과 별개). 그러고보니 PHP 프로그래밍을 처음 시작했을 때, extract() 함수 매뉴얼을 읽다가 "에 대해 추출한 내용이 문득 생각났습니다. 배열에서 변수를 가져옵니다. "이 문장의 의미는 수수께끼이며, 선배들이 말한 것과도 같습니다. "그렇지 않습니다. extract($_POST)를 사용하는 것이 좋습니다. " 변수를 추출하기 위해 extract($_GET)를 제안하는 것에 대해 매우 고민하고 있습니다. 실제로 extract를 남용하면 심각한 보안 문제가 발생할 뿐만 아니라 현재 심볼 테이블(액티브 심볼 테이블)도 오염됩니다.

그러면 활성 심볼 테이블이란 무엇입니까?

  我们知道,PHP代码的执行过程中,几乎都是从全局作用域开始,依次扫描,顺序执行。如果遇到函数调用,则进入该函数的内部执行,该函数执行完毕之后会返回到调用程序继续执行。这意味着,必须要有某种机制用于区分不同阶段所要使用的符号表,否则就会造成编译和执行的错乱。Active symbol table便是用于标志当前活动的符号表(这时应该至少存在着全局的global symbol table和活动的active symbol table,通常情况下,active symbol table就是指global symbol table)。符号表并不是一开始就建立好的,而是随着编译程序的扫描不断添加和更新的。在进入函数调用时,zend(PHP的语言解释引擎)会创建该函数的符号表,并将active symbol table指向该符号表。也就是说,在任意时刻使用的的符号表都应该是当前的active symbol table。

  以上就是符号表的全部内容了,我们简单抽离一下其中的关键内容:

  1. 符号表记录了程序中符号的name-attribute对,这些信息对于编译和执行是至关重要的。
  2. 符号表类似一个map或者hashtable
  3. 符号表不是一开始就建立好的,而是不断添加和更新的过程。
  4. 活动符号表是一个指针,指向的是当前活动的符号表。

  更多的资料可以查看:

  1. http://www.scs.stanford.edu/11wi-cs140/pintos/specs/sysv-abi-update.html/ch4.symtab.html

  2. http://arantxa.ii.uam.es/~modonnel/Compilers/04_SymbolTablesI.pdf

2.       Zval

  在上一篇博客(PHP内核探索之变量(1)Zval)中,我们已经对zval的结构和基本原理有了一些了解。对zval不了解的童鞋可以先看看。为了方便阅读,我们再次贴出zval的结构:

<span>struct _zval_struct {
    zvalue_value value; </span><span>/*</span><span> value </span><span>*/</span><span> zend_uint refcount__gc; </span><span>/*</span><span> variable ref count </span><span>*/</span><span> zend_uchar type; </span><span>/*</span><span> active type </span><span>*/</span><span> zend_uchar is_ref__gc; </span><span>/*</span><span> if it is a ref variable </span><span>*/</span><span> };

typedef struct _zval_struct zval;</span>
로그인 후 복사

三、引用

1.  引用计数

  正如上节所言,zval是PHP变量底层的真正容器,为了节省空间,并不是每个变量都有自己独立的zval容器,例如对于赋值(assign-by-value)操作:$a = $b(假设$b,$a都不是引用型变量),Zend并不会为$b变量开辟新的空间,而是将符号表中a符号和b符号指向同一个zval。只有在其中一个变量发生变化时,才会执行zval分离的操作。这被称为COW(Copy-on-write)的机制,可以在一定程度上节省内存和提高效率。

  为了实现上述机制,需要对zval的引用状态做标记,zval的结构中,refcount__gc便是用于计数的,这个值记录了有多少个变量指向该zval, 在上述赋值操作中,$a=$b ,会增加原始的$b的zval的refcount值。关于这一点,上次(PHP内核探索之变量(1)Zval)已经做了详细的解释,这里不再赘述。

2.         函数传参

  在脚本执行的过程中,全局的符号表几乎是一直存在的,但除了这个全局的global symbol table,实际上还会生成其他的symbol table:例如函数调用的过程中,Zend会创建该函数的内部symbol table,用于存放函数内部变量的信息,而在函数调用结束后,会删除该symbol table。我们接下来以一个简单的函数调用为例,介绍一下在传参的过程中,变量和zval的状态变化,我们使用的测试脚本是:

function do_zval_test($s){
    $s = "change ";
    return $s;
}

$a = "before";
$b = do_zval_test($a);
로그인 후 복사

我们来逐步分析:

(1).   $a = "before";

  这会为$a变量开辟一个新的zval(refcount=1,is_ref=0),如下所示:

  

(2).   函数调用do_zval_test($a)

  由于函数的调用,Zend会为do_zval_test这个函数创建单独的符号表(其中包含该函数内部的符号s),同时,由于$s实际上是函数的形参,因此并不会为$s创建新的zval,而是指向$a的zval。这时,$a指向的zval的refcount应该为3(分别是$a,$s和函数调用堆栈):

a: (refcount=3, is_ref=0)='before func'
로그인 후 복사

  如下图所示:

                    

(3).函数内部执行$s = "change "

  由于$s的值发生了改变,因此会执行zval分离,为s专门copy生成一个新的zval:

 

(4).函数返回 return $s ; $b = do_zval_test($a).

  $b与$s共享zval(暂时),准备销毁函数中的符号表:

 

(5).   销毁函数中的符号表,回到Global环境中:

 

  这里我们顺便说一句,在你使用debug_zval_dump()等函数查看zval的refcount时,会令zval本身的refcount值加1,所以实际的refcount的值应该是打印出的refcount减1,如下所示:

$src = "string";
debug_zval_dump($src);
로그인 후 복사

结果是:

<span>string</span>(6) "string" refcount(2)
로그인 후 복사

3.         引用初探

同上,我们还是直接上代码,然后一步步分析(这个例子比较简单,为了完整性,我们还是稍微分析一下):

$a = "simple test";
$b = &a;
$c = &a;

$b = 42;
unset($c);
unset($b);
로그인 후 복사

则变量与zval的对应关系如下图所示:(由此可见,unset的作用仅仅是将变量从符号表中删除,并减少对应zval的refcount值)

 

上图中值得注意的最后一步,在unset($b)之后,zval的is_ref值又变成了0。

那如果是混合了引用(assign-by-reference)和普通赋值(assign-by-value)的脚本,又是什么情况呢?

我们的测试脚本:

(1). 先普通赋值后引用赋值

$a = "src";
$b = $a;
$c = &$b;
로그인 후 복사

具体的过程见下图:

 

(2). 先引用赋值后普通赋值

$a = "src";
$b = &$a;
$c = $a;
로그인 후 복사

具体过程见下图:

 

4.  传递引用

同样,向函数传递的参数也可以以引用的形式传递,这样可以在函数内部修改变量的值。作为实例,我们仍使用2(函数传参)中的脚本,只是参数改为引用的形式:

function do_zval_test(&$s){
    $s = "after";
    return $s;
}

$a = "before";
$b = do_zval_test($a);
로그인 후 복사

这与上述函数传参过程基本一致,不同的是,引用的传递使得$a的值发生了变化。而且,在函数调用结束之后 $a的is_ref恢复成0:

 

可以看出,与普通的值传递相比,引用传递的不同在于:

(1)     第3步 $s = "change";时,并没有为$s新建一个zval,而是与$a指向同一个zval,这个zval的is_ref=1。

(2)     还是第3步。$s = "change";执行后,由于zval的is_ref=1,因此,间接的改变了$a的值

5.  引用返回

  PHP支持的另一个特性是引用返回。我们知道,在C/C++中,函数返回值时,实际上会生成一个值的副本,而在引用返回时,并不会生成副本,这种引用返回的方式可以在一定程度上节省内存和提高效率。而在PHP中,情况并不完全是这样。那么,究竟什么是引用返回呢?PHP手册上是这么说的:"引用返回用在当想用函数找到引用应该被绑定在哪一个变量上面时",是不是一头雾水,完全不知所云?其实,英文手册上是这样描述的"Returning by reference is useful when you want to use a function to find to which variable a reference should be bound"。提取文中的主干和关键点,我们可以得到这样的信息:

(1).       引用返回是将引用绑定在一个变量上。

(2).       这个变量不是确定的,而是通过函数得到的(否者我们就可以使用普通的引用了)。

这其实也说明了引用返回的局限性:函数必须返回一个变量,而不能是一个表达式,否者就会出现类似下面的问题:

PHP Notice:  Only variable references should be returned by reference in xxx(参看PHP手册中的Note).
로그인 후 복사

那么,引用返回时如何工作的呢?例如,对于如下的例子:

function &find_node($key,&$tree){
    $item = &$tree[$key];
    return $item;
}  

$tree = array(1=>'one',2=>'two',3=>'three');
$node =& find_node(3,$tree);
$node ='new';
로그인 후 복사

Zend都做了哪些工作呢?我们一步步来看。

(1).    $tree = array(1=>'one',2=>'two',3=>'three')

同之前一样,这会在Global symbol table中添加tree这个symbol,并生成该变量的zval。同时,为数组$tree的每个元素都生成相应的zval:

tree: (refcount=1, is_ref=0)=<span>array ( </span>1 => (refcount=1, is_ref=0)='one',
    2 => (refcount=1, is_ref=0)='two',
    3 => (refcount=1, is_ref=0)=<span>'three'
)</span>
로그인 후 복사

如下图所示:

(2). find_node(3,&$tree)

  由于函数调用,Zend会进入函数的内部,创建该函数的内部symbol table,同时,由于传递的参数是引用参数,因此zval的is_ref被标志为1,而refcount的值增加为3(分别是全局tree,内部tree和函数堆栈):

 

(3)$item = &$tree[$key];

  由于item是$tree[$key]的引用(在本例的调用中,$key是3),因而更新$tree[$key]指向zval的is_ref和refcount值:

 

(4)return $item,并执行引用绑定:


(5)函数返回,销毁局部符号表。

  tree对应的zval的is_ref恢复了0,refcount=1,$tree[3]被绑定在了$node变量上,对该变量的任何改变都会间接更改$tree[3]:  

            

(6) 更改$node的值,会反射到$tree的节点上,$node ='new':

 

Note:为了使用引用返回,必须在函数定义和函数调用的地方都显式的使用&符号。

6.    Global关键字

PHP中允许我们在函数内部使用Global关键字引用全局变量(不加global关键字时引用的是函数的局部变量),例如:

$var = "outside";
function inside()
{
    $var = "inside";
    echo $var;
    global $var;
    echo $var;
}

inside();
로그인 후 복사

输出为insideoutside

我们只知道global关键字建立了一个局部变量和全局变量的绑定,那么具体机制是什么呢?

使用如下的脚本测试:

$var = "one";       
function update_var($value){
         global $var;
         unset($var);
         global $var;
         $var = $value;
}

update_var('four');
echo $var;
로그인 후 복사

具体的分析过程为:

(1).$var = 'one';

     同之前一样,这会在全局的symbol table中添加var符号,并创建相应的zval:

 

(2).update_var('four')

     由于直接传递的是string而不是变量,因而会创建一个zval,该zval的is_ref=0,ref_count=2(分别是形参$value和函数的堆栈),如下所示:

 

(3)global $var

  global $var这句话,实际上会执行两件事情:

    (1).在函数内部的符号表中插入局部的var符号

    (2).建立局部$var与全局变量$var之间的引用.

(4)unset($var);

     这里要注意的是,unset只是删除函数内部符号表中var符号,而不是删除全局的。同时,更新原zval的refcount值和is_ref引用标志(引用解绑):

 

(5).global $var

     同3,再次建立局部$var与全局的$var的引用:

 

(6)$var = $value;

  更改$var对应的zval的值,由于引用的存在,全局的$var的值也随之改变:

                  

(7)函数返回,销毁局部符号表(又回到最初的起点,但,一切已经大不一样了):

 

据此,我们可以总结出global关键字的过程和特性:

  1. 函数中声明global,会在函数内部生成一个局部的变量,并与全局的变量建立引用
  2. 函数中对global变量的任何更改操作都会间接更改全局变量的值。
  3. 函数unset局部变量不会影响global,而只是解除与全局变量的绑定。

四、回到最初的问题

现在,我们对引用已经有了一个基本的认识。让我们回到最初的问题:

$a = array(1,2,3);
foreach($a as &$v){
     $v *= $v;
}

foreach($a as $v){
     echo $v;
}
로그인 후 복사

这之中,究竟发生了什么事情呢?

(1).$a = array(1,2,3);

这会在全局的symbol table中生成$a的zval并且为每个元素也生成相应的zval:

 

(2).   foreach($a as &$v) {$v *= $v;}

这里由于是引用绑定,所以相当于对数组中的元素执行:

$v = &$a<span>[</span><span>0</span><span>]</span><span>; </span>$v = &$a<span>[</span><span>1</span><span>]</span><span>; </span>$v = &$a<span>[</span><span>2</span><span>]</span><span>;</span>
로그인 후 복사

执行过程如下:

我们发现,在这次的foreach执行完毕之后,$v = &$a[2].

(3)第二次foreach循环

foreach($a as $v){
     echo $v;
}
로그인 후 복사

这次因为是普通的assign-by-value的赋值形式,因此,类似与执行:

$v = $a<span>[</span><span>0</span><span>]</span><span>; </span>$v = $a<span>[</span><span>1</span><span>]</span><span>; </span>$v = $a<span>[</span><span>2</span><span>]</span><span>;</span>
로그인 후 복사

别忘了$v现在是$a[2]的引用,因此,赋值的过程会间接更改$a[2]的值。

过程如下:

因此,输出结果应该为144.

附:本文中的zval的调试方法。

如果要查看某一过程中zval的变化,最好的办法是在该过程的前后均加上调试代码。例如

$a = 123;
xdebug_debug_zval('a');
$b=&$a;
xdebug_debug_zval('a');
로그인 후 복사

配合画图,可以得到一个直观的zval更新过程。


以上就介绍了PHP学习之变量:理解引用,包括了PHP变量引用方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

관련 라벨:
원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿