Home > Backend Development > PHP Tutorial > Discuss PHP's garbage collection mechanism

Discuss PHP's garbage collection mechanism

coldplay.xixi
Release: 2023-04-08 22:24:01
forward
2695 people have browsed it

Discuss PHP's garbage collection mechanism

在平时php-fpm的时候,可能很少人注意php的变量回收,但是到swoole常驻内存开发后,就不得不重视这个了,因为在常驻内存下,如果不了解变量回收机制,可能就会出现内存泄露的问题,本文将一步步带你了解php的垃圾回收机制,让你写出的代码不再内存泄漏

写时复制

首先,php的变量复制用的是写时复制方式,举个例子. 

$a='仙士可'.time();
$b=$a;
$c=$a;
//这个时候内存占用相同,$b,$c都将指向$a的内存,无需额外占用
 
$b='仙士可1号';
//这个时候$b的数据已经改变了,无法再引用$a的内存,所以需要额外给$b开拓内存空间
 
$a='仙士可2号';
//$a的数据发生了变化,同样的,$c也无法引用$a了,需要给$a额外开拓内存空间
Copy after login

详细写时复制可查看:php写时复制

引用计数

既然变量会引用内存,那么删除变量的时候,就会出现一个问题了:

$a='仙士可';
$b=$a;
$c=$a;
//这个时候内存占用相同,$b,$c都将指向$a的内存,无需额外占用
 
$b='仙士可1号';
//这个时候$b的数据已经改变了,无法再引用$a的内存,所以需要额外给$b开拓内存空间
 
unset($c);
//这个时候,删除$c,由于$c的数据是引用$a的数据,那么直接删除$a?
Copy after login

很明显,当$c引用$a的时候,删除$c,不能把$a的数据直接给删除,那么该怎么做呢?

这个时候,php底层就使用到了引用计数这个概念

引用计数,给变量引用的次数进行计算,当计数不等于0时,说明这个变量已经被引用,不能直接被回收,否则可以直接回收,例如:

$a = '仙士可'.time();
$b = $a;
$c = $a;
 
xdebug_debug_zval('a');
xdebug_debug_zval('b');
xdebug_debug_zval('c');
 
$b='仙士可2号';
xdebug_debug_zval('a');
xdebug_debug_zval('b');
 
echo "脚本结束\n";
Copy after login

将输出:

a: (refcount=3, is_ref=0)='仙士可1578154814'
b: (refcount=3, is_ref=0)='仙士可1578154814'
c: (refcount=3, is_ref=0)='仙士可1578154814'
a: (refcount=2, is_ref=0)='仙士可1578154814'
b: (refcount=1, is_ref=0)='仙士可2号'
脚本结束
Copy after login

注意,xdebug_debug_zval函数是xdebug扩展的,使用前必须安装xdebug扩展

引用计数特殊情况

当变量值为整型,浮点型时,在赋值变量时,php7底层将会直接把值存储(php7的结构体将会直接存储简单数据类型),refcount将为0

$a = 1111;
$b = $a;
$c = 22.222;
$d = $c;
 
xdebug_debug_zval('a');
xdebug_debug_zval('b');
xdebug_debug_zval('c');
xdebug_debug_zval('d');
echo "脚本结束\n";
Copy after login

输出:

a: (refcount=0, is_ref=0)=1111
b: (refcount=0, is_ref=0)=1111
c: (refcount=0, is_ref=0)=22.222
d: (refcount=0, is_ref=0)=22.222
脚本结束
Copy after login

当变量值为interned string字符串型(变量名,函数名,静态字符串,类名等)时,变量值存储在静态区,内存回收被系统全局接管,引用计数将一直为1(php7.3)

$str = '仙士可';    // 静态字符串

$str = '仙士可' . time();//普通字符串

$a = 'aa';
$b = $a;
$c = $b;
 
$d = 'aa'.time();
$e = $d;
$f = $d;
 
xdebug_debug_zval('a');
xdebug_debug_zval('d');
echo "脚本结束\n";

输出:

a: (refcount=1, is_ref=0)='aa'
d: (refcount=3, is_ref=0)='aa1578156506'
脚本结束
Copy after login

当变量值为以上几种时,复制变量将会直接拷贝变量值,所以将不存在多次引用的情况

引用时引用计数变化

如下代码:

$a = 'aa';
$b = &$a;
$c = $b;
 
xdebug_debug_zval('a');
xdebug_debug_zval('b');
xdebug_debug_zval('c');
echo "脚本结束\n";
Copy after login

将输出:

a: (refcount=2, is_ref=1)='aa'
b: (refcount=2, is_ref=1)='aa'
c: (refcount=1, is_ref=0)='aa'
脚本结束
Copy after login

当引用时,被引用变量的value以及类型将会更改为引用类型,并将引用值指向原来的值内存地址中.

之后引用变量的类型也会更改为引用类型,并将值指向原来的值内存地址,这个时候,值内存地址被引用了2次,所以refcount=2.

而$c并非是引用变量,所以将值复制给了$c,$c引用还是为1

详细引用计数知识,底层原理可查看:https://www.cnblogs.com/sohuhome/p/9800977.html

php生命周期

php将每个运行域作为一次生命周期,每次执行完一个域,将回收域内所有相关变量:

<?php
/**
 * Created by PhpStorm.
 * User: Tioncico
 * Date: 2020/1/6 0006
 * Time: 14:22
 */
 
echo "php文件的全局开始\n";
 
class A{
    protected $a;
    function __construct($a)
    {
        $this->a = $a;
        echo "类A{$this->a}生命周期开始\n";
    }
    function test(){
        echo "类test方法域开始\n";
        echo "类test方法域结束\n";
    }
//通过类析构函数的特性,当类初始化或回收时,会调用相应的方法
    function __destruct()
    {
        echo "类A{$this->a}生命周期结束\n";
        // TODO: Implement __destruct() method.
    }
}
 
function a1(){
    echo "a1函数域开始\n";
    $a = new A(1);
    echo "a1函数域结束\n";
    //函数结束,将回收所有在函数a1的变量$a
}
a1();
 
$a = new A(2);
 
echo "php文件的全局结束\n";
//全局结束后,会回收全局的变量$a
Copy after login

可看出,每个方法/函数都作为一个作用域,当运行完该作用域时,将会回收这里面的所有变量.

再看看这个例子:

echo "php文件的全局开始\n";
 
class A
{
    protected $a;
 
    function __construct($a)
    {
        $this->a = $a;
        echo "类{$this->a}生命周期开始\n";
    }
 
    function test()
    {
        echo "类test方法域开始\n";
        echo "类test方法域结束\n";
    }
 
//通过类析构函数的特性,当类初始化或回收时,会调用相应的方法
    function __destruct()
    {
        echo "类{$this->a}生命周期结束\n";
        // TODO: Implement __destruct() method.
    }
}
 
$arr = [];
$i = 0;
while (1) {
    $arr[] = new A(&#39;arr_&#39; . $i);
    $obj = new A(&#39;obj_&#39; . $i);
    $i++;
    echo "数组大小:". count($arr).&#39;\n&#39;;
    sleep(1);
//$arr 会随着循环,慢慢的变大,直到内存溢出
 
}
 
echo "php文件的全局结束\n";
//全局结束后,会回收全局的变量$a
Copy after login

全局变量只有在脚本结束后才会回收,而在这份代码中,脚本永远不会被结束,也就说明变量永远不会回收,$arr还在不断的增加变量,直到内存溢出.

内存泄漏

请看代码:

function a(){
    class A {
        public $ref;
        public $name;
 
        public function __construct($name) {
            $this->name = $name;
            echo($this->name.&#39;->__construct();&#39;.PHP_EOL);
        }
 
        public function __destruct() {
            echo($this->name.&#39;->__destruct();&#39;.PHP_EOL);
        }
    }
 
    $a1 = new A(&#39;$a1&#39;);
    $a2 = new A(&#39;$a2&#39;);
    $a3 = new A(&#39;$3&#39;);
 
    $a1->ref = $a2;
    $a2->ref = $a1;
 
    unset($a1);
    unset($a2);
 
    echo(&#39;exit(1);&#39;.PHP_EOL);
}
a();
echo(&#39;exit(2);&#39;.PHP_EOL);
Copy after login

当$a1和$a2的属性互相引用时,unset($a1,$a2) 只能删除变量的引用,却没有真正的删除类的变量,这是为什么呢?

首先,类的实例化变量分为2个步骤,1:开辟类存储空间,用于存储类数据,2:实例化一个变量,类型为class,值指向类存储空间.

当给变量赋值成功后,类的引用计数为1,同时,a1->ref指向了a2,导致a2类引用计数增加1,同时a1类被a2->ref引用,a1引用计数增加1

当unset时,只会删除类的变量引用,也就是-1,但是该类其实还存在了一次引用(类的互相引用),

这将造成这2个类内存永远无法释放,直到被gc机制循环查找回收,或脚本终止回收(域结束无法回收).

手动回收机制

在上面,我们知道了脚本回收,域结束回收2种php回收方式,那么可以手动回收吗?答案是可以的.

手动回收有以下几种方式:

unset,赋值为null,变量赋值覆盖,gc_collect_cycles函数回收

unset

unset为最常用的一种回收方式,例如:

class A
{
    public $ref;
    public $name;
 
    public function __construct($name)
    {
        $this->name = $name;
        echo($this->name . &#39;->__construct();&#39; . PHP_EOL);
    }
 
    public function __destruct()
    {
        echo($this->name . &#39;->__destruct();&#39; . PHP_EOL);
    }
}
 
$a = new A(&#39;$a&#39;);
$b = new A(&#39;$b&#39;);
unset($a);
//a将会先回收
echo(&#39;exit(1);&#39; . PHP_EOL);
//b需要脚本结束才会回收
Copy after login

输出:

$a->__construct();
$b->__construct();
$a->__destruct();
exit(1);
$b->__destruct();
Copy after login

unset的回收原理其实就是引用计数-1,当引用计数-1之后为0时,将会直接回收该变量,否则不做操作(这就是上面内存泄漏的原因,引用计数-1并没有等于0)

=null回收

class A
{
    public $ref;
    public $name;
 
    public function __construct($name)
    {
        $this->name = $name;
        echo($this->name . &#39;->__construct();&#39; . PHP_EOL);
    }
 
    public function __destruct()
    {
        echo($this->name . &#39;->__destruct();&#39; . PHP_EOL);
    }
}
 
$a = new A(&#39;$a&#39;);
$b = new A(&#39;$b&#39;);
$c = new A(&#39;$c&#39;);
unset($a);
$c=null;
xdebug_debug_zval(&#39;a&#39;);
xdebug_debug_zval(&#39;b&#39;);
xdebug_debug_zval(&#39;c&#39;);
 
echo(&#39;exit(1);&#39; . PHP_EOL);
Copy after login

=null和unset($a),作用其实都为一致,null将变量值赋值为null,原先的变量值引用计数-1,而unset是将变量名从php底层变量表中清理,并将变量值引用计数-1,唯一的区别在于,=null,变量名还存在,而unset之后,该变量就没了:

$a->__construct();
$b->__construct();
$c->__construct();
$a->__destruct();
$c->__destruct();
a: no such symbol //$a已经不在符号表
b: (refcount=1, is_ref=0)=class A { public $ref = (refcount=0, is_ref=0)=NULL; public $name = (refcount=1, is_ref=0)=&#39;$b&#39; }
c: (refcount=0, is_ref=0)=NULL  //c还存在,只是值为null
exit(1);
$b->__destruct();
Copy after login

变量覆盖回收

通过给变量赋值其他值(例如null)进行回收:

class A
{
    public $ref;
    public $name;
 
    public function __construct($name)
    {
        $this->name = $name;
        echo($this->name . &#39;->__construct();&#39; . PHP_EOL);
    }
 
    public function __destruct()
    {
        echo($this->name . &#39;->__destruct();&#39; . PHP_EOL);
    }
}
 
$a = new A(&#39;$a&#39;);
$b = new A(&#39;$b&#39;);
$c = new A(&#39;$c&#39;);
$a=null;
$c= &#39;练习时长两年半的个人练习生&#39;;
xdebug_debug_zval(&#39;a&#39;);
xdebug_debug_zval(&#39;b&#39;);
xdebug_debug_zval(&#39;c&#39;);
 
echo(&#39;exit(1);&#39; . PHP_EOL);
Copy after login

将输出:

$a->__construct();
$b->__construct();
$c->__construct();
$a->__destruct();
$c->__destruct();
a: (refcount=0, is_ref=0)=NULL
b: (refcount=1, is_ref=0)=class A { public $ref = (refcount=0, is_ref=0)=NULL; public $name = (refcount=1, is_ref=0)=&#39;$b&#39; }
c: (refcount=1, is_ref=0)=&#39;练习时长两年半的个人练习生&#39;
exit(1);
$b->__destruct();
Copy after login

可以看出,c由于覆盖赋值,将原先A类实例的引用计数-1,导致了$c的回收,但是从程序的内存占用来说,覆盖变量并不是意义上的内存回收,只是将变量的内存修改为了其他值.内存不会直接清空.

gc_collect_cycles

回到之前的内存泄漏章节,当写程序不小心造成了内存泄漏,内存越来越大,可是php默认只能脚本结束后回收,那该怎么办呢?我们可以使用gc_collect_cycles 函数,进行手动回收

function a(){
    class A {
        public $ref;
        public $name;
 
        public function __construct($name) {
            $this->name = $name;
            echo($this->name.&#39;->__construct();&#39;.PHP_EOL);
        }
 
        public function __destruct() {
            echo($this->name.&#39;->__destruct();&#39;.PHP_EOL);
        }
    }
 
    $a1 = new A(&#39;$a1&#39;);
    $a2 = new A(&#39;$a2&#39;);
 
    $a1->ref = $a2;
    $a2->ref = $a1;
 
    $b = new A(&#39;$b&#39;);
    $b->ref = $a1;
 
    echo(&#39;$a1 = $a2 = $b = NULL;&#39;.PHP_EOL);
    $a1 = $a2 = $b = NULL;
    echo(&#39;gc_collect_cycles();&#39;.PHP_EOL);
    echo(&#39;// removed cycles: &#39;.gc_collect_cycles().PHP_EOL);
    //这个时候,a1,a2已经被gc_collect_cycles手动回收了
    echo(&#39;exit(1);&#39;.PHP_EOL);
 
}
a();
echo(&#39;exit(2);&#39;.PHP_EOL);
Copy after login

输出:

$a1->__construct();
$a2->__construct();
$b->__construct();
$a1 = $a2 = $b = NULL;
$b->__destruct();
gc_collect_cycles();
$a1->__destruct();
$a2->__destruct();
// removed cycles: 4
exit(1);
exit(2);
Copy after login

注意,gc_colect_cycles 函数会从php的符号表,遍历所有变量,去实现引用计数的计算并清理内存,将消耗大量的cpu资源,不建议频繁使用

另外,除去这些方法,php内存到达一定临界值时,会自动调用内存清理(我猜的),每次调用都会消耗大量的资源,可通过gc_disable 函数,去关闭php的自动gc

推荐教程:《php教程

The above is the detailed content of Discuss PHP's garbage collection mechanism. For more information, please follow other related articles on the PHP Chinese website!

Related labels:
source:php100.com
Statement of this Website
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn
Popular Tutorials
More>
Latest Downloads
More>
Web Effects
Website Source Code
Website Materials
Front End Template