Traditionell kann der in PHP verwendete Referenzzählspeichermechanismus keine Speicherlecks mit zirkulären Referenzen verarbeiten. Allerdings verwendet PHP 5.3.0 den Synchronisationsalgorithmus im Artikel » Concurrent Cycle Collection in Reference Counted Systems, um dieses Speicherverlustproblem zu lösen.
Eine vollständige Erklärung des Algorithmus würde den Rahmen dieses Abschnitts etwas sprengen und es werden nur die Grundlagen vorgestellt. Zunächst müssen wir einige Grundregeln festlegen. Wenn die Referenzanzahl erhöht wird, wird sie weiterhin verwendet und landet natürlich nicht mehr im Müll. Wenn der Referenzzähler auf Null reduziert wird, wird der Variablencontainer gelöscht (frei). Das heißt, ein Müllzyklus findet nur dann statt, wenn der Referenzzähler auf einen Wert ungleich Null sinkt. Zweitens können Sie während eines Garbage-Zyklus herausfinden, welche Teile Garbage sind, indem Sie prüfen, ob die Referenzanzahl um 1 reduziert wird und welche Variablencontainer keine Referenzen haben.
Um zu vermeiden, dass alle Müllzyklen überprüft werden müssen, bei denen die Referenzanzahl reduziert werden kann, legt dieser Algorithmus alle möglichen Wurzeln (mögliche Wurzeln sind zval-Variablencontainer) im Root-Puffer (root Puffer) (lila markiert) wird dadurch auch sichergestellt, dass jeder mögliche Garbage Root nur einmal im Puffer vorkommt. Die Garbage Collection wird nur dann für alle verschiedenen Variablencontainer innerhalb des Puffers durchgeführt, wenn der Root-Puffer voll ist. Sehen Sie sich Schritt A im Bild oben an.
In Schritt B verwendet der Algorithmus eine Tiefensuche, um alle möglichen Wurzeln zu finden. Nachdem er sie gefunden hat, wird der Referenzzähler in jedem Variablencontainer um „1“ dekrementiert, um sicherzustellen, dass derselbe Variablencontainer nicht dekrementiert wird zweimal „1“, grau markiert, das von „1“ abgezogen wurde. In Schritt C verwendet der Algorithmus erneut eine Tiefensuche für jeden Wurzelknoten und prüft dabei den Referenzzähler jedes Variablencontainers. Wenn der Referenzzähler 0 ist, wird der Variablencontainer weiß (im Diagramm blau) markiert. Wenn der Referenzzähler größer als 0 ist, setzen Sie an dieser Stelle den Vorgang fort, bei dem die Tiefensuche verwendet wurde, um den Referenzzähler um „1“ zu verringern (d. h. den Referenzzähler um „1“ zu erhöhen) und markieren Sie sie dann erneut in Schwarz. Im letzten Schritt D durchläuft der Algorithmus den Root-Puffer, um die Variablencontainer-Wurzeln (Zval-Wurzeln) von dort zu entfernen und prüft gleichzeitig, ob Variablencontainer vorhanden sind, die im vorherigen Schritt weiß markiert wurden. Jeder weiß markierte Variablencontainer wird geleert.
Da Sie nun ein grundlegendes Verständnis dieses Algorithmus haben, schauen wir uns noch einmal an, wie er in PHP integriert ist. Standardmäßig ist der Garbage-Collection-Mechanismus von PHP aktiviert und es gibt eine php.ini-Einstellung, mit der Sie ihn ändern können: zend.enable_gc.
Wenn der Garbage-Collection-Mechanismus aktiviert ist, wird der oben beschriebene Schleifensuchalgorithmus jedes Mal ausgeführt, wenn der Root-Puffer voll ist. Der Root-Cache-Bereich hat eine feste Größe und kann 10.000 mögliche Roots speichern. Natürlich können Sie diesen 10.000-Wert ändern, indem Sie die Konstante GC_ROOT_BUFFER_MAX_ENTRIES in der PHP-Quelldatei Zend/zend_gc.c ändern und PHP dann neu kompilieren. Wenn die Garbage Collection deaktiviert ist, wird der Schleifensuchalgorithmus nie ausgeführt. Es ist jedoch möglich, dass der Root immer im Root-Puffer vorhanden ist, unabhängig davon, ob die Garbage Collection in der Konfiguration aktiviert ist.
Wenn der Garbage-Collection-Mechanismus ausgeschaltet ist und der Root-Puffer voller möglicher Roots ist, werden offensichtlich keine weiteren möglichen Roots aufgezeichnet. Mögliche Wurzeln, die nicht erfasst werden, werden von diesem Algorithmus nicht analysiert und verarbeitet. Wenn sie Teil eines zyklischen Referenzzyklus sind, werden sie niemals gelöscht und verursachen einen Speicherverlust.
Der Grund dafür, dass mögliche Roots auch dann aufgezeichnet werden, wenn die Garbage Collection nicht verfügbar ist, liegt darin, dass das Aufzeichnen möglicher Roots schneller ist, als jedes Mal zu überprüfen, ob die Garbage Collection aktiviert ist, wenn ein möglicher Root gefunden wird. Der Speicherbereinigungs- und Analysemechanismus selbst nimmt jedoch viel Zeit in Anspruch.
Zusätzlich zur Änderung der Konfiguration zend.enable_gc können Sie den Garbage-Collection-Mechanismus auch ein- und ausschalten, indem Sie die Funktionen gc_enable() bzw. gc_disable() aufrufen. Der Aufruf dieser Funktionen hat die gleiche Wirkung wie das Ändern von Konfigurationselementen, um den Garbage-Collection-Mechanismus zu aktivieren oder zu deaktivieren. Möglichkeit, eine regelmäßige Erfassung zu erzwingen, auch wenn der Root-Puffer möglicherweise nicht voll ist. Zu diesem Zweck können Sie die Funktion gc_collect_cycles() aufrufen. Diese Funktion gibt die Anzahl der mit diesem Algorithmus recycelten Zyklen zurück.
Der Grund für das Aktivieren und Deaktivieren der Garbage Collection und die autonome Initialisierung liegt darin, dass einige Teile Ihrer Anwendung möglicherweise zeitkritisch sind. In diesem Fall möchten Sie die Garbage Collection wahrscheinlich nicht verwenden. Wenn Sie die Garbage Collection für bestimmte Teile Ihrer Anwendung deaktivieren, besteht natürlich das Risiko möglicher Speicherlecks, da einige mögliche Roots möglicherweise nicht in den begrenzten Root-Puffer passen. Daher kann es sinnvoll sein, unmittelbar bevor Sie die Funktion gc_disable() aufrufen, um den Speicher freizugeben, zuerst die Funktion gc_collect_cycles() aufzurufen. Da dadurch alle möglichen Roots gelöscht werden, die im Root-Puffer gespeichert wurden, kann beim Ausschalten des Garbage-Collection-Mechanismus ein leerer Puffer übrig bleiben, um mehr Platz zum Speichern möglicher Roots zu haben.