Als ich fabpot/goutte (https://github.com/FriendsOfPHP/Goutte) zum Crawlen der Webseite verwendete, stellte ich fest, dass das Endergebnis unabhängig von der Codierung der Zielseite (gb2312 ...) Unicode ist.
Nach Recherchen habe ich herausgefunden, dass der Crawler von Symfony die Codierung von HTML-Entitäten aufruft.
mb_convert_encoding($content, 'HTML-ENTITIES', $charset);
Referenz
Eine numerische Zeichenreferenz in HTML verweist auf ein Zeichen anhand seines Universal Character Set/Unicode-Codepunkts
Das Obige hat die HTML-ENTITIES-Codierung eingeführt, einschließlich einiger Aspekte davon. Ich hoffe, dass es für Freunde hilfreich sein wird, die sich für PHP-Tutorials interessieren.