オンラインの解決策には、クロール後に iconv() を使用してトランスコードするように記載されています。それを読んだ後、私は何かが間違っていると感じました。1 つは、iconv ライブラリがコンパイルされていない可能性があることです。そして、より大きな問題は、エンコーディングがストリーム変換に関連していることです (iconv が使用されている場合、PHP は実際にコードを 2 回変換します: stream -> UTF-8 -> GB2312): この忙しい作業は無駄ではありませんか?
私は PHP のドキュメントを注意深く読みました (みんながどのようにコードを書いているかはわかりませんが、ドキュメントは非常に明確です)。fopen() と file_get_contents() については、「デフォルトは UTF-8 ですが、ユーザーは」と述べています。 Unicode セマンティクスが有効な場合、読み取られたデータのデフォルトのエンコーディングは UTF-8 です。カスタム コンテキストを作成するか、stream_default_encoding () を使用してデフォルトを変更することで、別のエンコーディングを指定できます。そこで、 stream_default_encoding('gb2312'); を使用してテストしました。 しかし、この関数は存在しませんか? ! php6のみ対応しているようです。ただし、確実なパスはなく、使用できる「ユーザー定義のコンテキスト属性」もあります。
ドキュメントをもっと注意深く読んだ後、私は最終的にこの問題を解決しました: