Beim Crawlen der Seite erscheinen verstümmelte Zeichen wie „������“, wie lässt sich das Problem lösen? Dieser Artikel teilt Ihnen hauptsächlich die Analyse der von PHP erfassten verstümmelten Seiten mit und hofft, allen zu helfen.
1. Konvertierungskodierung
2. Die Daten werden von gzip komprimiertstr, „utf-8“, „GBK“);
curl获取数据的时候设置添加下面的选项: curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
使用file_get_contents函数需要安装zlib库$data = file_get_contents("compress.zlib://".$url);
在顶部增加下面的代码header("Content-type: text/html; charset=utf-8");
PHP-Methode zum Abfangen chinesischer Zeichenfolgen, um verstümmeltes Parsen zu verhindern
Das obige ist der detaillierte Inhalt vonVerstümmelte Analyse der PHP-Erfassungsseite. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!