Rumah > pembangunan bahagian belakang > masalah PHP > 如何解决php网页抓取乱码问题

如何解决php网页抓取乱码问题

藏色散人
Lepaskan: 2023-03-05 18:34:01
asal
2968 orang telah melayarinya

php网页抓取乱码的解决办法:1、使用“mbconvertencoding”转换编码;2、设置添加“curl_setopt($ch, CURLOPT_ENCODING, 'gzip');”选项;3、在顶部增加header代码。

如何解决php网页抓取乱码问题

推荐:《PHP视频教程

php 抓取页面乱码

在抓取页面的时候出现类似�������这样乱码解决方法如下

1、转换编码

str=mbconvertencoding(str, “utf-8”, “GBK”);
Salin selepas log masuk

2、数据经过gzip压缩

curl获取数据的时候设置添加下面的选项:

curl_setopt($ch, CURLOPT_ENCODING, 'gzip');
Salin selepas log masuk

使用file_get_contents函数需要安装zlib库

$data = file_get_contents("compress.zlib://".$url);
Salin selepas log masuk

3、获取数据后显示乱码

在顶部增加下面的代码

header("Content-type: text/html; charset=utf-8");
Salin selepas log masuk

Atas ialah kandungan terperinci 如何解决php网页抓取乱码问题. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan