Rumah > pembangunan bahagian belakang > tutorial php > 如何解决php用file_get_contents方法抓取网页数据出现乱码

如何解决php用file_get_contents方法抓取网页数据出现乱码

零到壹度
Lepaskan: 2023-03-21 21:02:01
asal
3336 orang telah melayarinya

我们都经常碰到在抓取数据时碰到乱码现象,让人崩溃。今天主要和大家探讨如何解决php用file_get_contents方法抓取网页数据出现乱码的问题,需要的朋友可以参考下,希望能帮助到大家。下面跟随小编一起来看一下吧。

方法一:

       将$data=file_get_contents($url); 改成$data=file_get_contents("compress.zlib://".$url);即可。

       原因是网页内容是GZIP压缩的。

方法二:

    用curl方法抓取,

    定义一个函数

 function curl_get($url, $gzip=false)
 {
     $curl = curl_init($url);curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
     curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);
      if($gzip) curl_setopt($curl, CURLOPT_ENCODING, "gzip");
  // 关键在这里$content = curl_exec($curl);curl_close($curl);return $content;   
}
Salin selepas log masuk

    然后调用即可,$data = curl_get($url,false);

相关推荐:

用file_get_contents抓取网页乱码的2种解决方式

php file_get_contents抓取内容乱码 

php file_get_contents获取网页内容gzip编码导致的乱码

Atas ialah kandungan terperinci 如何解决php用file_get_contents方法抓取网页数据出现乱码. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Isu terkini
php - file_get_contents($url input json
daripada 1970-01-01 08:00:00
0
0
0
php - file_get_contents melaksanakan data POST, https
daripada 1970-01-01 08:00:00
0
0
0
Panggil berbilang API serentak dalam PHP
daripada 1970-01-01 08:00:00
0
0
0
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan