首頁 後端開發 php教程 Curl 采摘乱码与采集不到 PHP

Curl 采摘乱码与采集不到 PHP

Jun 13, 2016 am 11:18 AM
curl data nbsp substr

Curl 采集乱码与采集不到 PHP
PHP程序是用gbk2312编码的:

$url = "http://www.sina.com.cn";//gbk2312编码
//$url = "http://www.163.com";//gbk2312编码
//$url = "http://www.sohu.com";//gbk2312编码
 

  $ch = curl_init($url);
  curl_setopt($ch, CURLOPT_RETURNTRANSFER , true);//返回获取的输出的文本流
  $ret = curl_exec($ch);
  curl_setopt($ch, CURLOPT_TIMEOUT, 1);
  curl_close($ch);
   echo $ret;

?>

在采集sina.com.cn时,是正常的,但是采集163.com时是为空的,采集sohu.com时是丢码的.
这是怎么回事呢?如何解决?有哪位怎么呀?先谢谢了!!!没多少分了,不好意思。


------解决方案--------------------
别的不说,我就是来拿分的.楼主记得给全分

1

2

3

4

5

6

<br><br>$curl=curl_init('http://www.163.com');<br>curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);<br>curl_setopt($curl,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)');<br>$html=curl_exec($curl);<br>var_dump($html);<br><br><br>$curl=curl_init('http://www.sohu.com');<br>curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);<br>curl_setopt($curl,CURLOPT_USERAGENT,'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)');<br>$html=curl_exec($curl);<br>//$html=strstr($html,'$html=gzdecode($html);<br>var_dump($html);<br><br><br>function gzdecode($data) {   <br>  $len strlen($data);   <br>  if ($len <font color="#FF8000">------解决方案--------------------</font><br> strcmp(substr($data,0,2),"\x1f\x8b")) {   <br>   return null;  // Not GZIP format (See RFC 1952)   <br>  }   <br>  $method = ord(substr($data,2,1));  // Compression method   <br>  $flags  = ord(substr($data,3,1));  // Flags   <br>  if ($flags &amp; 31 != $flags) {   <br>   // Reserved bits are set -- NOT ALLOWED by RFC 1952   <br>   return null;   <br>  }   <br>  // NOTE: $mtime may be negative (PHP integer limitations)   <br>  $mtime = unpack("V"substr($data,4,4));   <br>  $mtime $mtime[1];   <br>  $xfl  substr($data,8,1);   <br>  $os    substr($data,8,1);   <br>  $headerlen = 10;   <br>  $extralen  = 0;   <br>  $extra    "";   <br>  if ($flags &amp; 4) {   <br>   // 2-byte length prefixed EXTRA data in header   <br>   if ($len $headerlen - 2      return false;    // Invalid format   <br>   }   <br>   $extralen = unpack("v",substr($data,8,2));   <br>   $extralen $extralen[1];   <div class="clear">

                  

               

               

         

            </div>

登入後複製
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱門文章

倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章

倉庫:如何復興隊友
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 週前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒險:如何獲得巨型種子
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱門文章標籤

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

解決方法:您的組織要求您更改 PIN 碼 解決方法:您的組織要求您更改 PIN 碼 Oct 04, 2023 pm 05:45 PM

解決方法:您的組織要求您更改 PIN 碼

Windows 11 上調整視窗邊框設定的方法:變更顏色和大小 Windows 11 上調整視窗邊框設定的方法:變更顏色和大小 Sep 22, 2023 am 11:37 AM

Windows 11 上調整視窗邊框設定的方法:變更顏色和大小

如何在 Windows 11 上變更標題列顏色? 如何在 Windows 11 上變更標題列顏色? Sep 14, 2023 pm 03:33 PM

如何在 Windows 11 上變更標題列顏色?

OOBELANGUAGE錯誤Windows 11 / 10修復中出現問題的問題 OOBELANGUAGE錯誤Windows 11 / 10修復中出現問題的問題 Jul 16, 2023 pm 03:29 PM

OOBELANGUAGE錯誤Windows 11 / 10修復中出現問題的問題

Windows 11 上啟用或停用工作列縮圖預覽的方法 Windows 11 上啟用或停用工作列縮圖預覽的方法 Sep 15, 2023 pm 03:57 PM

Windows 11 上啟用或停用工作列縮圖預覽的方法

Windows 11 上的顯示縮放比例調整指南 Windows 11 上的顯示縮放比例調整指南 Sep 19, 2023 pm 06:45 PM

Windows 11 上的顯示縮放比例調整指南

10種在 Windows 11 上調整亮度的方法 10種在 Windows 11 上調整亮度的方法 Dec 18, 2023 pm 02:21 PM

10種在 Windows 11 上調整亮度的方法

python中CURL和python requests的相互轉換如何實現 python中CURL和python requests的相互轉換如何實現 May 03, 2023 pm 12:49 PM

python中CURL和python requests的相互轉換如何實現

See all articles