php - snoopy爬蟲報錯405 Not Allowed

Question

程式碼$httpClass = new Snoopy();$httpClass-&gt;fetch('https://v.qq.com/');$url = $httpClass-&gt;results;print_r($url);die();爬取https://www.baidu.com/就一直報405錯誤爬取https://v.qq.com/ 是正常運作...

淡淡烟草味 · Answer

百度估計是做了仿爬蟲的設定了，你要進行偽裝，定義一個UA之類的
參考： http://www.4wei.cn/archives/396

天蓬老师 · Answer

這個不是Snoopy類別的問題。是你不太了解爬蟲的相關知識。既然有爬蟲，當然就會有反爬蟲的技術。最簡單的就是基於瀏覽器標識或是請求頭header中的referer等等。百度和騰訊這種大站是不會想我們爬取數據的，一定做了很多防範措施。所以建議在爬取資料之前先了解下爬蟲的知識。