php - snoopy crawler melaporkan ralat 405 Tidak Dibenarkan
高洛峰
高洛峰 2017-05-16 12:58:40
0
2
613

Kod

$httpClass = new Snoopy();
$httpClass->fetch('https://v.qq.com/');
$url = $httpClass->results;
print_r($url);mati();

Merangkak https://www.baidu.com/ terus melaporkan 405 ralat

Merangkak https://v.qq.com/ berjalan seperti biasa

Mencari jawapan, saya telah mengerjakannya sepanjang petang dan masih tidak dapat menyelesaikannya

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

membalas semua(2)
淡淡烟草味

Baidu mungkin mempunyai tetapan seperti perangkak Anda perlu menyamar dan mentakrifkan UA atau sesuatu seperti itu
Rujukan: http://www.4wei.cn/archives/396

Peter_Zhu

Ini bukan masalah jenis Snoopy. Ini kerana anda tidak tahu banyak tentang crawler. Oleh kerana terdapat crawler, sudah tentu akan ada teknologi anti-crawler. Yang paling mudah adalah berdasarkan pengecam penyemak imbas atau perujuk dalam pengepala permintaan, dsb. Tapak web besar seperti Baidu dan Tencent tidak mahu kami merangkak data, jadi mereka mesti telah mengambil banyak langkah pencegahan. Oleh itu, adalah disyorkan untuk memahami pengetahuan crawler sebelum merangkak data.

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan