PC アクセスがモバイルアドレスの問題になっている#python#scrapy
淡淡烟草味
淡淡烟草味 2017-06-30 09:55:13
0
2
1059

scrapy を使用して Himalaya をクロールし、PC アドレスをクロールします。エントリ リンクの応答は問題ありませんが、その後の応答にはモバイル アドレスが表示されます。 。 。 。

スパイダーコードは次のとおりです:

リーリー

コンソール出力:

middlewares.RotateUserAgentMiddleware を書きましたが、これは効果的で、出力内容も確認できます。

クロール防止メカニズムが作動しているのでしょうか?

淡淡烟草味
淡淡烟草味

全員に返信(2)
小葫芦

ヘッダーにユーザーエージェントが設定されていないためです

いいねを押す +0
学霸

リクエストヘッダーを慎重に設定してください。通常、モバイル端末かどうかの判断はユーザーエージェントに依存します
何もせずにデータにアクセスできますが、これはターゲット Web サイトがホットリンク対策にあまり注意を払っていないことも示しています

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!