Python - Scrapy は CNKI 応答の重複コンテンツをキャプチャします
黄舟
黄舟 2017-06-30 09:55:07
0
3
972

ページめくりを要求する URL をトラバースします

リーリー

結果として、応答リクエストは成功しましたが、内容は毎回同じです。これは最初のリクエストの内容です。ただし、Postman を使用してページ分割された URL を個別にリクエストすると、この問題は発生しません。 = = 禁止されたことはありますか? 以前はこのようなことはありませんでした

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全員に返信(3)
刘奇

次に、postman またはブラウザを使用するときに要求されるヘッダーと、scrapy を使用するときに要求されるヘッダーの違いを分析する必要があります

いいねを押す +0
三叔

アンチクロールによって認識されています

いいねを押す +0
洪涛

次のページが正しくクロールされているかどうかを確認するには、コンソールによって出力されたログを見てください
2017-06-29 09:26:13 [scrapy] DEBUG: からスクレイピングされました、
Pay最後のx (http:xx/page/x) が変わっているかどうかに注目してください

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート