84669 人が学習中
152542 人が学習中
20005 人が学習中
5487 人が学習中
7821 人が学習中
359900 人が学習中
3350 人が学習中
180660 人が学習中
48569 人が学習中
18603 人が学習中
40936 人が学習中
1549 人が学習中
1183 人が学習中
32909 人が学習中
scrapy を使用して Himalaya をクロールし、PC アドレスをクロールします。エントリ リンクの応答は問題ありませんが、その後の応答にはモバイル アドレスが表示されます。 。 。 。
スパイダーコードは次のとおりです:
コンソール出力:
middlewares.RotateUserAgentMiddleware を書きましたが、これは効果的で、出力内容も確認できます。
クロール防止メカニズムが作動しているのでしょうか?
ヘッダーにユーザーエージェントが設定されていないためです
リクエストヘッダーを慎重に設定してください。通常、モバイル端末かどうかの判断はユーザーエージェントに依存します何もせずにデータにアクセスできますが、これはターゲット Web サイトがホットリンク対策にあまり注意を払っていないことも示しています
ヘッダーにユーザーエージェントが設定されていないためです
リクエストヘッダーを慎重に設定してください。通常、モバイル端末かどうかの判断はユーザーエージェントに依存します
何もせずにデータにアクセスできますが、これはターゲット Web サイトがホットリンク対策にあまり注意を払っていないことも示しています