Python クローラー Scrapy はプロキシ構成を使用します

高洛峰
リリース: 2016-10-17 13:56:57
オリジナル
2294 人が閲覧しました

Web サイトのコンテンツをクロールするときに発生する最も一般的な問題は、Web サイトに IP 制限があり、クロール防止機能があることです。最善の方法は、IP クロールをローテーションする (プロキシを追加する) ことです

Scrapy エージェントの設定方法について話しましょう。

をクロールします 1. Scrapy プロジェクトの下に新しい「middlewares.py」を作成します

2. プロジェクト設定ファイル (./pythontab/settings.py) に

を追加します

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート