コミュニティ

学ぶ

ツールライブラリ

AIツール

レジャー

日本語

ホームページ > バックエンド開発 > Python チュートリアル > Python クローラーが 403 エラーを返す解決策

Python クローラーが 403 エラーを返す解決策

伊谢尔伦

リリース： 2017-04-29 10:05:50

オリジナル

6585 人が閲覧しました

問題

データをクロールするとき、通常、デバッグ情報は次のとおりです:

DEBUG: Crawled (200) <GET http://www.php.cn/> (referer: None)

ログイン後にコピー

DEBUG: Crawled (403) <GET http://www.php.cn/> (referer: None)

ログイン後にコピー

が表示される場合、Web サイトが Web クローリング防止技術 (Amazon が使用) を使用していることを意味します。ユーザーエージェントを確認するのは比較的簡単です。 (ユーザーエージェント) 情報。

解決策

以下に示すように、リクエストヘッダーでユーザーエージェントを構築します:

def start_requests(self):  
    yield Request("http://www.php.cn/",  
                  headers={&#39;User-Agent&#39;: "your agent string"})

ログイン後にコピー

以上がPython クローラーが 403 エラーを返す解決策の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル：

Python，403错误

前の記事：Pythonを学ぶと何ができるようになるのでしょうか？次の記事：Python は文字列配列内の機密単語をフィルターで除外します

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

著者別の最新記事

php obキャッシュの紹介とob関数の詳細説明

2023-03-07 21:36:01
cmdコマンドを使用してMySQLのパスワードを変更する方法

1970-01-01 08:00:00
JavaScript が Cookie を操作してユーザーログインコード例を実装する方法の詳細な説明

1970-01-01 08:00:00
phpクラスとは何ですか? phpクラスの属性の詳細説明

2023-03-11 13:22:01
基本的な JavaScript 関数 debounce、poll、once インスタンスの使用方法の詳細な説明

1970-01-01 08:00:00
php7の関数、宣言、戻り値などの新機能の紹介。

2023-03-11 15:08:02
php array_keys()を使用して配列キー名を取得する方法の詳細な説明

2023-03-12 07:44:02
PHPはリフレッシュバッファ関数の使い方を深く理解しています

2023-03-11 10:18:01
JavaScriptの関数の使い方と戻り値の使用例を詳しく解説

1970-01-01 08:00:00
Django がデータベースにクエリを実行するときのさまざまな種類の並べ替えの導入

1970-01-01 08:00:00

最新の問題

php - guzzlehttp/guzzle 错误

から 1970-01-01 08:00:00

0

0

0

nginx - Tengine が 403 Forbidden エラーを報告する

から 1970-01-01 08:00:00

0

0

0

javascript - npm を使用して Node-Sass をインストールすると常にエラーが発生するのはなぜですか?

から 1970-01-01 08:00:00

0

0

0

「限界」の意味を説明してください。

から 1970-01-01 08:00:00

0

0

0

！ =これは不等号ではないですか?なぜ乗算なのか

から 1970-01-01 08:00:00

0

0

0

関連トピック

詳細>

人気のおすすめ

人気のチュートリアル

詳細>

関連するチュートリアル

人気のおすすめ

最新のコース

最新のダウンロード

詳細>

ウェブエフェクト

公式サイト

サイト素材

フロントエンドテンプレート