Python リクエストによるブラウザー訪問の偽装とユーザー エージェントの生成
特定のシナリオでは、ブラウザー経由でアクセスしたときに Web サイトの応答が異なる場合があります。対スクリプトベースのアプローチ。この問題を解決し、ブラウザーへのアクセスをシミュレートするには、Python のリクエスト ライブラリを使用して User-Agent ヘッダーを提供できます。
User-Agent ヘッダーは、Web サイトへのアクセスに使用されているブラウザーとオペレーティング システムを識別します。適切なユーザー エージェントを提供すると、リクエストが Firefox や Chrome などの実際のブラウザから送信されているとサーバーに思わせることができます。
その方法は次のとおりです:
import requests url = 'http://example.com/page.html' headers = {'User-Agent': 'Mozilla/5.0 ...'} response = requests.get(url, headers=headers) print(response.content)
Web でクエリを実行すると、ユーザー エージェント文字列の包括的なリストを見つけることができます。さらに、サードパーティ パッケージ「fake-useragent」を使用して、実世界のデータに基づいてランダムなユーザー エージェント文字列を生成できます。
以上がPython リクエストとユーザー エージェント ヘッダーを使用してブラウザー訪問をシミュレートするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。