Python のリクエストを使用してブラウザ訪問をシミュレートする方法: ユーザー エージェントを偽装するためのガイド
Python のリクエストを使用して Web コンテンツを取得しようとするとき、またはwget を使用すると、標準のブラウザを使用した場合と比較して、予期しない結果が発生する可能性があります。これは、Web サイトでは自動クエリを防ぐための保護が実装されていることが多いためです。この課題を克服するには、User-Agent ヘッダーを提供してブラウザー訪問を偽装できます。
User-Agent ヘッダーの実装
ブラウザー訪問を偽装するには、次のようにします。リクエストに User-Agent ヘッダーを含める必要があります。このヘッダーは、使用されるブラウザーとデバイスのタイプを指定し、リクエストをより正当なユーザーのように見せます。 Python のリクエストを使用した例を次に示します。
import requests # Define the target website URL url = 'http://www.ichangtou.com/#company:data_000008.html' # Create a dictionary of headers with a valid User-Agent string headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'} # Send the request with the User-Agent header response = requests.get(url, headers=headers) # Print the response content print(response.content)
追加リソース
以上がPython のリクエストを使用してブラウザ訪問をシミュレートする方法: Python リクエストを実際のブラウザから送信されているように見せるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。