尝试使用 Python 的 requests 库解析网站时,可能会遇到“403 Forbidden”错误。此错误通常表示服务器由于缺乏适当的授权或权限而拒绝了您的请求。
请考虑以下代码:
<code class="python">url = 'http://worldagnetwork.com/' result = requests.get(url) print(result.content.decode())</code>
此代码尝试检索并解码指定 URL 的内容。但是,它会产生以下输出:
<code class="html"><html> <head><title>403 Forbidden</title></head> <body bgcolor="white"> <center><h1>403 Forbidden</h1></center> <hr><center>nginx</center> </body> </html></code>
在这种特定情况下,出现问题是因为服务器拒绝没有 User-Agent 标头的 GET 请求。 User-Agent 标头标识发送请求的浏览器或应用程序,这有助于服务器确定如何处理请求。
要解决此问题,请显式指定 User-Agent 标头在您的请求请求中。下面是一个示例:
<code class="python">import requests url = 'http://worldagnetwork.com/' headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'} result = requests.get(url, headers=headers) print(result.content.decode())</code>
通过将 User-Agent 标头设置为适当的值,您可以有效地模仿浏览器并成功检索网站的内容,如以下输出所示:
<code class="html"><!doctype html> <!--[...]--> <!--[...]--></code>
以上是如何修复 Python 请求中的'403 Forbidden”错误?的详细内容。更多信息请关注PHP中文网其他相关文章!