Anpassen des Benutzeragenten mit urllib2.urlopen
Heruntergeladene Webseiten zeigen häufig die Standardzeichenfolge des Benutzeragenten an. Es gibt jedoch Situationen, in denen die Änderung dieser Zeichenfolge von entscheidender Bedeutung ist. Die Frage deckt diesen Bedarf auf und sucht nach einer Lösung, um den Benutzeragenten während des Webseiten-Downloads zu ändern.
In Python 2.x dient urllib2.urlopen als Tool zum Öffnen einer Website und zum Abrufen ihres Inhalts. Die Antwort kann genutzt werden, um auf den Quellcode der Webseite zuzugreifen oder Verbindungen herzustellen. Allerdings ist die Anpassung des Benutzeragenten für urllib2.urlopen nicht sofort ersichtlich.
Die Lösung besteht darin, manuell einen Opener zu erstellen und den gewünschten Benutzeragenten im Header anzugeben. Dieser modifizierte Öffner kann dann zum Öffnen der Webseite verwendet werden, wie unten dargestellt:
<code class="python">opener = urllib2.build_opener() opener.addheaders = [('User-Agent', 'Mozilla/5.0')] response = opener.open('http://www.stackoverflow.com')</code>
Beachten Sie, dass die Benutzeragentenzeichenfolge gemäß RFC 2616 Abschnitt 14.43 großgeschrieben wird. Diese Änderung stellt sicher, dass die Webseite mit dem angegebenen Benutzeragenten heruntergeladen wird, was möglicherweise das wahrgenommene Verhalten des anfordernden Clients verändert.
Das obige ist der detaillierte Inhalt vonWie passt man den Benutzeragenten in Pythons urllib2.urlopen an?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!