Heim Backend-Entwicklung PHP-Tutorial [Python] Web Crawler (3): Ausnahmebehandlung und Klassifizierung von HTTP-Statuscodes

[Python] Web Crawler (3): Ausnahmebehandlung und Klassifizierung von HTTP-Statuscodes

Aug 08, 2016 am 09:27 AM
nbsp print quot urllib

Lassen Sie uns zunächst über die HTTP-Ausnahmebehandlung sprechen.
Wenn urlopen eine Antwort nicht verarbeiten kann, wird ein urlError generiert.
Allerdings treten gleichzeitig auch häufige Python-API-Ausnahmen wie ValueError, TypeError usw. auf.
HTTPError ist eine Unterklasse von urlError, die normalerweise in bestimmten HTTP-URLs generiert wird.

1.URLError
Normalerweise tritt URLError auf, wenn keine Netzwerkverbindung besteht (kein Routing zu einem bestimmten Server) oder der Server nicht existiert.

In diesem Fall verfügt die Ausnahme auch über das Attribut „reason“, bei dem es sich um ein Tupel handelt (kann als unveränderliches Array verstanden werden),

Enthält eine Fehlernummer und eine Fehlermeldung.

Lassen Sie uns eine urllib2_test06.py erstellen, um die Ausnahmebehandlung zu erleben:

[python]-Ansicht Klarschrift

  1. importieren urllib2
  2. req = urllib2.Request('http://www.baibai.com')
  3. versuchen: urllib2.urlopen(req)
  4. außer urllib2.URLError, e:
  5. print e.reason

Drücken Sie F5, Sie sehen den gedruckten Inhalt:

[Errno 11001] getaddrinfo failed

Mit anderen Worten, die Fehlernummer ist 11001 und der Inhalt ist getaddrinfo fehlgeschlagen


2.HTTPError
Jede HTTP-Antwortobjektantwort auf dem Server enthält einen numerischen „Statuscode“.

Manchmal zeigt der Statuscode an, dass der Server die Anfrage nicht abschließen kann. Der Standardhandler verarbeitet einen Teil dieser Antwort für Sie.

Zum Beispiel: Wenn die Antwort eine „Weiterleitung“ ist und der Client das Dokument von einer anderen Adresse erhalten muss, übernimmt urllib2 dies für Sie.

Bei anderen, die nicht verarbeitet werden können, generiert urlopen einen HTTP-Fehler.

Typische Fehler sind „404“ (Seite nicht gefunden), „403“ (Anfrage verboten) und „401“ (Anfrage mit Bestätigung).

Der HTTP-Statuscode gibt den Status der vom HTTP-Protokoll zurückgegebenen Antwort an.

Wenn der Client beispielsweise eine Anfrage an den Server sendet und die angeforderte Ressource erfolgreich abgerufen wurde, lautet der zurückgegebene Statuscode 200, was darauf hinweist, dass die Antwort erfolgreich war.

Wenn die angeforderte Ressource nicht vorhanden ist, wird normalerweise ein 404-Fehler zurückgegeben.

HTTP-Statuscodes werden normalerweise in 5 Typen unterteilt, beginnend mit fünf Zahlen von 1 bis 5 und bestehend aus dreistelligen Ganzzahlen:

-------------------------------------------------- --------------------------------------------------

200: Die Anfrage ist erfolgreich. Verarbeitungsmethode: Inhalt der Antwort abrufen und verarbeiten.

201: Die Anfrage ist abgeschlossen Dadurch wird eine neue Ressource erstellt. Der URI der neu erstellten Ressource kann in der Antwortentität abgerufen werden: Wird im Crawler nicht gefunden

202: Die Anfrage wird akzeptiert, die Verarbeitung jedoch nicht noch nicht abgeschlossen. Verarbeitungsmethode: Blockieren und Warten

204: Der Server hat die Anfrage erfüllt, aber es wurden keine neuen Informationen zurückgegeben. Wenn der Client ein Benutzeragent ist, muss er zu diesem Zweck seine eigene Dokumentansicht nicht aktualisieren. Verarbeitungsmethode: verwerfen

300: Dieser Statuscode wird nicht direkt von HTTP/1.0-Anwendungen verwendet, sondern nur als Standardinterpretation von Antworten vom Typ 3XX. Es sind mehrere angeforderte Ressourcen verfügbar. Verarbeitungsmethode: Wenn sie im Programm verarbeitet werden kann, wird sie weiterverarbeitet. Wenn sie im Programm nicht verarbeitet werden kann, wird sie verworfen
301: Der angeforderten Ressource wird eine permanente URL zugewiesen, sodass diese Ressource kann in Zukunft über diese URL aufgerufen werden. Verarbeitungsmethode: Weiterleitung zur zugewiesenen URL
302: Die angeforderte Ressource wird vorübergehend unter einer anderen URL gespeichert. Verarbeitungsmethode: Weiterleitung zur temporären URL

304 Die angeforderte Ressource wurde nicht aktualisiert. Verarbeitungsmethode: verwerfen

400 Ungültige Anforderung. Verarbeitungsmethode: verwerfen

401 Nicht autorisierte Verarbeitungsmethode: Verwerfen

403 Verbotene Verarbeitungsmethode: Verwerfen

404 Nicht gefunden Verarbeitungsmethode: Verwerfen

5XX Der Statuscode, der mit „5“ beginnt, zeigt an, dass der Server einen Fehler gefunden hat und die Anfrage nicht weiter ausführen kann: Verwerfen

------------------------------------------------------ -------- ------------------------------------------ -------- ---

Nachdem die HTTPError-Instanz generiert wurde, gibt es ein ganzzahliges „Code“-Attribut, das die vom Server gesendete relevante Fehlernummer darstellt .

FehlercodesFehlercodes
Da der Standardprozessor die Umleitung übernimmt (andere Zahlen als 300) und Zahlen im Bereich von 100 bis 299 einen Erfolg anzeigen, können Sie nur die Fehlernummern 400 sehen -599.
BaseHTTPServer.BaseHTTPRequestHandler.response ist ein sehr nützliches Antwortnummernwörterbuch, das alle vom HTTP-Protokoll verwendeten Antwortnummern anzeigt.

Wenn eine Fehlernummer generiert wird, gibt der Server eine HTTP-Fehlernummer und eine Fehlerseite zurück.

Sie können eine HTTPError-Instanz als Antwort des von der Seite zurückgegebenen Antwortobjekts verwenden.

Das bedeutet, dass es wie das Fehlerattribut auch die Methoden read, geturl und info enthält.

Erstellen wir eine urllib2_test07.py, um es zu erleben:

[Python]-Ansicht Klarschrift

  1. import urllib2
  2. req = urllib2.Request( 'http://bbs.csdn.net/callmewhy')
  3. Versuchen Sie es:
  4. urllib2.urlopen(req)
  5. außer urllib2.URLError, e:
  6. print e.code
  7. #print e.read()

Drücken Sie F5 und Sie können sehen, dass ein 404-Fehlercode ausgegeben wird, was bedeutet, dass diese Seite nicht gefunden wird.


3.Wrapping

Wenn Sie sich also auf HTTPError oder URLError vorbereiten möchten, gibt es zwei grundlegende Möglichkeiten . Es wird empfohlen, die zweite zu verwenden.

Erstellen wir eine urllib2_test08.py, um die erste Ausnahmebehandlungslösung zu demonstrieren:

[Python]-Ansicht Klarschrift

  1. from urllib2 import Request, urlopen, URLError, HTTPError  
  2.   
  3. req = Request('http://bbs.csdn.net/callmewhy')  
  4.   
  5. versuchen:  
  6.   
  7.     response = urlopen(req)  
  8.   
  9. außer HTTPError , e:  
  10.   
  11.     print 'Der Server konnte 't erfüllen die Anfrage.'  
  12.   
  13.     drucken 'Fehlercode: ', e.code  
  14.   
  15. außer URLError, e:  
  16.   
  17.     print 'Wir konnten keinen Server erreichen.' print 'Reason: '
  18. , e.reason  
  19.   else:  
  20.     print
  21.  'Keine Ausnahme angehoben.'  
  22.     # alles ist in Ordnung  
  23. 和其他语言相似,try之后捕获异常并且将其内容打印出来。
  24. 这里要注意的一点, außer HTTPError 必须在第一个否则außer URLError将同样接受到HTTPError .因为
  25. HTTPError是URLError的子类, 如果URLError在前面它会捕捉到所所有的URLError(包括HTTPError ).


我们建一个urllib2_test09.py来示范一下第二种异常处理的方案:


[python] view Klarschrift

  1. from urllib2 import Request, urlopen, URLError, HTTPError  
  2.   
  3. req = Request('http://bbs.csdn.net/callmewhy')  
  4.     
  5. versuchen:    
  6.     
  7.     response = urlopen(req)    
  8.     
  9. außer URLError , e:    
  10.   
  11.     if hasattr(e,  'code'):    
  12.     
  13.         drucken 'Der Server konnte die Anfrage nicht erfüllen.' >print 'Fehlercode: '
  14. , e.code    
  15.        elif hasattr(e, 'reason'
  16. ):    
  17.             drucken 'Wir konnten keinen Server erreichen.'
  18.     
  19.             drucken 'Grund: '
  20. , e .reason    
  21.         else
  22. :    
  23.     drucken
  24.  'Es wurde keine Ausnahme ausgelöst.'    
  25.     # alles ist in Ordnung    
  26. 以上就介绍了[Python]网络爬虫(三): 异常的处理和HTTP状态码的分类, 包括了方面的内容, 希望对P HP教程有兴趣的朋友有所帮助.
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Chat -Befehle und wie man sie benutzt
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Lösung: Ihre Organisation verlangt von Ihnen, dass Sie Ihre PIN ändern Lösung: Ihre Organisation verlangt von Ihnen, dass Sie Ihre PIN ändern Oct 04, 2023 pm 05:45 PM

Auf dem Anmeldebildschirm wird die Meldung „Ihre Organisation hat Sie gebeten, Ihre PIN zu ändern“ angezeigt. Dies geschieht, wenn das PIN-Ablauflimit auf einem Computer erreicht wird, der organisationsbasierte Kontoeinstellungen verwendet und die Kontrolle über persönliche Geräte hat. Wenn Sie Windows jedoch über ein persönliches Konto einrichten, sollte die Fehlermeldung im Idealfall nicht erscheinen. Obwohl dies nicht immer der Fall ist. Die meisten Benutzer, die auf Fehler stoßen, melden dies über ihre persönlichen Konten. Warum fordert mich meine Organisation auf, meine PIN unter Windows 11 zu ändern? Es ist möglich, dass Ihr Konto mit einer Organisation verknüpft ist. Ihr primärer Ansatz sollte darin bestehen, dies zu überprüfen. Die Kontaktaufnahme mit Ihrem Domain-Administrator kann hilfreich sein! Darüber hinaus können falsch konfigurierte lokale Richtlinieneinstellungen oder falsche Registrierungsschlüssel Fehler verursachen. Im Augenblick

So passen Sie die Fensterrahmeneinstellungen unter Windows 11 an: Farbe und Größe ändern So passen Sie die Fensterrahmeneinstellungen unter Windows 11 an: Farbe und Größe ändern Sep 22, 2023 am 11:37 AM

Windows 11 bringt frisches und elegantes Design in den Vordergrund; die moderne Benutzeroberfläche ermöglicht es Ihnen, feinste Details, wie zum Beispiel Fensterränder, zu personalisieren und zu ändern. In diesem Leitfaden besprechen wir Schritt-für-Schritt-Anleitungen, die Ihnen dabei helfen, eine Umgebung zu erstellen, die Ihrem Stil im Windows-Betriebssystem entspricht. Wie ändere ich die Fensterrahmeneinstellungen? Drücken Sie +, um die Einstellungen-App zu öffnen. WindowsIch gehe zu Personalisierung und klicke auf Farbeinstellungen. Farbänderung Fensterränder Einstellungen Fenster 11" Breite="643" Höhe="500" > Suchen Sie die Option Akzentfarbe auf Titelleiste und Fensterrändern anzeigen und schalten Sie den Schalter daneben um. Um Akzentfarben im Startmenü und in der Taskleiste anzuzeigen Um die Designfarbe im Startmenü und in der Taskleiste anzuzeigen, aktivieren Sie „Design im Startmenü und in der Taskleiste anzeigen“.

Wie ändere ich die Farbe der Titelleiste unter Windows 11? Wie ändere ich die Farbe der Titelleiste unter Windows 11? Sep 14, 2023 pm 03:33 PM

Standardmäßig hängt die Farbe der Titelleiste unter Windows 11 vom gewählten Dunkel-/Hell-Design ab. Sie können es jedoch in jede gewünschte Farbe ändern. In diesem Leitfaden besprechen wir Schritt-für-Schritt-Anleitungen für drei Möglichkeiten, wie Sie Ihr Desktop-Erlebnis ändern und personalisieren können, um es optisch ansprechend zu gestalten. Ist es möglich, die Farbe der Titelleiste von aktiven und inaktiven Fenstern zu ändern? Ja, Sie können die Farbe der Titelleiste aktiver Fenster mit der App „Einstellungen“ ändern, oder Sie können die Farbe der Titelleiste inaktiver Fenster mit dem Registrierungseditor ändern. Um diese Schritte zu lernen, fahren Sie mit dem nächsten Abschnitt fort. Wie ändere ich die Farbe der Titelleiste in Windows 11? 1. Drücken Sie in der App „Einstellungen“ +, um das Einstellungsfenster zu öffnen. WindowsIch gehe zu „Personalisierung“ und dann

OOBELANGUAGE-Fehlerprobleme bei der Reparatur von Windows 11/10 OOBELANGUAGE-Fehlerprobleme bei der Reparatur von Windows 11/10 Jul 16, 2023 pm 03:29 PM

Wird auf der Windows Installer-Seite „Ein Problem ist aufgetreten“ zusammen mit der Anweisung „OOBELANGUAGE“ angezeigt? Aufgrund solcher Fehler bricht die Installation von Windows manchmal ab. OOBE bedeutet Out-of-the-Box-Erlebnis. Wie aus der Fehlermeldung hervorgeht, handelt es sich hierbei um ein Problem im Zusammenhang mit der OOBE-Sprachauswahl. Sie müssen sich keine Sorgen machen, Sie können dieses Problem durch eine geschickte Bearbeitung der Registrierung über den OOBE-Bildschirm selbst lösen. Schnelllösung – 1. Klicken Sie unten in der OOBE-App auf die Schaltfläche „Wiederholen“. Dadurch wird der Prozess ohne weitere Probleme fortgesetzt. 2. Verwenden Sie den Netzschalter, um das Herunterfahren des Systems zu erzwingen. Nach dem Neustart des Systems sollte OOBE fortgesetzt werden. 3. Trennen Sie das System vom Internet. Schließen Sie alle Aspekte von OOBE im Offline-Modus ab

So aktivieren oder deaktivieren Sie die Vorschau von Miniaturansichten in der Taskleiste unter Windows 11 So aktivieren oder deaktivieren Sie die Vorschau von Miniaturansichten in der Taskleiste unter Windows 11 Sep 15, 2023 pm 03:57 PM

Miniaturansichten in der Taskleiste können Spaß machen, aber auch ablenken oder stören. Wenn man bedenkt, wie oft Sie mit der Maus über diesen Bereich fahren, haben Sie möglicherweise ein paar Mal versehentlich wichtige Fenster geschlossen. Ein weiterer Nachteil besteht darin, dass es mehr Systemressourcen verbraucht. Wenn Sie also nach einer Möglichkeit suchen, ressourceneffizienter zu arbeiten, zeigen wir Ihnen, wie Sie es deaktivieren können. Wenn Ihre Hardware-Spezifikationen jedoch dafür geeignet sind und Ihnen die Vorschau gefällt, können Sie sie aktivieren. Wie aktiviere ich die Miniaturvorschau der Taskleiste in Windows 11? 1. Tippen Sie in der App „Einstellungen“ auf die Taste und klicken Sie auf „Einstellungen“. Klicken Sie unter Windows auf „System“ und wählen Sie „Info“. Klicken Sie auf Erweiterte Systemeinstellungen. Navigieren Sie zur Registerkarte „Erweitert“ und wählen Sie unter „Leistung“ die Option „Einstellungen“ aus. Wählen Sie „Visuelle Effekte“

Anleitung zur Anzeigeskalierung unter Windows 11 Anleitung zur Anzeigeskalierung unter Windows 11 Sep 19, 2023 pm 06:45 PM

Wir alle haben unterschiedliche Vorlieben, wenn es um die Anzeigeskalierung unter Windows 11 geht. Manche Leute mögen große Symbole, andere mögen kleine Symbole. Wir sind uns jedoch alle einig, dass die richtige Skalierung wichtig ist. Eine schlechte Schriftartenskalierung oder eine Überskalierung von Bildern kann bei der Arbeit ein echter Produktivitätskiller sein. Sie müssen daher wissen, wie Sie sie anpassen können, um die Fähigkeiten Ihres Systems optimal zu nutzen. Vorteile des benutzerdefinierten Zooms: Dies ist eine nützliche Funktion für Personen, die Schwierigkeiten haben, Text auf dem Bildschirm zu lesen. Es hilft Ihnen, mehr gleichzeitig auf dem Bildschirm zu sehen. Sie können benutzerdefinierte Erweiterungsprofile erstellen, die nur für bestimmte Monitore und Anwendungen gelten. Kann dazu beitragen, die Leistung von Low-End-Hardware zu verbessern. Dadurch haben Sie mehr Kontrolle darüber, was auf Ihrem Bildschirm angezeigt wird. So verwenden Sie Windows 11

10 Möglichkeiten, die Helligkeit unter Windows 11 anzupassen 10 Möglichkeiten, die Helligkeit unter Windows 11 anzupassen Dec 18, 2023 pm 02:21 PM

Die Bildschirmhelligkeit ist ein wesentlicher Bestandteil der Nutzung moderner Computergeräte, insbesondere wenn Sie über einen längeren Zeitraum auf den Bildschirm schauen. Es hilft Ihnen, die Belastung Ihrer Augen zu reduzieren, die Lesbarkeit zu verbessern und Inhalte einfach und effizient anzuzeigen. Abhängig von Ihren Einstellungen kann es jedoch manchmal schwierig sein, die Helligkeit zu verwalten, insbesondere unter Windows 11 mit den neuen Änderungen an der Benutzeroberfläche. Wenn Sie Probleme beim Anpassen der Helligkeit haben, finden Sie hier alle Möglichkeiten, die Helligkeit unter Windows 11 zu verwalten. So ändern Sie die Helligkeit unter Windows 11 [10 Möglichkeiten erklärt] Benutzer eines einzelnen Monitors können die folgenden Methoden verwenden, um die Helligkeit unter Windows 11 anzupassen. Hierzu zählen sowohl Desktop-Systeme mit einem einzelnen Monitor als auch Laptops. Lasst uns beginnen. Methode 1: Verwenden Sie das Action Center. Das Action Center ist zugänglich

So beheben Sie den Aktivierungsfehlercode 0xc004f069 in Windows Server So beheben Sie den Aktivierungsfehlercode 0xc004f069 in Windows Server Jul 22, 2023 am 09:49 AM

Der Aktivierungsprozess unter Windows nimmt manchmal eine plötzliche Wendung und zeigt eine Fehlermeldung mit diesem Fehlercode 0xc004f069 an. Obwohl der Aktivierungsprozess online erfolgt, kann dieses Problem bei einigen älteren Systemen mit Windows Server auftreten. Führen Sie diese ersten Prüfungen durch. Wenn sie Ihnen bei der Aktivierung Ihres Systems nicht weiterhelfen, fahren Sie mit der Hauptlösung fort, um das Problem zu beheben. Problemumgehung – Schließen Sie die Fehlermeldung und das Aktivierungsfenster. Starten Sie dann Ihren Computer neu. Wiederholen Sie den Windows-Aktivierungsprozess noch einmal von Grund auf. Fix 1 – Aktivierung über das Terminal. Aktivieren Sie das Windows Server Edition-System über das CMD-Terminal. Stufe – 1 Überprüfen Sie die Windows Server-Version. Sie müssen überprüfen, welchen W-Typ Sie verwenden

See all articles