UnicodeEncodeError: „ASCII“-Codec kämpft mit Nicht-ASCII-Zeichen
Beim Abrufen von Text von verschiedenen Webseiten stoßen Sie möglicherweise auf das rätselhafte „ „UnicodeEncodeError“ weist darauf hin, dass der „ASCII“-Codec ein bestimmtes Zeichen nicht kodieren kann. Diese Inkonsistenz, bei der der Code auf einigen Seiten ohne Probleme funktioniert, auf anderen jedoch fehlschlägt, ist häufig auf das Vorhandensein von Nicht-ASCII-Zeichen zurückzuführen.
Im bereitgestellten Codeausschnitt tritt das Problem auf, wenn versucht wird, eine Unicode-Zeichenfolge zu konvertieren (enthält wahrscheinlich das Zeichen „ “) in die „ascii“-codierte Bytezeichenfolge. Allerdings kann „ascii“ dieses Zeichen nicht darstellen, was zum Fehler „Ordinalzahl nicht im Bereich (128)“ führt.
Beseitigung des Codierungsproblems
Um dieses Problem zu lösen Geben Sie die Praxis auf, str() zum Konvertieren von Unicode-Zeichenfolgen in codierten Text zu verwenden. Nutzen Sie stattdessen die Leistungsfähigkeit von .encode(), das die Zeichenfolge explizit mit der gewünschten Kodierung, z. B. UTF-8, kodiert.
Beispiel für eine Kodierungslösung:
p.agent_info = u' '.join((agent_contact, agent_telno)).encode('utf-8').strip()
Alternativ könnten Sie die Welt von Unicode vollständig nutzen, ausschließlich mit Unicode-Strings arbeiten und die Notwendigkeit von Kodierungs- und Dekodierungsvorgängen vermeiden.
Das obige ist der detaillierte Inhalt vonWarum löst mein Python-Code beim Codieren von Webseitentext einen UnicodeEncodeError aus?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!