


Wie konvertiert man HTML-Entitäten in Python in Unicode-Strings?
Nov 05, 2024 am 05:21 AMXML/HTML-Entitäten in einen Unicode-String in Python konvertieren
Frage: Wie kann ich einen String, der HTML-Entitäten enthält, in einen Unicode-String konvertieren? Python? Beispielsweise ist die Zeichenfolge „ǎ“ sollte in „ǎ“ mit einer Tonmarkierung (u'u01ce') konvertiert werden.
Antwort:
Der HTMLParser der Python-Standardbibliothek verfügt über eine undokumentierte Funktion namens unescape(). Diese Funktion kann HTML-Entitäten in ihre Unicode-Äquivalente konvertieren.
<code class="python">import HTMLParser h = HTMLParser.HTMLParser() h.unescape('&amp;copy; 2010') # u'\xa9 2010' h.unescape('&amp;#169; 2010') # u'\xa9 2010'</code>
Für Python 3.4 und höher funktioniert der folgende Code mit dem HTML-Modul:
<code class="python">import html html.unescape('&amp;copy; 2010') # u'\xa9 2010' html.unescape('&amp;#169; 2010') # u'\xa9 2010'</code>
Das obige ist der detaillierte Inhalt vonWie konvertiert man HTML-Entitäten in Python in Unicode-Strings?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heißer Artikel

Hot-Tools-Tags

Heißer Artikel

Heiße Artikel -Tags

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wie benutze ich eine schöne Suppe, um HTML zu analysieren?

So verwenden Sie Python, um die ZiPF -Verteilung einer Textdatei zu finden

Wie man mit PDF -Dokumenten mit Python arbeitet

Wie kann man mit Redis in Django -Anwendungen zwischenstrichen

Wie führe ich ein tiefes Lernen mit Tensorflow oder Pytorch durch?

Serialisierung und Deserialisierung von Python -Objekten: Teil 1

So implementieren Sie Ihre eigene Datenstruktur in Python
