Beim Parsen von HTML mit Beautiful Soup 3 erscheinen häufig HTML-Entitäten und müssen dekodiert werden. Dies kann mit der Funktion html.unescape() oder HTMLParser.unescape() erfolgen.
Verwenden Sie html.unescape():
import html html.unescape('£682m')
Von HTMLParser in Python 2.6-2.7 oder html.parser in Python 3, unescape():
from html.parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
Alternativ mit der sechs Kompatibilitätsbibliothek:
from six.moves.html_parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
Das obige ist der detaillierte Inhalt vonWie dekodiere ich HTML-Entitäten in Python-Strings?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!