Beautiful Soup 3 で HTML を解析すると、HTML エンティティが頻繁に表示されるため、デコードする必要があります。これは、html.unescape() または HTMLParser.unescape() 関数を使用して実行できます。
Use html.unescape():
import html html.unescape('£682m')
Python の HTMLParser から2.6-2.7 または Python 3 の html.parser、unescape():
from html.parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
または、6 つの互換性ライブラリを使用:
from six.moves.html_parser import HTMLParser parser = HTMLParser() print(h.unescape('£682m'))
以上がPython 文字列の HTML エンティティをデコードするには?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。