問題: 解析しようとしたとき正規表現を使用して Web ページのタイトルを作成すると、「TypeError: バイト様オブジェクトでは文字列パターンを使用できません」というエラーが発生します。 in re.findall()."
解決策:
Python では、HTML などのダウンロードされたデータを扱うとき、バイトのようなオブジェクト (たとえば、 'html' 変数として) を文字列に変換し、文字列パターンと一致させます。このエラーを解決するには、正規表現パターンを適用する前に、「.decode()」メソッドを使用して「html」変数をデコードする必要があります。
コード:
with urllib.request.urlopen(url) as response: html = response.read() html = html.decode('utf-8') # Decode the HTML to a string title = re.findall(pattern, html)
説明:
以上が「TypeError: re.findall() のバイト様オブジェクトで文字列パターンを使用できません」を修正する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。