Python で文字列から絵文字を削除する
絵文字を削除するための提供された Python コードは、構文エラーが含まれているため失敗します。 Unicode 文字列は、Python 2 では u'' プレフィックスを使用して指定する必要があります。さらに、re.UNICODE フラグを正規表現に渡し、入力データをコーデックを使用して Unicode に変換する必要があります:
<code class="python">import codecs import re text = codecs.decode('This dog \U0001f602'.encode('UTF-8'), 'UTF-8') print(text) # with emoji emoji_pattern = re.compile("[" u"\U0001F600-\U0001F64F" # emoticons u"\U0001F300-\U0001F5FF" # symbols & pictographs u"\U0001F680-\U0001F6FF" # transport & map symbols u"\U0001F1E0-\U0001F1FF" # flags (iOS) "]+", flags=re.UNICODE) print(emoji_pattern.sub(r'', text)) # no emoji</code>
この犬 ?<br>この犬<br>
メモ:このパターンは、限られた範囲の絵文字のみに一致します。より包括的な解決策については、「Unicode 文字範囲」を参照してください。
以上がPython で文字列から絵文字を削除する方法: 一般的なエラーを修正するための初心者ガイド?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。