Emojis aus Strings in Python entfernen
Der bereitgestellte Python-Code zum Entfernen von Emojis schlägt fehl, da er Syntaxfehler enthält. Unicode-Zeichenfolgen müssen in Python 2 mit dem Präfix „u“ gekennzeichnet werden. Darüber hinaus sollte das re.UNICODE-Flag an den regulären Ausdruck übergeben werden und die Eingabedaten sollten mithilfe der folgenden Codecs in Unicode konvertiert werden:
<code class="python">import codecs import re text = codecs.decode('This dog \U0001f602'.encode('UTF-8'), 'UTF-8') print(text) # with emoji emoji_pattern = re.compile("[" u"\U0001F600-\U0001F64F" # emoticons u"\U0001F300-\U0001F5FF" # symbols & pictographs u"\U0001F680-\U0001F6FF" # transport & map symbols u"\U0001F1E0-\U0001F1FF" # flags (iOS) "]+", flags=re.UNICODE) print(emoji_pattern.sub(r'', text)) # no emoji</code>
Dieser Hund ?<br>Dieser Hund<br>
Hinweis: Dieses Muster passt nur zu einer begrenzten Auswahl an Emojis. Eine umfassendere Lösung finden Sie unter Unicode-Zeichenbereiche.
Das obige ist der detaillierte Inhalt vonSo entfernen Sie Emojis aus Strings in Python: Ein Leitfaden für Anfänger zur Behebung häufiger Fehler?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!