Emojis aus einem String in Python entfernen
Sie sind beim Entfernen von Emojis aus einem String in Python mit dem bereitgestellten Code auf Schwierigkeiten gestoßen. Es gibt jedoch mehrere Möglichkeiten, dieses Problem anzugehen:
1. Überlegungen zu Python 2
Wenn Sie Python 2 verwenden, müssen Sie unbedingt bedenken, dass Sie das Literal „u“ verwenden müssen, um eine Unicode-Zeichenfolge zu definieren. Darüber hinaus müssen Sie das re.UNICODE-Flag übergeben und Ihre Eingabedaten in Unicode konvertieren, bevor Sie re.sub() zum Entfernen von Emojis verwenden.
Zum Beispiel sollte der folgende Code in Python 2 funktionieren:
<code class="python">#!/usr/bin/env python import re # Convert input data to Unicode if necessary text = u'This dog \U0001f602' # Define Unicode emoji pattern using re.UNICODE flag emoji_pattern = re.compile("[" u"\U0001F600-\U0001F64F" # emoticons u"\U0001F300-\U0001F5FF" # symbols & pictographs u"\U0001F680-\U0001F6FF" # transport & map symbols u"\U0001F1E0-\U0001F1FF" # flags (iOS) "]+", flags=re.UNICODE) # Remove emojis from the string new_text = emoji_pattern.sub(r'', text) # Print the result print(new_text)</code>
2. Fehler durch ungültige Zeichen
Der Fehler durch ungültige Zeichen kann darauf zurückzuführen sein, dass das Emoji-Muster mit xf gestartet wurde. Stattdessen sollten Sie das Format „u'uxxxx“ verwenden, um Unicode-Codepunkte darzustellen.
Untersuchung verschiedener Emoji-Ausschlussmuster
Das zweite von Ihnen angegebene Codemuster scheint beim Vergleich verschiedener Codepunkte umfassender zu sein Emoji-Typen, aber wenn die Emojis immer noch nicht für Sie entfernt werden, liegt möglicherweise ein Problem mit den Eingabedaten vor (z. B. enthalten sie Ersatz-Emojispaare).
Das obige ist der detaillierte Inhalt vonSo entfernen Sie Emojis effektiv aus einer Zeichenfolge in Python: Eine Anleitung zu häufigen Problemen und Lösungen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!