Supprimer des emojis d'une chaîne en Python
Vous avez rencontré des difficultés pour supprimer des emojis d'une chaîne en Python à l'aide du code fourni. Cependant, il existe plusieurs façons de résoudre ce problème :
1. Considérations sur Python 2
Si vous utilisez Python 2, il est essentiel de vous rappeler que vous devez utiliser le littéral u'' pour définir une chaîne Unicode. De plus, vous devez transmettre l'indicateur re.UNICODE et convertir vos données d'entrée en Unicode avant d'utiliser re.sub() pour supprimer les emojis.
Par exemple, le code suivant devrait fonctionner dans Python 2 :
<code class="python">#!/usr/bin/env python import re # Convert input data to Unicode if necessary text = u'This dog \U0001f602' # Define Unicode emoji pattern using re.UNICODE flag emoji_pattern = re.compile("[" u"\U0001F600-\U0001F64F" # emoticons u"\U0001F300-\U0001F5FF" # symbols & pictographs u"\U0001F680-\U0001F6FF" # transport & map symbols u"\U0001F1E0-\U0001F1FF" # flags (iOS) "]+", flags=re.UNICODE) # Remove emojis from the string new_text = emoji_pattern.sub(r'', text) # Print the result print(new_text)</code>
2. Erreur de caractère non valide
L'erreur de caractère non valide que vous avez rencontrée peut être due au démarrage du modèle emoji avec xf. Au lieu de cela, vous devez utiliser le format u'uxxxx' pour représenter les points de code Unicode.
Examen de différents modèles d'exclusion d'Emoji
Le deuxième modèle de code que vous avez fourni semble plus complet pour faire correspondre divers types d'emojis, mais s'il ne supprime toujours pas les emojis pour vous, il peut y avoir un problème avec les données d'entrée (par exemple, elles contiennent des emojis de substitution).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!