Suppression des emojis des chaînes en Python
La tâche de suppression des emojis d'une chaîne en Python peut être réalisée de plusieurs manières. Une approche consiste à utiliser la fonction re.sub() avec un modèle d'expression régulière approprié. Cependant, il est important de noter que le code donné peut rencontrer des problèmes lors du traitement des caractères Unicode.
Une solution possible consiste à utiliser Python 2 et à spécifier la chaîne Unicode littérale en utilisant u''. De plus, la définition de l'indicateur re.UNICODE et la conversion des données d'entrée en Unicode garantissent une gestion correcte des caractères Unicode. Le code suivant illustre cette approche :
<code class="python">#!/usr/bin/env python import re text = u'This dog \U0001f602' print(text) # with emoji emoji_pattern = re.compile("[" u"\U0001F600-\U0001F64F" # emoticons u"\U0001F300-\U0001F5FF" # symbols & pictographs u"\U0001F680-\U0001F6FF" # transport & map symbols u"\U0001F1E0-\U0001F1FF" # flags (iOS) "]+", flags=re.UNICODE) print(emoji_pattern.sub(r'', text)) # no emoji</code>
Sortie :
This dog ? This dog
Veuillez noter que emoji_pattern ne correspond qu'à certains emoji et pas à tous. Pour une liste plus complète des caractères pris en charge, reportez-vous à la documentation « Quels caractères sont des Emoji ».
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!