Supprimer les caractères non-ASCII tout en préservant les points et les espaces
Le but est de traiter des données textuelles stockées dans un fichier .txt et d'en extraire un chaîne sans aucun caractère non-ASCII, tout en préservant les espaces et les points. Pour y parvenir, le code fourni définit une fonction onlyascii() qui détermine si un caractère doit être inclus en vérifiant sa valeur ASCII. Cependant, il supprime actuellement également les points et les espaces.
Pour modifier onlyascii() afin d'exempter les points et les espaces, nous pouvons exploiter le module string.printable de Python. string.printable contient un ensemble de caractères considérés comme imprimables, y compris des espaces et des points.
La définition mise à jour de onlyascii() utilisant string.printable serait :
def onlyascii(char): if ord(char) < 48 or ord(char) > 127 or char not in string.printable: return '' else: return char
En incorporant cette vérification dans onlyascii(), les caractères non imprimables, à l'exclusion des espaces et des points, seront filtrés.
Voici le code corrigé avec la fonction onlyascii() mise à jour :
def onlyascii(char): if ord(char) < 48 or ord(char) > 127 or char not in string.printable: return '' else: return char def get_my_string(file_path): f=open(file_path,'r') data=f.read() f.close() filtered_data=filter(onlyascii, data) filtered_data = filtered_data.lower() return filtered_data
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!