Décodage du texte Unicode pour l'écriture de fichiers
Vous rencontrez des problèmes d'encodage lors de l'écriture de texte Unicode dans un fichier. Pour surmonter cela, il est crucial de traiter autant que possible les objets Unicode.
Encodage des chaînes Unicode
Lorsque votre chaîne est un objet Unicode (indiqué par le préfixe " u" en Python), il doit être converti en chaîne codée Unicode avant d'écrire dans un fichier. Utilisez le format suivant :
foo = u'Δ, Й, ק, م, ๗, あ, 叶, 葉, and 말.' f = open('test', 'w') f.write(foo.encode('utf8')) # Encode to UTF-8 f.close()
Cela garantit que les caractères non-ASCII sont correctement encodés dans le fichier.
Décodage pendant la lecture
Quand en lisant le fichier codé, vous obtiendrez une chaîne codée Unicode. Pour récupérer l'objet Unicode, décodez-le :
f = file('test', 'r') print f.read().decode('utf8') # Decode from UTF-8
En suivant ces étapes, vous pouvez gérer en toute sécurité le texte Unicode lors de l'écriture et de la lecture de fichiers, garantissant ainsi la préservation des caractères spéciaux et des symboles.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!