Gestion des caractères Unicode dans l'écriture de fichiers texte
L'écriture de caractères non-ASCII dans des fichiers texte nécessite un examen attentif du codage des caractères. La question explore l'utilisation d'Unicode dans le traitement des données et rencontre une erreur d'encodage lors de l'écriture dans un fichier.
La solution partielle remplace le codec problématique par la fonction open de Python, qui ouvre un fichier en mode binaire par défaut. Bien que cela résolve l'erreur de décodage, cela introduit un autre problème : les caractères ne sont pas correctement affichés dans le fichier texte.
Pour résoudre ce problème, il est crucial de gérer exclusivement Unicode tout au long du processus. La conversion des données en objets Unicode lors de la récupération et leur codage uniquement lorsque cela est nécessaire garantit une représentation correcte des caractères.
Le code Python modifié suivant illustre cette approche :
<code class="python">import unicodedata row = [unicodedata.normalize('NFC', x.strip()) if x is not None else u'' for x in row] all_html = row[0] + "<br/>" + row[1] with open('out.txt', 'wb') as f: f.write(all_html.encode("utf-8"))</code>
En normalisant Unicode au format NFD, le texte peut être représenté de manière cohérente au format NFC sur toutes les plates-formes, garantissant ainsi un affichage correct dans l'éditeur de texte.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!