Lors de l'exportation de dataframes Pandas vers des fichiers CSV, vous pouvez rencontrer UnicodeEncodeError si vos données contiennent des caractères non-ASCII. Abordons à la fois l'erreur et une question supplémentaire sur l'écriture de fichiers délimités par des tabulations.
Erreur d'encodage Unicode
Pour écrire dans un fichier CSV avec des caractères Unicode, spécifiez un encodage compatible avec vos données. Utilisez l'argument d'encodage dans to_csv() :
df.to_csv(file_name, sep='\t', encoding='utf-8')
Pour la plupart des caractères Unicode, UTF-8 est suffisant.
Écrit dans un fichier délimité par des tabulations
Pandas n'a pas de méthode dédiée "to-tab". Cependant, vous pouvez délimiter manuellement par tabulation en utilisant l'argument sep dans to_csv() :
df.to_csv(file_name, sep='\t', encoding='utf-8')
Options supplémentaires
En plus de spécifier l'encodage et le délimiteur, vous vous souhaiterez peut-être également désactiver l'index et ajouter un en-tête :
df.to_csv(file_name, sep='\t', encoding='utf-8', index=False, header=True)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!