Extension de fichiers CSV avec Pandas
Lorsque vous travaillez avec de grands ensembles de données, il peut être nécessaire d'ajouter des données à un fichier CSV existant. Pandas, une puissante bibliothèque de manipulation de données en Python, fournit la fonction to_csv() pour exporter des données au format CSV. Cet article explore l'utilisation de to_csv() pour ajouter des données à un fichier CSV existant, garantissant ainsi la compatibilité avec sa structure.
Ajout à des fichiers CSV existants
Le to_csv( ) la fonction propose un paramètre de mode d'écriture, permettant aux utilisateurs de spécifier comment les données sont écrites dans le fichier. En définissant ce paramètre sur « a », les données sont ajoutées au fichier existant. Par exemple :
df.to_csv('my_csv.csv', mode='a', header=False)
Ici, le dataframe df est ajouté au fichier CSV nommé « my_csv.csv ». Le paramètre header=False garantit que la ligne d'en-tête n'est pas écrite plusieurs fois.
Il est important de noter que le mode d'écriture par défaut pour to_csv() est « w », qui écrase le fichier existant. Pour garantir le mode d'ajout, spécifiez explicitement « a ».
Gestion de l'absence initiale du fichier
Si le fichier CSV cible n'existe pas initialement, la ligne d'en-tête peut ne pas être écrit correctement si vous utilisez le mode ajout. Pour résoudre ce problème, vous pouvez utiliser la variante suivante :
import os output_path='my_csv.csv' df.to_csv(output_path, mode='a', header=not os.path.exists(output_path))
Ce code vérifie si le fichier existe à l'aide de os.path.exists(). Si ce n'est pas le cas, il écrit la ligne d'en-tête en définissant header=True. Sinon, il ajoute les données sans l'en-tête.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!