Concaténer plusieurs fichiers CSV dans un seul DataFrame
L'importation de plusieurs fichiers CSV dans des pandas et leur concaténation dans un seul grand DataFrame peut être réalisée à l'aide de l'outil étapes suivantes :
-
Lire le CSV Fichiers : Utilisez glob.glob() pour obtenir une liste de tous les fichiers CSV dans le répertoire désigné. Ensuite, lisez chaque fichier CSV à l'aide de pd.read_csv() et stockez les DataFrames résultants dans une liste.
import glob
import pandas as pd
# Get data file names
path = r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
Copier après la connexion
-
Concaténez les DataFrames : Utilisez pd. concat() pour concaténer tous les DataFrames de la liste en un seul DataFrame. Définissez ignore_index=True pour éviter les conflits d'index lors de la concaténation.
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Copier après la connexion
Considérations supplémentaires :
- Assurez-vous que tous les fichiers CSV ont les mêmes colonnes pour une concaténation réussie.
- Si les fichiers CSV ont des noms de colonnes ou des formats différents, envisagez d'utiliser des étapes de prétraitement pour les aligner avant la concaténation.
- Pour identifier chaque échantillon de données, ajoutez une nouvelle colonne au DataFrame avec des informations telles que le nom du fichier ou un identifiant unique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!