Fusion de DataFrames : combinaison d'ensembles de données extraits
Dans le contexte de la manipulation de données, la combinaison de plusieurs cadres de données est une exigence courante. Dans un scénario donné, supposons que nous ayons un DataFrame D initial et que nous en extrayons deux sous-ensembles A et B en fonction d'une condition spécifique :
A = D[D.label == k] B = D[D.label != k]
L'objectif est de fusionner A et B en un seul DataFrame . Bien que l'ordre des données ne soit pas crucial, il est important de conserver les index d'origine de A et B tels qu'ils ont été dérivés de D.
Solution : utiliser la méthode Append
Une approche pour combiner des blocs de données consiste à utiliser la méthode append. Cette méthode nous permet de concaténer verticalement une ou plusieurs trames de données, en les empilant efficacement les unes sur les autres. Dans notre cas, nous pouvons utiliser le code ci-dessous :
df_merged = df1.append(df2, ignore_index=True)
Cela créera un nouveau DataFrame appelé df_merged qui contient les données combinées de A et B. L'argument ignore_index=True garantit que le DataFrame résultant a son propre ensemble unique d'index, indépendant des originaux.
Conserver les index originaux
Si nous voulons conserver les index originaux de A et B, nous pouvons définir ignore_index= False dans la méthode d'ajout :
df_merged = df1.append(df2, ignore_index=False)
Cela préservera les valeurs d'index de chaque bloc de données dans le résultat fusionné. Cependant, il est important de noter que les index peuvent devenir des valeurs en double dans le DataFrame final.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!