Déballage des listes dans des DataFrames en lignes individuelles
Dans des scénarios de manipulation de données, vous pouvez rencontrer le défi de transformer une cellule pandas contenant une liste en lignes individuelles. Pour y parvenir, vous pouvez exploiter la fonctionnalité de la méthode explosive() de pandas.
Avant pandas 0.25, la gestion de cette opération nécessitait des approches plus lourdes. Cependant, l'introduction de éclater() a rationalisé le processus.
Considérons l'exemple suivant :
import pandas as pd df = pd.DataFrame({'name': ['A.J. Price'] * 3, 'opponent': ['76ers', 'blazers', 'bobcats'], 'nearest_neighbors': [['Zach LaVine', 'Jeremy Lin', 'Nate Robinson', 'Isaia']] * 3}) df.set_index(['name', 'opponent'])
Avec le DataFrame ci-dessus, vous souhaitez décompresser et empiler les valeurs dans la colonne les plus proches_voisins. , ce qui fait que chaque valeur devient une ligne au sein de chaque adversaire correspondant.
Voici comment vous pouvez y parvenir en utilisant la méthode éclater() :
df.explode('nearest_neighbors')
Le résultat apparaîtra comme suit :
nearest_neighbors name opponent A.J. Price 76ers Zach LaVine 76ers Jeremy Lin 76ers Nate Robinson 76ers Isaia blazers Zach LaVine blazers Jeremy Lin blazers Nate Robinson blazers Isaia bobcats Zach LaVine bobcats Jeremy Lin bobcats Nate Robinson bobcats Isaia
En utilisant la méthode éclater(), vous transformez efficacement la colonne originale de type liste en lignes, fournissant ainsi une représentation plus structurée et plus gérable de vos données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!