Maison > développement back-end > Tutoriel Python > Comment diviser efficacement une colonne de listes Pandas en plusieurs colonnes ?

Comment diviser efficacement une colonne de listes Pandas en plusieurs colonnes ?

Mary-Kate Olsen
Libérer: 2024-12-17 13:02:26
original
730 Les gens l'ont consulté

How to Efficiently Split a Pandas Column of Lists into Multiple Columns?

Diviser une colonne Pandas de listes en plusieurs colonnes

Dans l'exploration de données, il est souvent nécessaire de restructurer les colonnes DataFrame dans un format plus gérable. Un de ces scénarios consiste à diviser une colonne contenant des listes en plusieurs colonnes.

Considérez un DataFrame avec une seule colonne nommée « équipes », qui contient des listes de noms d'équipe :

import pandas as pd

df = pd.DataFrame({
    "teams": [[
        "SF", 
        "NYG"
    ] for _ in range(7)]
})
Copier après la connexion

Pour diviser cela colonne "teams" en deux colonnes, "team1" et "team2", nous pouvons exploiter le constructeur DataFrame avec des listes créées par to_list

Option 1 : Modification du DataFrame existant

En utilisant la méthode to_list, nous pouvons transformer la liste "équipes" en une liste de listes, qui peut être utilisée pour créer les nouvelles colonnes "team1" et "team2" :

df[['team1', 'team2']] = pd.DataFrame(df['teams'].tolist(), index=df.index)
Copier après la connexion

Cette opération modifie le DataFrame d'origine avec le nouveau colonnes :

       teams team1 team2
0  [SF, NYG]    SF   NYG
1  [SF, NYG]    SF   NYG
2  [SF, NYG]    SF   NYG
3  [SF, NYG]    SF   NYG
4  [SF, NYG]    SF   NYG
5  [SF, NYG]    SF   NYG
6  [SF, NYG]    SF   NYG
Copier après la connexion

Option 2 : Création d'un nouveau DataFrame

Alternativement, si nous le souhaitons, nous pouvons créer un nouveau DataFrame avec les colonnes divisées :

df3 = pd.DataFrame(
    df['teams'].tolist(), 
    columns=['team1', 'team2']
)
Copier après la connexion

Cette opération crée un DataFrame séparé :

  team1 team2
0    SF   NYG
1    SF   NYG
2    SF   NYG
3    SF   NYG
4    SF   NYG
5    SF   NYG
6    SF   NYG
Copier après la connexion

Veuillez noter que l'application du La fonction apply(pd.Series) pour réaliser cette division est nettement plus lente et n'est pas recommandée pour les ensembles de données plus volumineux.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal