Maison > développement back-end > Tutoriel Python > Comment ajouter une colonne à l'aide de Pandas Transform dans GroupBy DataFrames ?

Comment ajouter une colonne à l'aide de Pandas Transform dans GroupBy DataFrames ?

Mary-Kate Olsen
Libérer: 2024-10-19 11:52:01
original
1104 Les gens l'ont consulté

How to Add a Column Using Pandas Transform in GroupBy DataFrames?

Ajouter une colonne au DataFrame GroupBy à l'aide de Pandas Transform

Lorsque vous travaillez avec des opérations groupby dans pandas, il est souvent utile d'ajouter une nouvelle colonne au trame de données résultante. Une méthode pour y parvenir consiste à utiliser la fonction .map(), comme démontré dans l'exemple. Cependant, une approche alternative et plus simple consiste à utiliser la fonction .transform().

.transform() nous permet d'appliquer une fonction à chaque groupe de la trame de données et de renvoyer une série avec les résultats. La série renvoyée aura un index aligné sur le dataframe d'origine.

Pour illustrer, commençons par le dataframe fourni :

df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})
Copier après la connexion

Notre objectif est de compter les valeurs de type pour chaque c et ajoutez une colonne de taille c.

g = df.groupby('c')['type'].value_counts().reset_index(name='t')
Copier après la connexion

Ce code compte les valeurs de chaque groupe et crée une nouvelle colonne nommée t.

Pour ajouter la colonne de taille en utilisant .transform( ), nous pouvons faire ce qui suit :

g['size'] = df.groupby('c')['type'].transform('size')
Copier après la connexion

.transform('size') applique la fonction size à chaque groupe, qui renvoie la taille de chaque groupe. La série résultante est alignée sur l'index du dataframe d'origine, ce qui nous permet de l'ajouter en tant que nouvelle colonne à g.

La sortie sera un dataframe avec une colonne supplémentaire nommée size :

   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4
Copier après la connexion

L'utilisation de .transform() fournit un moyen plus concis et plus simple d'ajouter une colonne au dataframe d'origine à partir d'une agrégation groupby.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal