Maison > développement back-end > Tutoriel Python > Comment diviser un DataFrame Pandas en plusieurs DataFrames en fonction des valeurs uniques d'une colonne ?

Comment diviser un DataFrame Pandas en plusieurs DataFrames en fonction des valeurs uniques d'une colonne ?

Susan Sarandon
Libérer: 2024-12-12 15:29:11
original
853 Les gens l'ont consulté

How to Split a Pandas DataFrame into Multiple DataFrames Based on a Column's Unique Values?

Diviser un DataFrame Pandas en fonction des valeurs de colonne à l'aide de Groupby

Cet article présente une solution au défi de diviser un DataFrame en plusieurs parties en fonction sur des valeurs uniques dans une colonne spécifique.

Considérez ce qui suit DataFrame :

import pandas as pd

df = pd.DataFrame({
    "N0_YLDF": [6.286333, 6.317000, 6.324889, 6.320667, 6.325556, 6.359000, 6.359000, 6.361111, 6.360778, 6.361111],
    "ZZ": [2, 6, 6, 5, 5, 6, 6, 7, 7, 6],
    "MAT": [11.669069, 11.669069, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454, 11.516454]
})
Copier après la connexion

L'objectif est de créer un nouveau DataFrame comportant plusieurs colonnes pour la colonne "N0_YLDF", chaque colonne correspondant à une valeur unique dans la colonne "ZZ". Pour y parvenir, nous pouvons utiliser la fonction groupby().

grouped_df = df.groupby("ZZ")
Copier après la connexion

La fonction groupby() crée un objet pandas.core.groupby.groupby.DataFrameGroupBy, qui représente le DataFrame avec les groupes répartis selon les valeurs dans la colonne spécifiée. Dans ce cas, nous avons quatre groupes :

print(grouped_df.groups)

# Output
{2: [0], 6: [1, 2, 5, 6, 9], 5: [3, 4], 7: [7, 8]}
Copier après la connexion

Pour obtenir les DataFrames individuels pour chaque groupe, nous pouvons utiliser la compréhension de liste :

split_dfs = [grouped_df.get_group(key) for key in grouped_df.groups]
Copier après la connexion

La méthode get_group() renvoie un DataFrame qui contient les lignes appartenant au groupe spécifié.

La liste split_dfs résultante contient quatre DataFrames, chacun représentant une valeur différente dans le Colonne "ZZ".

Par exemple, pour accéder au DataFrame du groupe avec la valeur "ZZ" de 6, vous pouvez utiliser :

split_df_6 = split_dfs[1]
Copier après la connexion

Cela vous donnera un DataFrame avec le lignes suivantes :

   N0_YLDF   ZZ        MAT
1  6.317000   6  11.669069
2  6.324889   6  11.516454
5  6.359000   6  11.516454
6  6.359000   6  11.516454
9  6.361111   6  11.516454
Copier après la connexion

En utilisant la fonction groupby() et la méthode get_group(), vous pouvez diviser efficacement un DataFrame en plusieurs parties en fonction des valeurs dans une colonne spécifiée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal