Wie teile ich einen Pandas-DataFrame mithilfe von Groupby in mehrere DataFrames basierend auf Spaltenwerten auf?-Python-Tutorial-php.cn

Wie teile ich einen Pandas-DataFrame mithilfe von Groupby in mehrere DataFrames basierend auf Spaltenwerten auf?

Patricia Arquette

Freigeben： 2024-12-27 15:34:10

Original

1084 Leute haben es durchsucht

How to Split a Pandas DataFrame into Multiple DataFrames Based on Column Values Using Groupby?

Pandas-Datenrahmen basierend auf Spaltenwerten mithilfe von Groupby aufteilen

In Python ist es möglich, einen Pandas-Datenrahmen basierend auf dem in mehrere Datenrahmen aufzuteilen Werte in einer bestimmten Spalte. Diese Technik wird üblicherweise verwendet, um separate Datenrahmen für jede eindeutige Kategorie oder Gruppe innerhalb der Spalte zu erstellen.

Betrachten Sie beispielsweise den folgenden Datenrahmen mit einer Spalte namens „ZZ“:

df = 
        N0_YLDF  ZZ        MAT
    0  6.286333   2  11.669069
    1  6.317000   6  11.669069
    2  6.324889   6  11.516454
    3  6.320667   5  11.516454
    4  6.325556   5  11.516454
    5  6.359000   6  11.516454
    6  6.359000   6  11.516454
    7  6.361111   7  11.516454
    8  6.360778   7  11.516454
    9  6.361111   6  11.516454

Nach dem Login kopieren

Der Ziel ist es, diesen Datenrahmen in vier neue Datenrahmen aufzuteilen, wobei jeder Datenrahmen die Zeilen enthält, in denen „ZZ“ einen bestimmten Wert hat: 2, 5, 6 und 7. Um dies zu erreichen, können wir die nutzen Pandas „groupby“-Funktion.

gb = df.groupby('ZZ')    
[gb.get_group(x) for x in gb.groups]

Nach dem Login kopieren

Die „groupby“-Funktion erstellt ein GroupBy-Objekt, das die Datenrahmenzeilen basierend auf den Werten in der angegebenen Spalte („ZZ“ in diesem Fall) gruppiert. Jeder eindeutige Wert von „ZZ“ wird zu einer Gruppe innerhalb des GroupBy-Objekts.

Die folgende Zeile verwendet ein Listenverständnis, um die Gruppen zu durchlaufen und jede Gruppe als separaten Datenrahmen abzurufen. Die Methode „get_group“ wird mit dem Namen jeder Gruppe (d. h. den eindeutigen Werten von „ZZ“) aufgerufen, um den entsprechenden Datenrahmen zu extrahieren.

Als Ergebnis generiert dieser Code vier neue Datenrahmen, von denen jeder eine Teilmenge von darstellt die ursprünglichen Datenrahmenzeilen, die denselben Wert in der Spalte „ZZ“ haben.

Das obige ist der detaillierte Inhalt vonWie teile ich einen Pandas-DataFrame mithilfe von Groupby in mehrere DataFrames basierend auf Spaltenwerten auf?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!