Pandas-Datenrahmen basierend auf Spaltenwerten mithilfe von Groupby aufteilen
In Python ist es möglich, einen Pandas-Datenrahmen basierend auf dem in mehrere Datenrahmen aufzuteilen Werte in einer bestimmten Spalte. Diese Technik wird üblicherweise verwendet, um separate Datenrahmen für jede eindeutige Kategorie oder Gruppe innerhalb der Spalte zu erstellen.
Betrachten Sie beispielsweise den folgenden Datenrahmen mit einer Spalte namens „ZZ“:
df = N0_YLDF ZZ MAT 0 6.286333 2 11.669069 1 6.317000 6 11.669069 2 6.324889 6 11.516454 3 6.320667 5 11.516454 4 6.325556 5 11.516454 5 6.359000 6 11.516454 6 6.359000 6 11.516454 7 6.361111 7 11.516454 8 6.360778 7 11.516454 9 6.361111 6 11.516454
Der Ziel ist es, diesen Datenrahmen in vier neue Datenrahmen aufzuteilen, wobei jeder Datenrahmen die Zeilen enthält, in denen „ZZ“ einen bestimmten Wert hat: 2, 5, 6 und 7. Um dies zu erreichen, können wir die nutzen Pandas „groupby“-Funktion.
gb = df.groupby('ZZ') [gb.get_group(x) for x in gb.groups]
Die „groupby“-Funktion erstellt ein GroupBy-Objekt, das die Datenrahmenzeilen basierend auf den Werten in der angegebenen Spalte („ZZ“ in diesem Fall) gruppiert. Jeder eindeutige Wert von „ZZ“ wird zu einer Gruppe innerhalb des GroupBy-Objekts.
Die folgende Zeile verwendet ein Listenverständnis, um die Gruppen zu durchlaufen und jede Gruppe als separaten Datenrahmen abzurufen. Die Methode „get_group“ wird mit dem Namen jeder Gruppe (d. h. den eindeutigen Werten von „ZZ“) aufgerufen, um den entsprechenden Datenrahmen zu extrahieren.
Als Ergebnis generiert dieser Code vier neue Datenrahmen, von denen jeder eine Teilmenge von darstellt die ursprünglichen Datenrahmenzeilen, die denselben Wert in der Spalte „ZZ“ haben.
Das obige ist der detaillierte Inhalt vonWie teile ich einen Pandas-DataFrame mithilfe von Groupby in mehrere DataFrames basierend auf Spaltenwerten auf?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!