So fügen Sie eine Spalte zu einem gruppierten Datenrahmen in Pandas hinzu
Bei der Datenanalyse ist es oft notwendig, Daten zu gruppieren und Berechnungen durchzuführen jede Gruppe. Pandas bietet hierfür mit seiner Groupby-Funktion eine praktische Möglichkeit. Eine häufige Aufgabe besteht darin, die Werte einer Spalte innerhalb jeder Gruppe zu zählen und dem Datenrahmen eine Spalte hinzuzufügen, die diese Zählungen enthält.
Betrachten Sie den Datenrahmen df:
<code class="python">df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})</code>
Zum Zählen der Werte von Geben Sie für jedes c ein, können wir die Funktion value_counts für den gruppierten Datenrahmen verwenden:
<code class="python">g = df.groupby('c')['type'].value_counts().reset_index(name='t')</code>
Dadurch wird ein neuer Datenrahmen g mit den Gruppenanzahlen erstellt. Um eine Spalte zu g mit der Größe jeder Gruppe hinzuzufügen, können wir die Transformationsfunktion verwenden:
<code class="python">g['size'] = df.groupby('c')['type'].transform('size')</code>
transform wendet eine Funktion auf jede Gruppe im ursprünglichen Datenrahmen an und gibt eine Reihe zurück, deren Index an der ausgerichtet ist Originaldatenrahmen. In diesem Fall verwenden wir die Größenfunktion, um die Anzahl der Elemente in jeder Gruppe zu zählen und sie der neuen Spaltengröße zuzuweisen. Der resultierende Datenrahmen g sieht nun wie folgt aus:
<code class="python"> c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4</code>
Dies zeigt eine einfache Möglichkeit, eine neue Spalte zu einem gruppierten Datenrahmen hinzuzufügen, basierend auf den Ergebnissen einer Groupby-Aggregation.
Das obige ist der detaillierte Inhalt vonWie füge ich in Pandas eine Spalte mit Gruppenanzahlen zu einem gruppierten Datenrahmen hinzu?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!