Gruppenweise Berechnung: Durchschnittliche Zeit pro Organisation und Cluster
In Pandas kann die durchschnittliche Zeit pro Organisation innerhalb jedes Clusters berechnet werden kann mit der Funktion groupby() erreicht werden.
1. Verschachtelter Gruppierungsansatz
Um den Durchschnitt zuerst nach ['cluster', 'org'] und dann nach 'cluster' zu berechnen, verwenden Sie den folgenden Code:
(df.groupby(['cluster', 'org'], as_index=False).mean() .groupby('cluster')['time'].mean())
2. Einstufiger Gruppierungsansatz (nur Cluster)
Um den Mittelwert von Clustergruppen direkt zu berechnen, verwenden Sie:
df.groupby(['cluster']).mean()
3. Gruppieren nach ['cluster', 'org'] und Anwenden des Mittelwerts
Ein alternativer Ansatz besteht darin, nach ['cluster', 'org'] zu gruppieren und dann die Mittelwertfunktion anzuwenden:
df.groupby(['cluster', 'org']).mean()
Ergebnis
Das erwartete Ergebnis für alle Ansätze ist:
cluster | mean(time) |
---|---|
1 | 15 |
2 | 54 |
3 | 6 |
Das obige ist der detaillierte Inhalt vonWie berechnet man die durchschnittliche Zeit pro Organisation und Cluster in Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!