Heim > Backend-Entwicklung > Python-Tutorial > Wie berechnet man Durchschnittswerte innerhalb mehrerer Gruppen bei Pandas?

Wie berechnet man Durchschnittswerte innerhalb mehrerer Gruppen bei Pandas?

Mary-Kate Olsen
Freigeben: 2024-11-14 12:49:01
Original
505 Leute haben es durchsucht

How to Calculate Average Values Within Multiple Groups in Pandas?

Nach mehreren Spalten gruppieren und Durchschnitt berechnen

In Pandas können Sie mehrstufige Gruppierungen und Aggregationen durchführen, um komplexe Statistiken zu berechnen. Eine häufige Aufgabe besteht darin, den Durchschnitt einer Spalte innerhalb von Gruppen zu berechnen, die durch mehrere andere Spalten definiert sind.

Berücksichtigen Sie den folgenden DataFrame:

cluster  org      time
1      a       8
1      a       6
2      h       34
1      c       23
2      d       74
3      w       6 
Nach dem Login kopieren

Um den Durchschnitt der Zeit pro Organisation in jedem Cluster zu berechnen können Sie den DataFrame sowohl nach Cluster als auch nach Organisation gruppieren:

df.groupby(['cluster', 'org'], as_index=False).mean()
Nach dem Login kopieren

Dadurch wird ein nach Cluster und Organisation gruppierter DataFrame erstellt, wobei die durchschnittliche Zeit für jede Gruppe berechnet wird:

  cluster org     time
0       1   a  12.333333
1       1   c   23.0
2       2   h   34.0
3       2   d   74.0
4       3   w    6.0
Nach dem Login kopieren

Wenn Sie nur den Zeitmittelwert innerhalb jedes Clusters wünschen, können Sie nur nach Cluster gruppieren:

df.groupby('cluster').mean()
Nach dem Login kopieren

Dadurch wird ein DataFrame mit dem für jeden Cluster berechneten Zeitdurchschnitt erstellt:

  cluster  time
0       1   12.333333
1       2   54.0
2       3    6.0
Nach dem Login kopieren

Alternativ können Sie die Groupby-Methode für die mehrspaltige Kombination ['cluster', 'org'] verwenden und dann den Mittelwert der Zeit berechnen:

df.groupby(['cluster', 'org']).mean()['time']
Nach dem Login kopieren

Dadurch wird eine Serie mit erstellt Durchschnitt der Zeit, berechnet für jede Kombination aus Cluster und Organisation.

Das obige ist der detaillierte Inhalt vonWie berechnet man Durchschnittswerte innerhalb mehrerer Gruppen bei Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage