Pandas の Groupby Groupby と Average
問題:
「cluster」を含む DataFrame が指定された場合'、'org'、および 'time' 列では、「組織」ごと、「クラスター」ごとの平均「時間」を計算し、各「クラスター」グループの「時間」の平均を取るにはどうすればよいですか?
期待:
cluster | mean(time) |
---|---|
1 | 15 |
2 | 54 |
3 | 6 |
解決策:
望ましい結果を達成するには、次の手順を使用できます:
Groupby ['cluster', 'org'] および Take Mean:
mean_by_cluster_org = df.groupby(['cluster', 'org'], as_index=False).mean()
Groupby ['cluster' ] と平均の計算:
cluster_average = mean_by_cluster_org.groupby('cluster')['time'].mean()
結果の表示:
print(cluster_average)
または、次の方法を使用してこの問題に対処することもできます:
オプション 1: Groupby Only ['cluster'] および Take Mean:
cluster_only_average = df.groupby('cluster').mean()
オプション2: Groupby ['cluster', 'org'] と Use Mean:
cluster_org_mean = df.groupby(['cluster', 'org']).mean()
選択したアプローチに関係なく、出力では「組織」ごとの平均「時間」が得られます。各「クラスター」グループの「クラスター」ごとの「時間」の全体平均。
以上がPandas で「組織」ごと、「クラスター」ごとの平均「時間」を計算し、次に各「クラスター」グループの平均「時間」を計算する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。