グループ化された集計と平均計算の実行
クラスター、組織、および時間に関するデータを含む次のデータフレームを考えてみましょう。
cluster org time 0 a 8 1 a 6 2 h 34 3 c 23 4 d 74 5 w 6
目的は、各クラスター内の組織ごとの平均時間を計算することです。期待される結果は次のようになります。
cluster mean(time) 1 15 #=((8 + 6) / 2 + 23) / 2 2 54 #=(74 + 34) / 2 3 6
Double GroupBy と平均計算を使用した解決策:
これを実現するには、Pandas の groupby 関数を利用します。
cluster_org_time = df.groupby(['cluster', 'org'], as_index=False).mean() result = cluster_org_time.groupby('cluster')['time'].mean()
クラスタ化されたグループの代替ソリューション平均:
クラスター グループの平均の場合のみ、['cluster'] でグループ化し、mean() を使用して平均を計算します。
cluster_mean_time = df.groupby(['cluster']).mean()
追加オプションorg と平均計算を使用した GroupBy の場合:
または、グループ化することもできます。 ['cluster', 'org'] 平均を直接計算します:
cluster_org_mean_time = df.groupby(['cluster', 'org']).mean()
以上がPandas DataFrame の各クラスター内の組織ごとの平均時間を計算するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。