複数のグループ化と平均を使用したグループ別集計
Pandas では、複数のレベルでグループ化されたデータに対して集計を実行するのが一般的な操作です。次の DataFrame について考えてみましょう:
1 2 3 4 5 6 7 |
|
一般的なタスクは、「cluster」や「org」などの複数の変数で定義されたグループごとに、「time」などの特定の列の平均を計算することです。
解決策 1: クラスター グループのみの平均
「クラスター」のみでグループ化された「時間」の平均を計算するには、次のコードを使用できます。
1 |
|
結果:
1 2 3 4 5 |
|
解決策 2: グループ化の組み合わせの平均値
を計算したい場合「クラスター」と「組織」の各組み合わせの「時間」の平均値:
1 |
|
結果:
1 2 3 4 5 6 7 |
|
解決策 3: グループ化のネストされた平均
ネストされた平均を実行するには、最初に「cluster」と「org」の組み合わせで平均を計算し、次に「cluster」グループで平均を計算します。
1 2 |
|
結果:
1 2 3 4 |
|
以上がPandas で複数のグループ化で平均値を計算する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。