Pandas で複数のグループ化で平均値を計算する方法は?
Nov 20, 2024 am 01:45 AM複数のグループ化と平均を使用したグループ別集計
Pandas では、複数のレベルでグループ化されたデータに対して集計を実行するのが一般的な操作です。次の DataFrame について考えてみましょう:
cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6
ログイン後にコピー
一般的なタスクは、「cluster」や「org」などの複数の変数で定義されたグループごとに、「time」などの特定の列の平均を計算することです。
解決策 1: クラスター グループのみの平均
「クラスター」のみでグループ化された「時間」の平均を計算するには、次のコードを使用できます。
df.groupby(['cluster']).mean()
ログイン後にコピー
結果:
time cluster 1 12.333333 2 54.000000 3 6.000000
ログイン後にコピー
解決策 2: グループ化の組み合わせの平均値
を計算したい場合「クラスター」と「組織」の各組み合わせの「時間」の平均値:
df.groupby(['cluster', 'org']).mean()
ログイン後にコピー
結果:
time cluster org 1 a 438886 c 23 2 d 9874 h 34 3 w 6
ログイン後にコピー
解決策 3: グループ化のネストされた平均
ネストされた平均を実行するには、最初に「cluster」と「org」の組み合わせで平均を計算し、次に「cluster」グループで平均を計算します。
(df.groupby(['cluster', 'org'], as_index=False).mean() .groupby('cluster')['time'].mean())
ログイン後にコピー
結果:
cluster mean(time) 1 15 #=((8 + 6) / 2 + 23) / 2 2 54 #=(74 + 34) / 2 3 6
ログイン後にコピー
以上がPandas で複数のグループ化で平均値を計算する方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

人気の記事
レポ:チームメイトを復活させる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌
スプリットフィクションを打ち負かすのにどれくらい時間がかかりますか?
3週間前
By DDD
ハローキティアイランドアドベンチャー:巨大な種を手に入れる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.説明されたエネルギー結晶と彼らが何をするか(黄色のクリスタル)
1週間前
By 尊渡假赌尊渡假赌尊渡假赌

人気の記事
レポ:チームメイトを復活させる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌
スプリットフィクションを打ち負かすのにどれくらい時間がかかりますか?
3週間前
By DDD
ハローキティアイランドアドベンチャー:巨大な種を手に入れる方法
3週間前
By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.説明されたエネルギー結晶と彼らが何をするか(黄色のクリスタル)
1週間前
By 尊渡假赌尊渡假赌尊渡假赌

ホットな記事タグ

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック
Gmailメールのログイン入り口はどこですか?
7281
9


Java チュートリアル
1622
14


CakePHP チュートリアル
1342
46


Laravel チュートリアル
1258
25


PHP チュートリアル
1205
29

