Pandas でのデータのグループ化と合計
データ分析では、意味のある洞察を得るために特定の基準に従ってデータを集計することが必要になることがよくあります。データ操作用の強力な Python ライブラリである Pandas は、1 つ以上の列に基づいてデータをグループ化する groupby() メソッドを提供します。このメソッドを sum() などの集計関数と組み合わせて、各グループの集計値を計算できます。
グループごとの値の合計の計算
次のように仮定します。個人による果物の消費に関する情報を含むデータフレームを持っています。各行は、果物の種類、購入日、顧客名、購入した果物の数を含む果物の購入を表します。
各個人が購入した果物の合計数を、果物の種類と顧客名の両方でグループ化して計算します。
ステップ 1: データをグループ化する
まず、両方で DataFrame をグループ化します。 groupby() メソッドを使用した 'Fruit' 列と 'Name' 列:
df_grouped = df.groupby(['Fruit', 'Name'])
これにより、グループ化されたデータを表す SeriesGroupBy オブジェクトが作成されます。
ステップ 2: 適用Sum 関数
各グループが購入した果物の総数を計算するには、グループ化されたシリーズへの sum() 関数:
df_grouped_sum = df_grouped['Number'].sum()
結果のシリーズ df_grouped_sum には、果物の種類と顧客名の固有の組み合わせごとに果物購入の合計が含まれます。
例
次のことを考えてみましょうDataFrame:
Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes 10/7/2016 Tom 87 Grapes 10/7/2016 Bob 22 Grapes 10/7/2016 Bob 12 Grapes 10/7/2016 Tony 15
この DataFrame に groupby() および sum() 操作を適用すると、次の結果が得られます:
Number Fruit Name Apples Bob 16 Mike 9 Steve 10 Grapes Bob 35 Tom 87 Tony 15 Oranges Bob 67 Mike 57 Tom 15 Tony 1
この出力は、によって購入されたフルーツの合計数を示しています。それぞれの個体を果物の種類ごとに分類します。
以上がPandas でデータをグループ化および合計して、顧客および果物の種類ごとに購入総額を計算するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。