ホームページ > バックエンド開発 > Python チュートリアル > Pandas の同じ列に複数の集計を適用するにはどうすればよいですか?

Pandas の同じ列に複数の集計を適用するにはどうすればよいですか?

Mary-Kate Olsen
リリース: 2024-12-23 03:07:26
オリジナル
238 人が閲覧しました

How Can I Apply Multiple Aggregations to the Same Column in Pandas?

パンダの同じ列に複数の集計を適用する

パンダでは、GroupBy.agg() は、複数の関数を実行する便利な方法を提供します。グループ化されたデータ。ただし、agg() を使用して同じ列に異なる関数を適用するのは、一見難しいように思えるかもしれません。

伝統的に、構文的には正しくありませんが望ましいアプローチは、agg() の辞書引数に重複キーを渡すことですが、これはそうではありません。

これに対処するために、pandas はいくつかのオプションを提供します。

オプション 1: リストof Tuples

2022 年 6 月 20 日現在、推奨される方法は、タプル [(column, function)] のリストを agg() に提供することです。各タプルは実行される集計を表します。指定された列。

df.groupby('dummy').agg(
    Mean=('returns', np.mean),
    Sum=('returns', np.sum))
ログイン後にコピー

オプション 2: ネストDictionary

もう 1 つのアプローチは、ネストされた辞書を使用することです。外側のキーが列で、内側の値が適用される関数です。

df.groupby('dummy').agg({'returns':
                              {'Mean': np.mean, 'Sum': np.sum}})
ログイン後にコピー

オプション3: 関数のリスト

パンダの過去のバージョンの場合、代替オプションは関数をリストとして渡すことですagg() の辞書引数内で。

df.groupby('dummy').agg({'returns': [np.mean, np.sum]})
ログイン後にコピー

これらのオプションを利用すると、補助関数を使用したり、明示的に agg() を複数回呼び出したりすることなく、同じ列で複数の集計を簡単に実行できます。

以上がPandas の同じ列に複数の集計を適用するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート