ホームページ > バックエンド開発 > Python チュートリアル > グループ化後に Pandas DataFrame で最も一般的な値を見つける方法は?

グループ化後に Pandas DataFrame で最も一般的な値を見つける方法は?

Patricia Arquette
リリース: 2024-12-02 01:58:09
オリジナル
126 人が閲覧しました

How to Find the Most Common Value in a Pandas DataFrame After Grouping?

GroupBy pandas DataFrame と最も一般的な値の選択

複数の文字列列を含むデータをクレンジングするには、最初の 2 つの列でグループ化し、3 番目の列の最も一般的な値を選択します

問題

提供されたコードは失敗しますKeyError が発生し、City 列のみでグループ化すると AssertionError が発生します。堅牢なソリューションが必要です。

ソリューション

パンダ v0.16 以降、pd.Series.mode は、このタスクに多用途で効率的なメソッドを提供します。

source.groupby(['Country', 'City'])['Short name'].agg(pd.Series.mode)
ログイン後にコピー

複数のモードのアドレス指定

グループ内に複数のモードがある場合、Series.mode値のリストを返します。単一の結果については、ラムダ関数を適用します。

source.groupby(['Country', 'City'])['Short name'].agg(lambda x: pd.Series.mode(x)[0])
ログイン後にコピー

検討する代替案

scipy.stats.mode も使用できますが、複数のモードが発生するとエラーが発生します。

以上がグループ化後に Pandas DataFrame で最も一般的な値を見つける方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート