ホームページ > バックエンド開発 > Python チュートリアル > グループ平均を使用して Pandas DataFrame の欠損値を埋める方法は?

グループ平均を使用して Pandas DataFrame の欠損値を埋める方法は?

Barbara Streisand
リリース: 2024-12-07 01:09:12
オリジナル
981 人が閲覧しました

How to Fill Missing Values in Pandas DataFrames using Group Means?

グループ内の欠損値を平均値で埋める

欠損値を持つ pandas DataFrame が与えられ、これらの値を特定の列で定義された各グループの平均。この一般的なタスクは、さまざまな方法を使用して解決できます。

GroupBy と Transformation の使用

効果的なアプローチには、groupby() 関数とtransform() 関数の使用が含まれます。

grouped = df.groupby('name')
df["value"] = grouped.transform(lambda x: x.fillna(x.mean()))
ログイン後にコピー

このコードでは、最初に groupby() を使用して「name」列で DataFrame をグループ化します。次に、transform() を使用して「value」列にラムダ関数を適用します。この関数は各グループを検査し、欠損値をそのグループの平均値で埋めます。最終結果は、元の「値」列に格納されます。

この手法を採用すると、欠損値を各グループのデータから得られた意味のある値に置き換えることで、欠損値を効率的に処理できます。

以上がグループ平均を使用して Pandas DataFrame の欠損値を埋める方法は?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート