Pandas DataFrame で NaN 値を列平均に置き換える
主に実数が入力された DataFrame で欠損データを処理する場合、NaN を置き換えます適切な代替案を備えた価値観が不可欠です。この場合、NaN 値を、NaN 値が存在する列の平均で置き換えようとします。
このニーズに対処するために、pandas は便利なメソッド DataFrame.fillna を提供します。この関数を利用すると、NaN 値を列平均で直接埋めることができます。
1 2 3 4 5 6 7 |
|
DataFrame.fillna メソッドは、スカラー、辞書、シリーズなどのさまざまな入力を埋め込み値として受け入れます。この例では、各列の平均を含む系列である column_means を渡します。
プロセスを説明するための例を次に示します:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
|
出力:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
|
図に示すように、NaN 値は適切な列平均に置き換えられ、完全で一貫性のあるデータフレームが提供されます。
以上が「fillna」メソッドを使用して、Pandas DataFrame の NaN 値を列平均に置き換えるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。