Pandas DataFrame での NaN の効率的な置換
データ分析では、Null 値または NaN が問題を引き起こす可能性があります。たとえば、NaN を含む pandas DataFrame を考えてみましょう。
import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])
これらの NaN を効果的に処理するには、NaN を論理値に置き換える洗練されたソリューションを模索します。
前方充填アプローチ
効率的でループのない方法の 1 つは、ffill パラメーターを指定して fillna メソッドを利用することです。この操作は、最後に観測された値を前方に伝播し、後続の NaN を置き換えます。指定された DataFrame の場合、次の結果が得られます。
df.fillna(method='ffill')
0 1 2 0 1 2 3 1 4 2 3 2 4 2 9
後方充填アプローチ
あるいは、NaN を同じ列内の最も近い値に置き換える場合、逆方向が必要な場合は、bfill パラメータを使用できます。このメソッドは、最初に観測された値を逆方向に伝播し、NaN を埋めます。
インプレース変更
デフォルトでは、fillna メソッドは元の DataFrame を変更しません。変更を永続的に適用するには、inplace=True を使用します。
df.fillna(method='ffill', inplace=True)
この操作は df を直接更新し、指定されたメソッドに従ってすべての NaN を置き換えます。
結論
fillna メソッドの柔軟性を活用することで、パンダ データフレーム内の NaN を前方および後方の両方で効率的に置き換えることができます。充填技術により、分析用にクリーンで完全なデータを確保します。
以上がPandas DataFrame で NaN 値を効率的に置き換えるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。