Pandas DataFrame から NaN 値を含む行を削除する
Pandas DataFrame には、NaN として表される欠損値を含めることができます。これにより、データを操作する際に問題が生じる可能性があります。この記事では、特定の列に NaN 値が含まれる行を効率的に削除する方法について説明します。
問題:
次のデータフレームで、' が含まれる行のみを保持したいと考えます。 EPSの列はそうではありませんNaN:
STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN
解決策:
「EPS」列の NaN 値を持つ行を削除するには、notna() 関数を利用できます。この関数は、True が NaN 以外の値を表すブール マスクを作成します。
df = df[df['EPS'].notna()]
この操作では、'EPS' が NaN ではない行のみが選択され、次の DataFrame が生成されます:
STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN
notna() 関数を使用すると、指定された列に NaN 値を含む行が効果的に除外されます。
以上が特定の Pandas DataFrame 列の NaN 値を含む行を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。