Pandas DataFrame を使用する場合、欠損データを効果的に処理することが重要です。一般的なタスクの 1 つは、特定の列に NaN 値が含まれる行を削除することです。
次のデータフレームを考えてみましょう:
STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN
目標は、「EPS」列に NaN 値が含まれるすべての行を削除することです。その結果、次のようになります。 DataFrame:
STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN
このタスクを実行するには、任意の値が含まれる行を削除する df.dropna() メソッドを使用できます。指定された列は NaN です。ただし、この場合は、「EPS」列に NaN が含まれる行のみを削除する必要があります。これを特に「EPS」列に適用するには、次のコードを使用します。
df = df[df['EPS'].notna()]
このコードは、「EPS」列の値が NaN ではないか、NaN であるかどうかを DataFrame の各行でチェックします。そうではなく、行が維持されます。 NaN の場合、行は削除されます。結果のデータフレームには、「EPS」列に非 NaN 値が含まれる行のみが含まれます。
以上が特定の Pandas DataFrame 列から NaN 値を含む行を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。