首頁 > 後端開發 > Python教學 > 如何在 Pandas DataFrame 中用 NaN 替換空白值(空白)?

如何在 Pandas DataFrame 中用 NaN 替換空白值(空白)?

Patricia Arquette
發布: 2024-10-30 12:57:26
原創
458 人瀏覽過

How do I replace blank values (whitespace) with NaN in a Pandas DataFrame?

在 Pandas 中用 NaN 取代空白值

資料清理是資料分析中至關重要的一步。一項常見任務是將空白值(空白)替換為 NaN。使用 Pandas 可以有效地完成此操作。

要達到此目的,請利用 df.replace() 函數。此函數允許對 DataFrame 值進行基於正規表示式的搜尋和取代操作。以下是實現它的方法:

<code class="python">import numpy as np
import pandas as pd

df = pd.DataFrame([
    [-0.532681, 'foo', 0],
    [1.490752, 'bar', 1],
    [-1.387326, 'foo', 2],
    [0.814772, 'baz', ' '],
    [-0.222552, '   ', 4],
    [-1.176781,  'qux', '  '],
], columns='A B C'.split(), index=pd.date_range('2000-01-01','2000-01-06'))

# Replace fields that contain only whitespace (or are empty) with NaN
print(df.replace(r'^\s*$', np.nan, regex=True))

# Output:
#                    A    B   C
# 2000-01-01 -0.532681  foo   0
# 2000-01-02  1.490752  bar   1
# 2000-01-03 -1.387326  foo   2
# 2000-01-04  0.814772  baz NaN
# 2000-01-05 -0.222552  NaN   4
# 2000-01-06 -1.176781  qux NaN</code>
登入後複製

請注意,此程式碼替換僅包含空格或為空的欄位(即符合正規表示式 r'^s*$'**)。如果您的有效資料包含空格,請相應地調整正規表示式(例如,從 r'^s ' 的末尾刪除 **$)。

以上是如何在 Pandas DataFrame 中用 NaN 替換空白值(空白)?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板