如何用 Pandas 中另一列的資料填入一列中的缺失值?

Linda Hamilton
發布: 2024-11-11 06:43:02
原創
460 人瀏覽過

How can I Fill Missing Values in One Column with Data From Another Column in Pandas?

利用fillna() 的強大功能來估算整列的缺失值

在資料操作領域,通常需要這樣做估算缺失值以確保資料完整性。 Pandas 是一個多功能的資料分析庫,提供了 fillna() 方法來有效地處理此任務。但是,擴展其功能以整個列填充缺失值需要特定的方法。

先前嘗試用另一列中的對應值填充一列中的缺失值通常涉及低效的逐行循環。為了優化效能並遵循最佳實踐,利用 fillna() 的替代方法至關重要。

以下是如何有效地將整個列作為參數傳遞給fillna():

import pandas as pd

# Create a DataFrame with missing values
df = pd.DataFrame({'Day': [1, 2, 3, 4],
                   'Cat1': ['cat', 'dog', 'cat', np.nan],
                   'Cat2': ['mouse', 'elephant', 'giraf', 'ant']})

# Fill missing values in Cat1 using values from Cat2
df['Cat1'].fillna(df['Cat2'], inplace=True)

# Display the imputed DataFrame
print(df)
登入後複製

此程式碼成功使用從「Cat2」中的對應行提取的「ant」填充第四行「Cat1」中的缺失值。產生的 DataFrame 顯示完整的數據,確保其後續分析的有效性。

透過利用 fillna() 接受列參數的能力,您可以在單一操作中使用另一列的資料有效地估算缺失值。這種方法不僅提高了資料質量,還優化了計算效率,使其成為資料整理工具箱中不可或缺的工具。

以上是如何用 Pandas 中另一列的資料填入一列中的缺失值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板