利用fillna() 的強大功能來估算整列的缺失值
在資料操作領域,通常需要這樣做估算缺失值以確保資料完整性。 Pandas 是一個多功能的資料分析庫,提供了 fillna() 方法來有效地處理此任務。但是,擴展其功能以整個列填充缺失值需要特定的方法。
先前嘗試用另一列中的對應值填充一列中的缺失值通常涉及低效的逐行循環。為了優化效能並遵循最佳實踐,利用 fillna() 的替代方法至關重要。
以下是如何有效地將整個列作為參數傳遞給fillna():
import pandas as pd # Create a DataFrame with missing values df = pd.DataFrame({'Day': [1, 2, 3, 4], 'Cat1': ['cat', 'dog', 'cat', np.nan], 'Cat2': ['mouse', 'elephant', 'giraf', 'ant']}) # Fill missing values in Cat1 using values from Cat2 df['Cat1'].fillna(df['Cat2'], inplace=True) # Display the imputed DataFrame print(df)
此程式碼成功使用從「Cat2」中的對應行提取的「ant」填充第四行「Cat1」中的缺失值。產生的 DataFrame 顯示完整的數據,確保其後續分析的有效性。
透過利用 fillna() 接受列參數的能力,您可以在單一操作中使用另一列的資料有效地估算缺失值。這種方法不僅提高了資料質量,還優化了計算效率,使其成為資料整理工具箱中不可或缺的工具。
以上是如何用 Pandas 中另一列的資料填入一列中的缺失值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!