使用NaN 值維護整數數組類型:挑戰與解決方案
在NumPy 和Pandas 中處理數值資料時,可能需要處理同時包含整數值和NaN(非數字)值的陣列。然而,Pandas 存在一個已知的限制,整數陣列無法儲存 NaN 值。
先前嘗試的解決方案,例如使用 Pandas 的 from_records() 函數和 coerce_float=False 或 NumPy 屏蔽數組和 NaN fill_value,都失敗了保留整數資料類型。這是因為 NumPy 目前缺乏處理整數數組中 NA 值的功能。
在目前版本的 NumPy 和 Pandas 中解決此限制的最佳方法是避免使用具有 NaN 值的整數數組。相反,請考慮使用另一種資料類型,例如 float,它可以同時容納數值和 NaN。
但是,Pandas 0.24 版的最新更新引入了對整數 NA 值的可選支援。此功能需要使用擴展資料類型 Int64(大寫“I”)而不是預設的 int64 資料類型。透過合併這個新的資料類型,現在可以在允許存在 NaN 值的同時維護整數數組類型。
以上是如何在處理 NaN 值時維護 Pandas 中的整數陣列類型?的詳細內容。更多資訊請關注PHP中文網其他相關文章!