使用 NaN 值维护整数数组类型:挑战和解决方案
在 NumPy 和 Pandas 中处理数值数据时,可能需要处理同时包含整数值和 NaN(非数字)值的数组。然而,Pandas 存在一个已知的限制,整数数组无法存储 NaN 值。
之前尝试的解决方案,例如使用 Pandas 的 from_records() 函数和 coerce_float=False 或 NumPy 屏蔽数组和 NaN fill_value,都失败了保留整数数据类型。这是因为 NumPy 目前缺乏处理整数数组中 NA 值的功能。
在当前版本的 NumPy 和 Pandas 中解决此限制的最佳方法是避免使用具有 NaN 值的整数数组。相反,请考虑使用另一种数据类型,例如 float,它可以同时容纳数值和 NaN。
但是,Pandas 0.24 版的最新更新引入了对整数 NA 值的可选支持。此功能需要使用扩展数据类型 Int64(大写“I”)而不是默认的 int64 数据类型。通过合并这个新的数据类型,现在可以在允许存在 NaN 值的同时维护整数数组类型。
以上是如何在处理 NaN 值时维护 Pandas 中的整数数组类型?的详细内容。更多信息请关注PHP中文网其他相关文章!