将数组类型保持为具有 NaN 值的整数:NumPy 与 Pandas
使用同时包含整数和 NaN 值的数据结构时,在处理丢失的信息时保持预期的数据类型至关重要。 Python 中流行的数据分析库 NumPy 和 Pandas 为该任务提供了不同的方法。
在 NumPy 中,不可能直接将 NaN 值存储在整数数组中。此限制源于 NaN 是一个与浮点数据类型一致的浮点概念。您提到使用屏蔽数组并没有解决问题,因为它还导致数据类型转换为浮点型。
另一方面,Pandas 历来缺乏对整数 NA 值的支持,导致列包含整数和 NaN 值都将转换为浮点型。然而,随着 Pandas 0.24 版本中引入扩展数据类型 Int64(大写),这种情况发生了变化。要利用此功能,您可以在创建 DataFrame 时将 dtype 指定为“Int64[NA]”。请注意,必须使用此扩展 dtype,而不是默认的 int64(小写)。
以上是NumPy 与 Pandas:如何在整数数组中存储 NaN 值?的详细内容。更多信息请关注PHP中文网其他相关文章!