将 Pandas 列转换为整数时处理 NaN 值
使用 Pandas 数据帧时,您可能会遇到需要转换列的情况包含 NaN 值的整数数据类型。但是,这种转换可能会导致错误,因为默认情况下整数数组无法处理缺失值。
错误处理方法
您已尝试了两种方法来转换 'id ' 列转换为整数,但两者都导致了错误:
解决方案:可空整数数据类型
Pandas 版本 0.24引入了可为空整数数据类型的概念。此功能允许整数数组包含缺失值。要使用此方法:
import numpy as np # Create a nullable integer array arr = pd.array([1, 2, np.nan], dtype=pd.Int64Dtype()) # Create a Pandas Series from the array series = pd.Series(arr)
生成的系列将具有“Int64”数据类型,并允许 NaN 值:
>>> series 0 1 1 2 2 NaN dtype: Int64
转换 Pandas 列
将 Pandas 列转换为可为空整数dtype:
df['myCol'] = df['myCol'].astype('Int64')
这会将 'myCol' 列转换为整数数据类型,缺失值表示为 NaN。
以上是将 Pandas 列转换为整数时如何处理 NaN 值?的详细内容。更多信息请关注PHP中文网其他相关文章!