问题:
给定一个包含分类值的数据框,任务是转换这些类别转化为数字索引。假设我们有这样的国家/地区类别:
cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0
我们的目标是为每个国家/地区分配一个索引,而不是使用 get_dummies 进行单热编码,例如 cc_index = [1,2,1,3] .
解决方案:
要将 Pandas 类别转换为数字索引,请按照下列步骤操作:
更改分类列:
df.cc = pd.Categorical(df.cc)
创建一个新列来存储类别代码:
df['code'] = df.cc.codes
这将生成一个数据框包含数字索引的附加代码列:
cc temp code 0 US 37.0 2 1 CA 12.0 1 2 US 35.0 2 3 AU 20.0 0
或者,您可以利用 astype 方法将分类列直接转换为带有代码的分类列:
df.cc.astype('category').codes
另一个选项是使用分类列作为新数据框的索引:
df2 = pd.DataFrame(df.temp) df2.index = pd.CategoricalIndex(df.cc)
以上是如何将 Pandas 类别转换为数值索引?的详细内容。更多信息请关注PHP中文网其他相关文章!