首页 > 后端开发 > Python教程 > 如何将 Pandas 类别转换为数值索引?

如何将 Pandas 类别转换为数值索引?

Susan Sarandon
发布: 2024-10-29 03:44:02
原创
558 人浏览过

How to Convert Pandas Categories to Numerical Indices?

将 Pandas 类别转换为数值索引

问题:

给定一个包含分类值的数据框,任务是转换这些类别转化为数字索引。假设我们有这样的国家/地区类别:

cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
登录后复制

我们的目标是为每个国家/地区分配一个索引,而不是使用 get_dummies 进行单热编码,例如 cc_index = [1,2,1,3] .

解决方案:

要将 Pandas 类别转换为数字索引,请按照下列步骤操作:

  1. 更改分类列:

    df.cc = pd.Categorical(df.cc)
    登录后复制
  2. 创建一个新列来存储类别代码:

    df['code'] = df.cc.codes
    登录后复制

这将生成一个数据框包含数字索引的附加代码列:

   cc  temp  code
0  US  37.0     2
1  CA  12.0     1
2  US  35.0     2
3  AU  20.0     0
登录后复制

或者,您可以利用 astype 方法将分类列直接转换为带有代码的分类列:

df.cc.astype('category').codes
登录后复制

另一个选项是使用分类列作为新数据框的索引:

df2 = pd.DataFrame(df.temp)
df2.index = pd.CategoricalIndex(df.cc)
登录后复制

以上是如何将 Pandas 类别转换为数值索引?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板