Considérez un DataFrame avec une colonne catégorielle, telle que les codes de pays :
cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0
Pour convertir ces catégories en indices, en évitant l'utilisation de get_dummies et numpy, envisagez les étapes suivantes :
df.cc = pd.Categorical(df.cc)
df['code'] = df.cc.codes
Le DataFrame résultant comprendra un nouvelle colonne appelée code avec les indices numériques :
cc temp code 0 US 37.0 2 1 CA 12.0 1 2 US 35.0 2 3 AU 20.0 0
Alternativement, vous pouvez obtenir les codes des catégories sans modifier le DataFrame :
df.cc.astype('category').codes
df2 = pd.DataFrame(df.temp) df2.index = pd.CategoricalIndex(df.cc)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!