Pandas : conversion de catégories en indices numériques
Pour convertir les catégories d'une trame de données Pandas en indices numériques, nous pouvons suivre la méthode efficace fournie par un utilisateur :
Étape 1 : Catégoriser la colonne
Tout d'abord, convertissez la colonne cible (dans ce cas, cc) en un type catégoriel :
<code class="python">df.cc = pd.Categorical(df.cc)</code>
Étape 2 : Capturer les codes de catégorie
Créez une nouvelle colonne nommée code pour stocker les codes de catégorie :
<code class="python">df['code'] = df.cc.codes</code>
Résultat :
Le dataframe comprend désormais une colonne de codes avec des indices correspondant aux catégories :
cc | temp | code |
---|---|---|
US | 37.0 | 2 |
CA | 12.0 | 1 |
US | 35.0 | 2 |
AU | 20.0 | 0 |
Options supplémentaires :
<code class="python">df.cc.astype('category').codes</code>
<code class="python">df2 = pd.DataFrame(df.temp) df2.index = pd.CategoricalIndex(df.cc)</code>
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!