De nombreux ensembles de données comportent des lignes représentant différentes entités, chacune avec plusieurs colonnes représentant des données sur les entités. Parfois, il devient nécessaire d'identifier la colonne spécifique contenant la valeur maximale pour chaque ligne. Cette tâche peut être réalisée à l'aide de la fonction idxmax().
Dans l'exemple donné, nous avons un DataFrame avec quatre colonnes : "Communications et recherche", "Business", "Général" et "Style de vie". Nous souhaitons créer une nouvelle colonne, "Max", qui contient le nom de la colonne correspondant à la valeur maximale de chaque ligne.
Pour ce faire, nous pouvons utiliser idxmax(axis=1) pour trouver l'index de la colonne. avec la valeur maximale :
df.idxmax(axis=1) # Output: 0 Communications 1 Business 2 Communications 3 Communications 4 Business dtype: object
Cela nous donne les étiquettes des colonnes, mais nous pouvons les convertir en noms de colonnes correspondants :
df['Max'] = df.idxmax(axis=1)
Le résultat DataFrame ressemblera à ceci :
communications and search | business | general | lifestyle | max |
---|---|---|---|---|
0.745763 | 0.050847 | 0.118644 | 0.084746 | Communications |
0.333333 | 0.000000 | 0.583333 | 0.083333 | Business |
0.617021 | 0.042553 | 0.297872 | 0.042553 | Communications |
0.435897 | 0.000000 | 0.410256 | 0.153846 | Communications |
0.358974 | 0.076923 | 0.410256 | 0.153846 | Business |
Notez que idxmax() peut également être utilisé pour trouver l'index row auquel la valeur maximale apparaît dans chaque colonne, en utilisant df.idxmax( ) (ou df.idxmax(axis=0)).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!