Maison > développement back-end > Tutoriel Python > Comment supprimer les doublons dans la colonne A tout en conservant la ligne avec la valeur la plus élevée dans la colonne B ?

Comment supprimer les doublons dans la colonne A tout en conservant la ligne avec la valeur la plus élevée dans la colonne B ?

Mary-Kate Olsen
Libérer: 2024-11-08 09:46:02
original
1058 Les gens l'ont consulté

How to Remove Duplicates in Column A While Keeping the Row with the Highest Value in Column B?

Conserver la ligne avec la valeur B la plus élevée lors de la suppression des doublons dans la colonne A

La tâche à accomplir consiste à supprimer les valeurs en double dans la colonne A de une trame de données tout en préservant la ligne avec la valeur la plus élevée dans la colonne B. Pour y parvenir, nous pouvons utiliser les fonctions intégrées dans Pandas de Python bibliothèque.

Une approche consiste à trier la trame de données par colonne A, puis à supprimer les doublons tout en conservant la dernière occurrence. Ceci est exprimé ci-dessous :

df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
Copier après la connexion

Alternativement, une solution plus flexible pouvant prendre en compte différents critères consiste à regrouper le dataframe par colonne A. Au sein de chaque groupe, la ligne avec la valeur maximale dans la colonne B peut être extrait. Ceci peut être réalisé en utilisant le code suivant :

df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
Copier après la connexion

En implémentant l'une ou l'autre de ces méthodes, vous pouvez éliminer efficacement les valeurs en double dans la colonne A tout en garantissant que les lignes avec les valeurs B les plus élevées sont préservées.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal