communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > développement back-end > Tutoriel Python > Comment identifier toutes les lignes en double dans un DataFrame Pandas ?

Comment identifier toutes les lignes en double dans un DataFrame Pandas ?

Barbara Streisand

Libérer： 2024-10-25 15:15:02

original

1167 Les gens l'ont consulté

How to Identify All Duplicate Rows in a Pandas DataFrame?

Comment puis-je obtenir une liste de tous les éléments en double à l'aide de Pandas en Python ?

Problème :

Votre Pandas DataFrame contient des lignes en double, mais l'utilisation de la méthode duplicated() ne renvoie que la première instance en double. Vous désirez une liste complète de toutes les occurrences de lignes dupliquées pour une comparaison manuelle.

Solution 1 : Isoler les lignes avec des ID en double

Importer les pandas en tant que pd.
Lisez vos données dans un DataFrame df.
Extrayez la colonne ID dans une série d'identifiants distincts.
Filtrez df selon que la valeur de l'ID correspond à l'un des ID en double dans ids[ids.duplicate()] :

<code class="python">df[ids.isin(ids[ids.duplicated()])].sort_values("ID")</code>

Copier après la connexion

Bien que cette méthode récupère efficacement toutes les lignes en double, elle crée des lignes d'ID en double dans la sortie.

Solution 2 : Regrouper par ID et filtrer les doublons

Utilisez groupby("ID") sur df pour regrouper les lignes en fonction de leurs valeurs d'ID.
Filtrez les groupes résultants pour ne conserver que ceux avec plus d'une ligne :

<code class="python">pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)</code>

Copier après la connexion

Cette approche donne une sortie rationalisée sans lignes d'ID redondantes.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Article précédent：Comment déterminer si un fichier texte est vide en Python ? Article suivant：## Flatten vs Ravel : Quand devez-vous utiliser chaque fonction Numpy ?

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Derniers numéros

function_exists() ne peut pas déterminer la fonction personnalisée Function test () {return true;} if (function_exists ('test')) {echo "le test est une ...

Depuis 2024-04-29 11:01:01

0

3

2861

Comment afficher la version mobile de Google Chrome Bonjour professeur, comment puis-je changer Google Chrome en version mobile ?

Depuis 2024-04-23 00:22:19

0

11

3004

La fenêtre enfant exploite la fenêtre parent, mais la sortie ne répond pas. Les deux premières phrases sont exécutables, mais la dernière ne peut pas être implémentée...

Depuis 2024-04-19 15:37:47

0

1

2494

Il n'y a aucune sortie dans la fenêtre parent document.onclick = function(){ window.opener.document.write('Je suis la sortie de la fenêt...

Depuis 2024-04-18 23:52:34

0

1

2426

Où sont les didacticiels sur la cartographie mentale CSS ? Didacticiel

Depuis 2024-04-16 10:10:18

0

0

2469

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal