Identifier et isoler les doublons dans les listes : un guide exhaustif
Rechercher et isoler les doublons dans une liste est une tâche courante de manipulation de données. Lorsqu'il s'agit de listes volumineuses, il est important d'optimiser le processus pour plus d'efficacité. Cet article fournit un guide complet pour réaliser cette tâche en utilisant diverses techniques.
Utilisation de la fonction Counter :
Les collections Python.La classe Counter fournit un moyen pratique d'identifier les doublons. Son initialiseur Counter(list) produit un dictionnaire qui compte les occurrences de chaque élément dans la liste d'entrée. Les doublons peuvent être extraits en filtrant le dictionnaire à l'aide de la propriété count.
import collections a = [1, 2, 3, 2, 1, 5, 6, 5, 5, 5] duplicates = [item for item, count in collections.Counter(a).items() if count > 1] print(duplicates) # [1, 2, 5]
Utilisation des ensembles :
Les ensembles en Python offrent une solution simple pour rechercher des doublons. Lorsqu'un ensemble est créé à partir d'une liste, tous les doublons sont automatiquement supprimés car les ensembles ne contiennent que des éléments uniques.
a = [1, 2, 3, 2, 1, 5, 6, 5, 5, 5] unique_elements = set(a)
Utilisation de la variable « vu » :
Un autre La méthode d'identification des doublons consiste à conserver un ensemble d'éléments vus au fur et à mesure que la liste est parcourue. Si un élément est déjà dans l'ensemble, il est considéré comme un doublon.
seen = set() duplicates = [] for x in a: if x in seen: duplicates.append(x) else: seen.add(x)
Utilisation de la compréhension de liste :
La compréhension de liste fournit un moyen concis d'effectuer le " méthode variable "vu". Le code suivant obtient le même résultat que ci-dessus :
seen = set() duplicates = [x for x in a if x in seen or seen.add(x)]
Considérations spéciales :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!