Comment identifier et récupérer les éléments en double dans un DataFrame Pandas en Python ?

Patricia Arquette
Libérer: 2024-10-25 11:31:02
original
826 Les gens l'ont consulté

How to Identify and Retrieve Duplicate Items within a Pandas DataFrame in Python?

Comment obtenir une liste de tous les éléments en double à l'aide de Pandas en Python

Lorsque vous travaillez avec des ensembles de données, il est courant de rencontrer des entrées en double . Dans ce cas, vous souhaitez identifier tous les éléments en double dans votre ensemble de données à l'aide de Pandas.

Pour y parvenir, vous pouvez utiliser l'approche suivante :

Méthode 1 (imprimer toutes les lignes avec ID en double :

<code class="python">import pandas as pd

# Read the CSV data into a DataFrame
df = pd.read_csv("dup.csv")

# Extract the "ID" column
ids = df["ID"]

# Create a new DataFrame with only the duplicate values
duplicates = df[ids.isin(ids[ids.duplicated()])]

# Sort the DataFrame by the "ID" column
duplicates.sort_values("ID", inplace=True)

# Print the duplicate values
print(duplicates)</code>
Copier après la connexion

Méthode 2 (Groupby et concaténer les groupes en double) :

Cette méthode combine les groupes en double, ce qui donne une représentation concise des éléments en double :

<code class="python"># Group the DataFrame by the "ID" column
grouped = df.groupby("ID")

# Filter the grouped DataFrame to include only groups with more than one row
duplicates = [g for _, g in grouped if len(g) > 1]

# Concatenate the duplicate groups into a new DataFrame
duplicates = pd.concat(duplicates)

# Print the duplicate values
print(duplicates)</code>
Copier après la connexion

En utilisant la méthode 1 ou la méthode 2, vous pouvez obtenir avec succès une liste de tous les éléments en double dans votre ensemble de données, vous permettant de les inspecter visuellement et d'enquêter sur les écarts.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!