Qu'est-ce que la fonction de déduplication Python ?

爱喝马黛茶的安东尼
Libérer: 2019-10-25 17:57:02
original
8753 Les gens l'ont consulté

Qu'est-ce que la fonction de déduplication Python ?

La déduplication des données peut utiliser les méthodes duplicated() et drop_duplicates().

DataFrame.duplicate(subset=None, keep='first') renvoie une série booléenne représentant les lignes en double

Paramètres :

sous-ensemble : étiquette de colonne ou séquence d'étiquettes, facultatif

Seules certaines colonnes sont prises en compte pour identifier les doublons, toutes les colonnes sont utilisées par défaut

conserver : {'first', 'last', False}, par défaut 'first'

first : marque les doublons, True sauf pour la première occurrence.

last : marque les doublons, True sauf pour la dernière occurrence.

Erreur : marquez tous les doublons comme vrais.

Recommandations associées : "Tutoriel sur les bases de Python"

import numpy as np
import pandas as pd
from pandas import Series, DataFrame
df = pd.read_csv('./demo_duplicate.csv')
print(df)
print(df['Seqno'].unique()) # [0. 1.]
# 使用duplicated 查看重复值
# 参数 keep 可以标记重复值 {'first','last',False}
print(df['Seqno'].duplicated())
'''
0    False
1     True
2     True
3     True
4    False
Name: Seqno, dtype: bool
'''
# 删除 series 重复数据
print(df['Seqno'].drop_duplicates())
'''
0    0.0
4    1.0
Name: Seqno, dtype: float64
'''
# 删除 dataframe 重复数据
print(df.drop_duplicates(['Seqno'])) # 按照 Seqno 来去重
'''
   Price     Seqno   Symbol   time
0  1623.0    0.0   APPL  1473411962
4  1649.0    1.0   APPL  1473411963
'''
# drop_dujplicates() 第二个参数 keep 包含的值 有: first、last、False
print(df.drop_duplicates(['Seqno'], keep='last')) # 保存最后一个
'''
   Price     Seqno   Symbol   time
3  1623.0    0.0   APPL  1473411963
4  1649.0    1.0   APPL  1473411963
'''
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal