다음은 다중 속성 중복 데이터를 중복 제거하는 Python 예제입니다. 좋은 참조 값이 있으며 모든 사람에게 도움이 되기를 바랍니다. 함께 살펴보겠습니다
Pandas 모듈에서 중복 데이터를 제거하는 Python 단계:
1) DataFrame의 Duplicate 메서드를 사용하여 부울 시리즈를 반환하여 각 행에 중복 행이 있는지 표시합니다. 중복된 행은 FALSE로 표시되고 중복된 행은 TRUE로 표시됩니다.
2) DataFrame의 drop_duplicates 메서드를 사용하여 중복 행이 제거된 DataFrame을 반환합니다.
참고:
duplicated 메소드와 drop_duplicates 메소드에 매개변수가 설정되지 않은 경우 이 두 메소드는 지정된 속성 이름(또는 열)이 이 두 메소드 이름에 추가되면 기본적으로 모두 판단됩니다. 예를 들어,frame.drop_duplicates(['state']) 그런 다음 열의 일부(상태 열)를 지정하여 중복을 확인합니다.
구체적인 예는 다음과 같습니다.
>>> import pandas as pd >>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} >>> frame=pd.DataFrame(data) >>> frame pop state 0 a 1 1 b 1 2 c 2 3 d 2 >>> IsDuplicated=frame.duplicated() >>> print IsDuplicated 0 False 1 False 2 False 3 False dtype: bool >>> frame=frame.drop_duplicates(['state']) >>> frame pop state 0 a 1 2 c 2 >>> IsDuplicated=frame.duplicated(['state']) >>> print IsDuplicated 0 False 2 False dtype: bool >>>
위 내용은 Python은 다중 속성 중복 데이터를 중복 제거합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!