> 백엔드 개발 > 파이썬 튜토리얼 > Pandas의 특정 열에 중복 행을 삭제하는 방법은 무엇입니까?

Pandas의 특정 열에 중복 행을 삭제하는 방법은 무엇입니까?

Patricia Arquette
풀어 주다: 2024-12-14 06:03:14
원래의
652명이 탐색했습니다.

How to Drop Duplicate Rows Across Specific Columns in Pandas?

Python Pandas를 사용하여 여러 열에서 중복 값이 ​​있는 행 삭제

pandas drop_duplicates 함수는 DataFrame에서 중복 행을 제거하는 강력한 도구입니다. 하위 집합에서 중복된 행을 삭제하려고 합니다. 열?

다음 DataFrame을 고려하세요.

A B C
foo 0 A
foo 1 A
foo 1 B
bar 1 A

열 A와 C에서 일치하는 행을 삭제한다고 가정합니다. 이 경우 다음을 원할 것입니다. 행 0과 1을 삭제합니다.

keep과 함께 drop_duplicates 사용 매개변수

이를 달성하려면 keep 매개변수를 False로 설정한 상태에서 drop_duplicates 함수를 사용할 수 있습니다. 이 매개변수는 중복 행을 처리하는 방법을 지정합니다. 기본적으로 keep은 first로 설정됩니다. 즉, 처음으로 나타나는 중복 행이 유지됩니다. keep을 False로 설정하면 모든 중복 행이 삭제됩니다.

다음 코드는 A열과 C열에 중복 값이 ​​있는 행을 삭제하는 방법을 보여줍니다.

import pandas as pd

df = pd.DataFrame({"A": ["foo", "foo", "foo", "bar"], "B": [0, 1, 1, 1], "C": ["A", "A", "B", "A"]})

# Drop rows with duplicate values in columns 'A' and 'C'
df = df.drop_duplicates(subset=['A', 'C'], keep=False)

print(df)
로그인 후 복사

출력:

  A  B  C
2 foo  1  B
3 bar  1  A
로그인 후 복사

보시다시피 0행과 1행은 A열과 C열과 중복되므로 삭제되었습니다.

위 내용은 Pandas의 특정 열에 중복 행을 삭제하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿