Python에서 Pandas를 사용하여 모든 중복 항목 목록을 어떻게 얻나요?
문제:
Pandas DataFrame에 중복 행이 포함되어 있지만 Duplicated() 메서드를 사용하면 첫 번째 중복 인스턴스만 반환됩니다. 수동 비교를 위해 모든 중복 행 발생에 대한 포괄적인 목록이 필요합니다.
해결책 1: 중복 ID가 있는 행 격리
<code class="python">df[ids.isin(ids[ids.duplicated()])].sort_values("ID")</code>
이 방법은 모든 중복 행을 효과적으로 검색하는 반면 출력에는 중복 ID 행이 생성됩니다.
해결 방법 2 : ID별로 그룹화하고 중복 항목 필터링
<code class="python">pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)</code>
이 접근 방식은 중복된 ID 행 없이 간소화된 출력을 생성합니다.
위 내용은 Pandas DataFrame에서 모든 중복 행을 식별하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!