고유한 열 값으로 행 검색: 종합 가이드
많은 프로그래밍 시나리오에서는 특정 열 내의 고유한 값을 기반으로 행을 추출해야 합니다. 이 문서에서는 Python에서 널리 사용되는 Pandas 라이브러리를 사용하여 이 작업을 수행하는 방법을 살펴봅니다.
쿼리:
표시된 것처럼 COL1과 COL2라는 두 개의 열이 있는 데이터세트를 생각해 보세요. 아래:
COL1 COL2 a.com 22 b.com 45 c.com 34 e.com 45 f.com 56 g.com 22 h.com 45
목표는 COL2에 고유한 값이 포함된 행만 검색하는 것입니다. 예상되는 출력은 다음과 같습니다.
COL1 COL2 a.com 22 b.com 45 c.com 34 f.com 56
해결책:
Pandas의 drop_duplicates 메서드는 하나 이상의 열을 기반으로 중복 행을 제거하는 간단한 방법을 제공합니다. 이 특정 작업에 이를 활용하는 방법은 다음과 같습니다.
<code class="python">import pandas as pd df = pd.DataFrame({'COL1': ['a.com', 'b.com', 'c.com', 'e.com', 'f.com', 'g.com', 'h.com'], 'COL2': [22, 45, 34, 45, 56, 22, 45]}) # Keep only the first occurrence of each unique value in COL2 df = df.drop_duplicates('COL2') print(df)</code>
출력:
COL1 COL2 0 a.com 22 1 b.com 45 2 c.com 34 4 f.com 56
추가 옵션:
drop_duplicates 메소드는 추가 옵션을 제공합니다. 중복 처리를 사용자 정의하는 옵션:
다음은 이러한 옵션을 보여주는 예입니다.
<code class="python"># Keep only the last occurrence of each unique value in COL2 df = df.drop_duplicates('COL2', keep='last') # Remove all duplicate rows from the dataset df = df.drop_duplicates('COL2', keep=False)</code>
위 내용은 Pandas DataFrame에서 고유한 값을 가진 행을 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!