> 백엔드 개발 > 파이썬 튜토리얼 > Pandas DataFrame에서 고유한 값을 가진 행을 검색하는 방법은 무엇입니까?

Pandas DataFrame에서 고유한 값을 가진 행을 검색하는 방법은 무엇입니까?

Mary-Kate Olsen
풀어 주다: 2024-11-04 04:11:30
원래의
607명이 탐색했습니다.

How to Retrieve Rows with Unique Values in a Pandas DataFrame?

고유한 열 값으로 행 검색: 종합 가이드

많은 프로그래밍 시나리오에서는 특정 열 내의 고유한 값을 기반으로 행을 추출해야 합니다. 이 문서에서는 Python에서 널리 사용되는 Pandas 라이브러리를 사용하여 이 작업을 수행하는 방법을 살펴봅니다.

쿼리:

표시된 것처럼 COL1과 COL2라는 두 개의 열이 있는 데이터세트를 생각해 보세요. 아래:

COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45
로그인 후 복사

목표는 COL2에 고유한 값이 포함된 행만 검색하는 것입니다. 예상되는 출력은 다음과 같습니다.

COL1  COL2
a.com 22
b.com 45
c.com 34
f.com 56
로그인 후 복사

해결책:

Pandas의 drop_duplicates 메서드는 하나 이상의 열을 기반으로 중복 행을 제거하는 간단한 방법을 제공합니다. 이 특정 작업에 이를 활용하는 방법은 다음과 같습니다.

<code class="python">import pandas as pd

df = pd.DataFrame({'COL1': ['a.com', 'b.com', 'c.com', 'e.com', 'f.com', 'g.com', 'h.com'],
                  'COL2': [22, 45, 34, 45, 56, 22, 45]})

# Keep only the first occurrence of each unique value in COL2
df = df.drop_duplicates('COL2')

print(df)</code>
로그인 후 복사

출력:

  COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56
로그인 후 복사

추가 옵션:

drop_duplicates 메소드는 추가 옵션을 제공합니다. 중복 처리를 사용자 정의하는 옵션:

  • keep='last': 각 고유 값의 마지막 발생을 유지합니다.
  • keep=False : 모든 중복 행을 완전히 제거합니다.

다음은 이러한 옵션을 보여주는 예입니다.

<code class="python"># Keep only the last occurrence of each unique value in COL2
df = df.drop_duplicates('COL2', keep='last')

# Remove all duplicate rows from the dataset
df = df.drop_duplicates('COL2', keep=False)</code>
로그인 후 복사

위 내용은 Pandas DataFrame에서 고유한 값을 가진 행을 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿