> 백엔드 개발 > 파이썬 튜토리얼 > 팬더에서 중복 인덱스 행을 효율적으로 제거하는 방법은 무엇입니까?

팬더에서 중복 인덱스 행을 효율적으로 제거하는 방법은 무엇입니까?

Susan Sarandon
풀어 주다: 2024-11-19 10:58:02
원래의
323명이 탐색했습니다.

How to Efficiently Remove Duplicate Index Rows in pandas?

pandas에서 중복 인덱스 행을 효율적으로 제거

pandas에서는 중복 인덱스 값이 다양한 소스에서 발생할 수 있습니다. 이러한 중복성을 효과적으로 제거하려면 기본 메커니즘을 이해하고 다양한 시나리오에 가장 적합한 솔루션을 채택하는 것이 중요합니다.

일반적인 접근 방식 중 하나는 drop_duplicates 방법을 활용하는 것입니다. 그러나 특히 대규모 데이터 세트로 작업할 때 성능이 크게 저하될 수 있습니다. 또는 groupby 방법은 인덱스 값을 기준으로 행을 그룹화하고 중복되지 않은 첫 번째 또는 마지막 행을 선택하여 보다 효율적인 옵션을 제공합니다.

그러나 가장 효율적인 솔루션은 복제 방법을 직접 사용하는 것입니다. 팬더 인덱스. keep 인수를 'first'로 지정하면 이 메서드는 중복 인덱스를 나타내는 부울 계열을 반환합니다. 그런 다음 부울 인덱싱을 사용하여 중복 값이 ​​있는 행을 필터링할 수 있습니다.

예를 들어 다음 DataFrame을 고려하세요.

                      Sta  Precip1hr  Precip5min  Temp  DewPnt  WindSpd  WindDir  AtmPress
Date                                                                                      
2001-01-01 00:00:00  KPDX          0           0     4       3        0        0     30.31
2001-01-01 00:05:00  KPDX          0           0     4       3        0        0     30.30
2001-01-01 00:10:00  KPDX          0           0     4       3        4       80     30.30
2001-01-01 00:15:00  KPDX          0           0     3       2        5       90     30.30
2001-01-01 00:20:00  KPDX          0           0     3       2       10      110     30.28
로그인 후 복사

중복 인덱스 값을 제거하려면 다음 코드를 사용할 수 있습니다.

df = df[~df.index.duplicated(keep='first')]
로그인 후 복사

이 솔루션은 효율적이고 간결하며 Pandas DataFrame에서 중복 인덱스 행을 제거하는 편리한 방법을 제공합니다.

위 내용은 팬더에서 중복 인덱스 행을 효율적으로 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿