한 데이터프레임에는 있지만 다른 데이터프레임에는 없는 행을 찾는 방법(df1과 df2 비교)

Susan Sarandon
풀어 주다: 2024-10-19 21:07:03
원래의
654명이 탐색했습니다.

How to Find Rows Present in One Dataframe but Not in Another (Comparing df1 and df2)?

데이터 프레임 비교: 한 행에는 있지만 다른 행에는 없는 행 찾기

데이터 프레임을 비교하여 차이점을 식별하는 것은 데이터 품질 보증 및 병합에 중요합니다. 운영. 이 경우 특정 구조를 가진 두 개의 데이터 프레임(df1 및 df2)이 있으며 df2에는 있지만 df1에는 없는 행을 확인해야 합니다.

처음에 df1 != df2를 사용하여 데이터 프레임을 비교하려고 시도한 결과 오류. 이 접근 방식은 행과 열이 동일한 데이터프레임에만 작동합니다. 대칭적 차이를 찾으려면 다른 접근 방식이 필요합니다.

한 가지 방법은 데이터 프레임을 연결하는 것입니다.

df = pd.concat([df1, df2])
df = df.reset_index(drop=True)
로그인 후 복사

그런 다음 연결된 데이터 프레임을 모든 열로 그룹화합니다.

df_gpby = df.groupby(list(df.columns))
로그인 후 복사

다음으로 행이 하나만 존재하는 인덱스 값을 얻어 고유 레코드를 식별합니다.

idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]
로그인 후 복사

이러한 인덱스를 사용하여 데이터 프레임을 필터링하여 원하는 결과를 얻을 수 있습니다.

df.reindex(idx)
로그인 후 복사

이 접근 방식은 Date 인덱스와 Fruit 열의 비교를 기반으로 df2에는 있지만 df1에는 없는 행을 제공합니다.

위 내용은 한 데이터프레임에는 있지만 다른 데이터프레임에는 없는 행을 찾는 방법(df1과 df2 비교)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿