Python에서 두 데이터 프레임 간의 차이점을 식별하는 방법은 무엇입니까?

Linda Hamilton
풀어 주다: 2024-10-19 21:12:01
원래의
248명이 탐색했습니다.

How to Identify Differences Between Two Dataframes in Python?

두 데이터프레임을 비교하여 차이점 식별

두 데이터프레임 df1과 df2를 비교하고 차이점을 확인하려면 다음 단계를 수행하세요. 참고하세요:

제공된 코드 df1 != df2는 동일한 행과 열이 있는 데이터 프레임에만 적용 가능하므로 대체 접근 방식이 필요합니다. 두 데이터프레임을 단일 데이터프레임 df로 연결하면 더욱 철저한 비교가 가능해집니다.

<code class="python">import pandas as pd

df = pd.concat([df1, df2])</code>
로그인 후 복사

연결한 후에는 잠재적인 인덱스 충돌을 방지하기 위해 df의 인덱스를 재설정하세요.

<code class="python">df = df.reset_index(drop=True)</code>
로그인 후 복사

데이터프레임을 각 열별로 그룹화하여 고유한 레코드를 식별합니다.

<code class="python">df_gpby = df.groupby(list(df.columns))</code>
로그인 후 복사

그룹 길이가 1인 고유 레코드의 인덱스를 추출합니다.

<code class="python">idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]</code>
로그인 후 복사

데이터프레임을 기준으로 필터링합니다. 고유 인덱스를 사용하여 df1과 df2 사이의 차이점을 얻습니다.

<code class="python">result = df.reindex(idx)</code>
로그인 후 복사

결과 결과 데이터 프레임에는 df2에는 있지만 df1에는 없는 행이 포함됩니다.

위 내용은 Python에서 두 데이터 프레임 간의 차이점을 식별하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿