데이터 프레임 비교: 한 행에는 있지만 다른 행에는 없는 행 찾기
데이터 프레임을 비교하여 차이점을 식별하는 것은 데이터 품질 보증 및 병합에 중요합니다. 운영. 이 경우 특정 구조를 가진 두 개의 데이터 프레임(df1 및 df2)이 있으며 df2에는 있지만 df1에는 없는 행을 확인해야 합니다.
처음에 df1 != df2를 사용하여 데이터 프레임을 비교하려고 시도한 결과 오류. 이 접근 방식은 행과 열이 동일한 데이터프레임에만 작동합니다. 대칭적 차이를 찾으려면 다른 접근 방식이 필요합니다.
한 가지 방법은 데이터 프레임을 연결하는 것입니다.
df = pd.concat([df1, df2]) df = df.reset_index(drop=True)
그런 다음 연결된 데이터 프레임을 모든 열로 그룹화합니다.
df_gpby = df.groupby(list(df.columns))
다음으로 행이 하나만 존재하는 인덱스 값을 얻어 고유 레코드를 식별합니다.
idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]
이러한 인덱스를 사용하여 데이터 프레임을 필터링하여 원하는 결과를 얻을 수 있습니다.
df.reindex(idx)
이 접근 방식은 Date 인덱스와 Fruit 열의 비교를 기반으로 df2에는 있지만 df1에는 없는 행을 제공합니다.
위 내용은 한 데이터프레임에는 있지만 다른 데이터프레임에는 없는 행을 찾는 방법(df1과 df2 비교)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!