> 백엔드 개발 > 파이썬 튜토리얼 > Pandas Dataframe에서 중복 열을 제거하는 방법은 무엇입니까?

Pandas Dataframe에서 중복 열을 제거하는 방법은 무엇입니까?

DDD
풀어 주다: 2024-11-01 14:08:02
원래의
301명이 탐색했습니다.

How to Remove Duplicate Columns in a Pandas Dataframe?

Pandas 데이터 프레임에서 중복 열 제거

중복 열이 포함된 데이터 프레임을 처리할 때 효과적인 데이터를 위해 이러한 중복을 제거해야 합니다. 분석. 이 문서에서는 문제의 모든 측면을 해결하면서 Pandas에서 중복 열을 제거하는 포괄적인 솔루션을 제공합니다.

중복 열 이름

중복 이름만을 기준으로 열을 제거하려면, 간단한 해결책은 다음과 같습니다.

<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
로그인 후 복사

이 줄은 중복된 열 이름을 확인하고 고유한 이름만 유지합니다.

중복된 ​​열 값

중복된 값을 기준으로 열을 제거하는 것이 목표라면 데이터프레임을 바꾸지 않고 다른 접근 방식이 필요합니다.

<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
로그인 후 복사

이 방법은 각 열 내에서 중복된 값을 확인하고 모든 값이 중복되는 열을 제거합니다.

중복된 ​​인덱스

중복된 ​​인덱스를 제거하려면 유사한 접근 방식을 따르세요.

<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
로그인 후 복사

추가 참고 사항

  • 제공된 솔루션에서는 데이터프레임이 이미 df라는 변수에 로드되어 있다고 가정합니다.
  • ~df.columns.duplicated() 및 ~df.index.duplicated()는 어떤 열 또는 인덱스가 중복되었습니다.
  • ~df.apply(lambda x: x.duplicated(),axis=1).all()의 all() 함수는 열 내의 모든 값이 중복되었는지 확인합니다.
  • .copy() 메서드는 수정 사항이 포함된 새 데이터 프레임을 생성하는 데 사용되며 기존 데이터 프레임 수정과 관련된 문제를 방지합니다.

위 내용은 Pandas Dataframe에서 중복 열을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿