Pandas 데이터 프레임에서 중복 열 제거
중복 열이 포함된 데이터 프레임을 처리할 때 효과적인 데이터를 위해 이러한 중복을 제거해야 합니다. 분석. 이 문서에서는 문제의 모든 측면을 해결하면서 Pandas에서 중복 열을 제거하는 포괄적인 솔루션을 제공합니다.
중복 열 이름
중복 이름만을 기준으로 열을 제거하려면, 간단한 해결책은 다음과 같습니다.
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
이 줄은 중복된 열 이름을 확인하고 고유한 이름만 유지합니다.
중복된 열 값
중복된 값을 기준으로 열을 제거하는 것이 목표라면 데이터프레임을 바꾸지 않고 다른 접근 방식이 필요합니다.
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
이 방법은 각 열 내에서 중복된 값을 확인하고 모든 값이 중복되는 열을 제거합니다.
중복된 인덱스
중복된 인덱스를 제거하려면 유사한 접근 방식을 따르세요.
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
추가 참고 사항
위 내용은 Pandas Dataframe에서 중복 열을 제거하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!