Pandas データフレームの重複する列を削除する
重複した列を含むデータフレームを扱う場合、データを有効にするにはこれらの冗長性を排除する必要があります。分析。この記事では、Pandas で重複する列を削除するための包括的なソリューションを提供し、問題のあらゆる側面に対処します。
重複した列名
重複した名前のみに基づいて列を削除するには、簡単な解決策は次のとおりです。
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
この行は重複する列名をチェックし、一意のもののみを保持します。
重複した列の値
重複値に基づいて列を削除することが目的の場合は、データフレームを転置せずに別のアプローチが必要です。
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
このメソッドは、各列内の重複値をチェックし、すべての値が重複している列を削除します。
重複したインデックス
重複したインデックスを削除するには、同様のアプローチに従います:
<code class="python">df = df.loc[~df.index.duplicated(),:].copy()</code>
追加のメモ
以上がPandas データフレームで重複する列を削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。