Pandas での重複列の効率的な削除
データフレーム内のデータを操作する場合、多くの場合、データの整合性を確保するために重複列を削除する必要があります。そして効率性。 Pandas には、この問題に対する洗練された解決策があります。
重複する列名の削除
「Time」、「Time Relative」、「Time Relative」という名前の列を持つデータフレームがあるとします。そして「Time」の複数のインスタンス。重複する列名を削除するには、次のコードを使用します。
<code class="python">df = df.loc[:,~df.columns.duplicated()].copy()</code>
このアプローチでは、重複する列名がチェックされ、一意の列名のみが保持されます。
値に基づいて重複を削除
場合によっては、値に基づいて重複した列を削除する必要がある場合があります。次のコードはまさにそれを行います:
<code class="python">df = df.loc[:,~df.apply(lambda x: x.duplicated(),axis=1).all()].copy()</code>
このコードはラムダ関数を各列に適用し、重複する値をチェックします。列内のすべての値が一意である場合、その列は保持されます。それ以外の場合は破棄されます。
注意事項
上記のアプローチでは値に基づいて重複列が効率的に削除されますが、特定の使用例を考慮することが重要です。意図した結果が得られない状況がある可能性があるため、この方法がデータおよび望ましい結果と一致していることを確認してください。
これらのアプローチを利用すると、データフレームから重複した列を簡単に削除でき、データの一貫性を確保できます。効率を向上させます。
以上がPandas で重複する列を効率的に削除するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。