Python リスト内の重複要素を効率的に特定して分離するにはどうすればよいですか?-Python チュートリアル-php.cn

Python リスト内の重複要素を効率的に特定して分離するにはどうすればよいですか?

Susan Sarandon

リリース： 2024-12-28 09:54:12

オリジナル

652 人が閲覧しました

How Can I Efficiently Identify and Isolate Duplicate Elements in a Python List?

リスト内の重複の特定と分離: 徹底ガイド

リスト内の重複の検索と分離は、一般的なデータ操作タスクです。大規模なリストを扱う場合は、効率を高めるためにプロセスを最適化することが重要です。この記事では、さまざまなテクニックを使用してこのタスクを達成するための包括的なガイドを提供します。

Counter 関数の使用:

Python の collections.Counter クラスは、重複を識別する便利な方法を提供します。その Counter(list) イニシャライザは、入力リスト内の各要素の出現をカウントする辞書を生成します。 count プロパティを使用して辞書をフィルタリングすることで重複を抽出できます。

import collections

a = [1, 2, 3, 2, 1, 5, 6, 5, 5, 5]
duplicates = [item for item, count in collections.Counter(a).items() if count > 1]
print(duplicates)  # [1, 2, 5]

ログイン後にコピー

セットの使用:

Python のセットは、重複を見つけるための簡単なソリューションを提供します。セットがリストから作成される場合、セットには一意の要素のみが含まれるため、すべての重複は自動的に削除されます。

a = [1, 2, 3, 2, 1, 5, 6, 5, 5, 5]
unique_elements = set(a)

ログイン後にコピー

「seen」変数の使用:

別重複を識別する方法は、リストを走査するときに表示された要素のセットを維持することです。要素がすでにセット内にある場合、その要素は重複とみなされます。

seen = set()
duplicates = []

for x in a:
    if x in seen:
        duplicates.append(x)
    else:
        seen.add(x)

ログイン後にコピー

リスト内包表記の使用:

リスト内包表記は、「「見た」変数メソッド。次のコードは、上記と同じ結果を実現します。

seen = set()
duplicates = [x for x in a if x in seen or seen.add(x)]

ログイン後にコピー

特別な考慮事項:

ハッシュ不可能な要素を含むリストの場合、セットは使用できません。このような場合、各要素を他のすべての要素と比較する二次時間解が必要です。
各手法の効率は、リストのサイズとその要素の性質によって異なります。小さいリストの場合は、「seen」変数メソッドで十分ですが、大きいリストの場合は、Counter または set を使用する方が効率的です。

以上がPython リスト内の重複要素を効率的に特定して分離するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。