リスト内の重複の特定と分離: 徹底ガイド
リスト内の重複の検索と分離は、一般的なデータ操作タスクです。大規模なリストを扱う場合は、効率を高めるためにプロセスを最適化することが重要です。この記事では、さまざまなテクニックを使用してこのタスクを達成するための包括的なガイドを提供します。
Counter 関数の使用:
Python の collections.Counter クラスは、重複を識別する便利な方法を提供します。その Counter(list) イニシャライザは、入力リスト内の各要素の出現をカウントする辞書を生成します。 count プロパティを使用して辞書をフィルタリングすることで重複を抽出できます。
import collections a = [1, 2, 3, 2, 1, 5, 6, 5, 5, 5] duplicates = [item for item, count in collections.Counter(a).items() if count > 1] print(duplicates) # [1, 2, 5]
セットの使用:
Python のセットは、重複を見つけるための簡単なソリューションを提供します。セットがリストから作成される場合、セットには一意の要素のみが含まれるため、すべての重複は自動的に削除されます。
a = [1, 2, 3, 2, 1, 5, 6, 5, 5, 5] unique_elements = set(a)
「seen」変数の使用:
別重複を識別する方法は、リストを走査するときに表示された要素のセットを維持することです。要素がすでにセット内にある場合、その要素は重複とみなされます。
seen = set() duplicates = [] for x in a: if x in seen: duplicates.append(x) else: seen.add(x)
リスト内包表記の使用:
リスト内包表記は、「 「見た」変数メソッド。次のコードは、上記と同じ結果を実現します。
seen = set() duplicates = [x for x in a if x in seen or seen.add(x)]
特別な考慮事項:
以上がPython リスト内の重複要素を効率的に特定して分離するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。