大規模なデータセットを扱う場合、重複行が発生することがよくあります。 SQL Server では、データの整合性と最適化には、これらの重複を効率的に識別する方法が不可欠です。この質問では、「組織」と呼ばれるテーブルから重複行とそれに関連付けられた ID を取得する手法について説明します。
重複行を見つけるには、次のクエリを使用できます。
SELECT orgName, COUNT(*) AS dupes FROM organizations GROUP BY orgName HAVING COUNT(*) > 1
このクエリ組織名ごとに重複の数を返します。便利ではありますが、それらの行に関連付けられた ID は提供されません。これを実現するには、サブクエリを利用して「organizations」テーブルと結合します。
select o.orgName, oc.dupeCount, o.id from organizations o inner join ( SELECT orgName, COUNT(*) AS dupeCount FROM organizations GROUP BY orgName HAVING COUNT(*) > 1 ) oc on o.orgName = oc.orgName
このクエリは、元の「organizations」テーブル (エイリアス「o」) とサブクエリの間の結合を実行します。これは、各組織名 (「oc」というエイリアス) の重複の数を計算します。結合条件により、2 つの結果セット間で組織名が一致する行のみが取得されるようになります。
その結果、組織名、重複の数、および対応する ID を示すテーブルが得られます。重複する各組織行。この情報は、データの問題を特定して解決したり、ユーザーを他のテーブルの正しい組織に統合したりするために使用され、データの整合性が促進され、データ管理プロセスが合理化されます。
以上がSQL Server で重複行とそれに関連付けられた ID を特定するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。