使用 T-SQL 删除 SQL Server 中的重复行
本指南演示如何使用 T-SQL 有效地从 SQL Server 表中删除重复行,重点关注特定列。 让我们使用带有 Employee
列的 EmployeeName
表作为示例。 目标是仅保留每个唯一员工姓名的一个实例。
一种稳健的方法利用窗口函数。以下查询可完成此操作:
<code class="language-sql">DELETE x FROM ( SELECT *, rn = ROW_NUMBER() OVER (PARTITION BY EmployeeName ORDER BY empId) FROM Employee ) x WHERE rn > 1;</code>
此查询使用 ROW_NUMBER()
为每个具有相同 EmployeeName
值的组(分区)中的每一行分配唯一的排名。 PARTITION BY EmployeeName
子句对行进行分组,ORDER BY empId
确定每个组内的排名顺序(假设 empId
是唯一标识符)。 rn
代表等级。
WHERE rn > 1
子句针对每组内排名大于 1 的行,有效删除除第一次出现(排名为 1)之外的所有重复项。
在执行DELETE
语句之前,预览将受影响的行至关重要。 将 DELETE
替换为 SELECT
以实现此目的:
<code class="language-sql">SELECT * FROM ( SELECT *, rn = ROW_NUMBER() OVER (PARTITION BY EmployeeName ORDER BY empId) FROM Employee ) x WHERE rn > 1;</code>
这允许在永久删除任何数据之前进行验证。
以上是如何使用T-SQL高效删除SQL Server中的重复记录?的详细内容。更多信息请关注PHP中文网其他相关文章!