Suppression efficace des lignes en double dans SQL Server : une approche CTE
Lorsqu'il s'agit de tables SQL Server dépourvues de clé unique, l'élimination des lignes en double nécessite une approche stratégique. Cela peut être accompli efficacement en utilisant des expressions de table communes (CTE) en conjonction avec la fonction ROW_NUMBER()
.
Voici une solution démontrant cette technique :
WITH RowNumberedRows AS ( SELECT [col1], [col2], [col3], [col4], [col5], [col6], [col7], RN = ROW_NUMBER() OVER (PARTITION BY col1 ORDER BY col1) FROM dbo.Table1 ) DELETE FROM RowNumberedRows WHERE RN > 1;
Explication détaillée :
Le CTE, bien nommé RowNumberedRows
, attribue un numéro de ligne unique (RN
) à chaque ligne du tableau. La fonction ROW_NUMBER()
partitionne les lignes en fonction de la colonne col1
, en attribuant des numéros séquentiels dans chaque partition. Cela garantit que la première occurrence de chaque groupe en double reçoit un RN
de 1.
L'instruction DELETE
cible ensuite le CTE, en supprimant toutes les lignes où RN
est supérieur à 1. Cela ne laisse que la première ligne de chaque ensemble de doublons, supprimant ainsi les doublons.
Exemple :
L'application de cette requête à des exemples de données donne le résultat suivant :
COL1 | COL2 | COL3 | COL4 | COL5 | COL6 | COL7 |
---|---|---|---|---|---|---|
john | 1 | 1 | 1 | 1 | 1 | 1 |
sally | 2 | 2 | 2 | 2 | 2 | 2 |
Observez que la ligne « john » en double a été éliminée avec succès.
L'adaptabilité de cette méthode est remarquable. En ajustant les colonnes de partitionnement dans la fonction ROW_NUMBER()
(par exemple, PARTITION BY col1, col2
), vous pouvez définir l'unicité en fonction de plusieurs colonnes selon vos besoins.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!