Optimisation des requêtes DISTINCT pour une extraction d'e-mails uniques
Lors de l'interrogation d'une base de données pour récupérer des données de plusieurs colonnes, la clause DISTINCT est couramment utilisée pour éliminer dupliquez les lignes et assurez l’unicité. Cependant, dans certains scénarios, il peut être nécessaire d'appliquer DISTINCT uniquement à une colonne spécifique, telle que les adresses e-mail.
Considérez la requête suivante :
SELECT ID, Email, ProductName, ProductModel FROM Products;
Si vous devez modifier ceci requête pour renvoyer uniquement des adresses e-mail distinctes, autorisant les doublons dans d'autres colonnes, la clause DISTINCT traditionnelle peut ne pas suffire. Au lieu de cela, vous pouvez utiliser une technique appelée « numérotation des lignes dans les partitions ».
Optimisation des requêtes à l'aide des fonctions de fenêtre
Pour obtenir le résultat souhaité, nous pouvons utiliser les fonctions de fenêtre dans une sous-requête. Dans SQL Server 2005 ou supérieur, la requête suivante peut être utilisée :
SELECT * FROM ( SELECT ID, Email, ProductName, ProductModel, ROW_NUMBER() OVER(PARTITION BY Email ORDER BY ID DESC) rn FROM Products ) a WHERE rn = 1;
Cette requête crée d'abord une table dérivée à l'aide d'une fonction de fenêtre pour attribuer à chaque ligne de chaque partition de messagerie un numéro de ligne unique (rn), en commençant par la dernière rangée. La requête la plus externe filtre ensuite la table dérivée pour inclure uniquement les lignes avec une valeur rn de 1, garantissant l'inclusion d'une seule ligne par adresse e-mail unique.
Exemple avec filtrage
De plus, vous pouvez intégrer des critères de filtrage dans la sous-requête pour affiner davantage les résultats. Par exemple, la requête modifiée suivante restreint les résultats aux produits avec un modèle et un nom spécifiques contenant une certaine chaîne :
SELECT * FROM ( SELECT ID, Email, ProductName, ProductModel, ROW_NUMBER() OVER(PARTITION BY Email ORDER BY ID DESC) rn FROM Products WHERE ProductModel = 2 AND ProductName LIKE 'CYBER%' ) a WHERE rn = 1;
En utilisant les fonctions de fenêtre et la numérotation des lignes dans les partitions, vous pouvez éliminer efficacement les adresses e-mail en double tout en préservant l'unicité des autres colonnes, permettant une récupération de données efficace et flexible.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!