DISTINCT-Abfrageoptimierung für eindeutige E-Mail-Extraktion
Bei der Abfrage einer Datenbank zum Abrufen von Daten aus mehreren Spalten wird häufig die DISTINCT-Klausel zur Eliminierung verwendet Duplizieren Sie Zeilen und stellen Sie Eindeutigkeit sicher. In bestimmten Szenarien kann es jedoch erforderlich sein, DISTINCT nur auf eine bestimmte Spalte anzuwenden, z. B. E-Mail-Adressen.
Bedenken Sie die folgende Abfrage:
SELECT ID, Email, ProductName, ProductModel FROM Products;
Wenn Sie dies ändern müssen Wenn eine Abfrage nur eindeutige E-Mail-Adressen zurückgibt und Duplikate in anderen Spalten zulässt, reicht die herkömmliche DISTINCT-Klausel möglicherweise nicht aus. Stattdessen können Sie eine Technik namens „Zeilennummerierung innerhalb von Partitionen“ anwenden.
Abfrageoptimierung mithilfe von Fensterfunktionen
Um das gewünschte Ergebnis zu erzielen, können wir Fensterfunktionen innerhalb verwenden eine Unterabfrage. In SQL Server 2005 oder höher kann die folgende Abfrage verwendet werden:
SELECT * FROM ( SELECT ID, Email, ProductName, ProductModel, ROW_NUMBER() OVER(PARTITION BY Email ORDER BY ID DESC) rn FROM Products ) a WHERE rn = 1;
Diese Abfrage erstellt zunächst eine abgeleitete Tabelle mithilfe einer Fensterfunktion, um jeder Zeile innerhalb jeder E-Mail-Partition eine eindeutige Zeilennummer (rn) zuzuweisen. beginnend mit der letzten Reihe. Die äußerste Abfrage filtert dann die abgeleitete Tabelle so, dass sie nur Zeilen mit einem rn-Wert von 1 enthält, wodurch sichergestellt wird, dass nur eine Zeile pro eindeutiger E-Mail-Adresse einbezogen wird.
Beispiel mit Filterung
Zusätzlich können Sie Filterkriterien in die Unterabfrage integrieren, um die Ergebnisse weiter zu verfeinern. Beispielsweise beschränkt die folgende modifizierte Abfrage die Ergebnisse auf Produkte mit einem bestimmten Modell und Namen, die eine bestimmte Zeichenfolge enthalten:
SELECT * FROM ( SELECT ID, Email, ProductName, ProductModel, ROW_NUMBER() OVER(PARTITION BY Email ORDER BY ID DESC) rn FROM Products WHERE ProductModel = 2 AND ProductName LIKE 'CYBER%' ) a WHERE rn = 1;
Durch die Verwendung von Fensterfunktionen und Zeilennummerierung innerhalb von Partitionen können Sie doppelte E-Mail-Adressen effektiv eliminieren Bewahrung der Eindeutigkeit in anderen Spalten, was einen effizienten und flexiblen Datenabruf ermöglicht.
Das obige ist der detaillierte Inhalt vonWie kann ich eindeutige E-Mail-Adressen effizient aus einer Datenbank extrahieren und gleichzeitig andere Spaltendaten beibehalten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!