Eindeutige Datensätze effektiv pivotieren
Pivot-Abfragen spielen eine entscheidende Rolle bei der Umwandlung von Daten in ein Tabellenformat und ermöglichen eine einfache Datenanalyse. Beim Umgang mit unterschiedlichen Datensätzen kann das Standardverhalten von Pivot-Abfragen jedoch problematisch werden.
Problem: Unterschiedliche Werte ignorieren
Beachten Sie die folgende Tabelle:
------------------------------------------------------ | Id Code percentage name name1 activity | ----------------------------------------------------- | 1 Prashant 43.43 James James_ Running | | 1 Prashant 70.43 Sam Sam_ Cooking | | 1 Prashant 90.34 Lisa Lisa_ Walking | | 1 Prashant 0.00 James James_ Stealing | | 1 Prashant 0.00 James James_ Lacking | | 1 Prashant 73 Sam Sam_ Cooking 1 | ------------------------------------------------------
Eine herkömmliche Pivot-Abfrage wie:
SELECT Id,Code, MAX(CASE WHEN name = 'James' THEN activity END) AS James, MAX(CASE WHEN name1 = 'James_' THEN percentage END) AS James_, MAX(CASE WHEN name = 'Sam' THEN activity END) AS Sam, MAX(CASE WHEN name1 = 'Sam_' THEN percentage END) AS Sam_, MAX(CASE WHEN name = 'Lisa' THEN activity END) AS Lisa, MAX(CASE WHEN name1 = 'Lisa_' THEN percentage END) AS Lisa_ FROM A GROUP BY Id, Code
würde Folgendes ergeben Tabelle:
------------------------------------------------------------------- Id Code James James_ Sam Sam_ Lisa Lisa_ ------------------------------------------------------------------- 1 Prashant Running 43.43 Cooking 3.43 Walking 90.34 1 Prashant Stealing 0.0 NULL NULL NULL NULL -------------------------------------------------------------------
Das Problem hierbei ist, dass die Pivot-Abfrage eindeutige Werte für Name1 ignoriert, wenn Name wiederholt wird und der Prozentsatz 0 ist. In diesem Fall geht die Aktivität „Fehlend“ für James verloren.
Lösung: Verwendung von ROW_NUMBER() für Genauigkeit
Um dieses Problem zu beheben, können wir Folgendes vorstellen: ROW_NUMBER():
;with cte as ( select *, ROW_NUMBER() over (partition by name order by percentage desc) ROWNUM from A ) ...
Durch die Verwendung von ROW_NUMBER() partitionieren wir die Daten basierend auf dem Namen und weisen jeder Zeile eine eindeutige Nummer innerhalb dieser Partition zu. Dadurch können wir den Zusammenhang zwischen Aktivitäten und Prozentsätzen beibehalten, auch wenn der Name wiederholt wird.
Die resultierende Tabelle sieht wie folgt aus:
---------------------------------------------------------- | Id Code James James_ Sam Sam_ Lisa Lisa_ ---------------------------------------------------------- | 1 Prashant Running 43.43 Cooking 1 73 Walking 90.34 | 1 Prashant Stealing 0.00 Cooking 3.43 NULL NULL | 1 Prashant Lacking 0.00 NULL NULL NULL NULL ----------------------------------------------------------
Alle Aktivitäten, einschließlich „Fehlend“ für James werden nun in der Pivot-Tabelle dargestellt. Diese Technik stellt sicher, dass eindeutige Werte erhalten bleiben und genaue Daten für die Analyse bereitgestellt werden.
Das obige ist der detaillierte Inhalt vonWie kann ich Daten mit eindeutigen Datensätzen genau zentrieren, um den Verlust von Informationen zu vermeiden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!