Obecnie akceptowane odpowiedź jest najlepszą odpowiedzią, ale nie sądzę, że ma wystarczająco dobrą robotę wyjaśniając dlaczego. Inne odpowiedzi na pierwszy rzut oka wyglądają o wiele czystiej (kto chce napisać to brzydkie stwierdzenie przypadku), ale prawdopodobnie będzie znacznie gorzej, gdy zaczniesz działać na dużą skalę.
SELECT @@VERSION
Microsoft SQL Server 2016 (SP2) (KB4052908) - 13.0.5026.0 (X64)
Mar 18 2018 09:11:49
Copyright (c) Microsoft Corporation
Developer Edition (64-bit) on Windows 10 Enterprise 10.0 <X64> (Build 17763: )
Oto jak skonfigurowałem wszystko
DECLARE @Offset bigint = 0;
DECLARE @Max bigint = 10000000;
DROP TABLE IF EXISTS #Indebtedness;
CREATE TABLE #Indebtedness
(
call_case char(10) COLLATE DATABASE_DEFAULT NOT NULL,
date1 datetime NULL,
date2 datetime NULL,
date3 datetime NULL
);
WHILE @Offset < @Max
BEGIN
INSERT INTO #Indebtedness
( call_case, date1, date2, date3 )
SELECT @Offset + ROW_NUMBER() OVER ( ORDER BY ( SELECT NULL )),
DATEADD( DAY,
CASE WHEN RAND() > 0 THEN 1
ELSE -1 END * ROUND( RAND(), 0 ),
CURRENT_TIMESTAMP ),
DATEADD( DAY,
CASE WHEN RAND() > 0 THEN 1
ELSE -1 END * ROUND( RAND(), 0 ),
CURRENT_TIMESTAMP ),
DATEADD( DAY,
CASE WHEN RAND() > 0 THEN 1
ELSE -1 END * ROUND( RAND(), 0 ),
CURRENT_TIMESTAMP )
FROM master.dbo.spt_values a
CROSS APPLY master.dbo.spt_values b;
SET @Offset = @Offset + ROWCOUNT_BIG();
END;
W moim systemie otrzymałem 12,872 738 wierszy w tabeli. Jeśli wypróbuję każde z powyższych zapytań (poprawione, aby SELECT INTO
nie trzeba było czekać na zakończenie drukowania wyników w SSMS), otrzymam następujące wyniki:
Method | CPU time (ms) | Elapsed time (ms) | Relative Cost
-----------------------------------------------------------------------------------------
Tim Biegeleisen (CASE) | 13485 | 2167 | 2%
Red Devil (Subquery over MAX columns) | 55187 | 9891 | 14%
Vignesh Kumar (Subquery over columns) | 33750 | 5139 | 5%
Serkan Arslan (UNPIVOT) | 86205 | 15023 | 12%
Metal (STRING_SPLIT) | 459668 | 186742 | 68%
Jeśli spojrzysz na plany zapytań, stanie się dość oczywiste, dlaczego - dodając dowolny rodzaj unpivot lub agregacji (lub niebiańskiego zabrania STRING_SPLIT
) otrzymasz szereg różnych operatorów, których nie potrzebujesz (i to zmusza plan do równolegle, zabierając zasoby, których mogą chcieć inne zapytania). Zgodnie z umową, CASE
oparte na rozwiązaniu rozwiązanie nie idzie równolegle, działa bardzo szybko i jest niezwykle proste.
W takim przypadku, chyba że masz nieograniczone zasoby (nie masz), powinieneś wybrać najprostsze i najszybsze podejście.
Pojawiło się pytanie, co należy zrobić, jeśli trzeba dodawać nowe kolumny i rozszerzać instrukcję case. Tak, robi się to niewygodne, ale każde inne rozwiązanie. Jeśli jest to w rzeczywistości możliwy przepływ pracy, powinieneś przeprojektować swoją tabelę. To, czego chcesz, prawdopodobnie wygląda mniej więcej tak:
CREATE TABLE #Indebtedness2
(
call_case char(10) COLLATE DATABASE_DEFAULT NOT NULL,
activity_type bigint NOT NULL, -- This indicates which date# column it was, if you care
timestamp datetime NOT NULL
);
SELECT Indebtedness.call_case,
Indebtedness.activity_type,
Indebtedness.timestamp
FROM ( SELECT call_case,
activity_type,
timestamp,
ROW_NUMBER() OVER ( PARTITION BY call_case
ORDER BY timestamp DESC ) RowNumber
FROM #Indebtedness2 ) Indebtedness
WHERE Indebtedness.RowNumber = 1;
Z pewnością nie jest to wolne od potencjalnych problemów z wydajnością i będzie wymagało starannego dostrajania indeksu, ale jest najlepszym sposobem na obsługę dowolnej liczby potencjalnych znaczników czasu
W przypadku usunięcia jakichkolwiek odpowiedzi, oto wersje, które porównywałem (w kolejności)
SELECT
call_case,
CASE WHEN date1 > date2 AND date1 > date3
THEN date1
WHEN date2 > date3
THEN date2
ELSE date3 END AS [Latest Date]
FROM #indebtedness;
SELECT call_case,
(SELECT Max(v)
FROM (VALUES (date1), (date2), (date3),...) AS value(v)) as [MostRecentDate]
FROM #indebtedness
SELECT call_case,
(SELECT
MAX(call_case)
FROM ( VALUES
(MAX(date1)),
(MAX(date2))
,(max(date3))
) MyAlias(call_case)
)
FROM #indebtedness
group by call_case
select call_case, MAX(date) [Latest Date] from #indebtedness
UNPIVOT(date FOR col IN ([date1], [date2], [date3])) UNPVT
GROUP BY call_case
select call_case , max(cast(x.Item as date)) as 'Latest Date' from #indebtedness t
cross apply dbo.SplitString(concat(date1, ',', date2, ',', date3), ',') x
group by call_case