Udało mi się odtworzyć problem z wydajnością zapytania, który opisałbym jako nieoczekiwany. Szukam odpowiedzi, która koncentruje się na wewnętrznych.
Na moim komputerze następujące zapytanie wykonuje skanowanie indeksu klastrowego i zajmuje około 6,8 sekundy czasu procesora:
SELECT ID1, ID2
FROM two_col_key_test WITH (FORCESCAN)
WHERE ID1 NOT IN
(
N'1', N'2',N'3', N'4', N'5',
N'6', N'7', N'8', N'9', N'10',
N'11', N'12',N'13', N'14', N'15',
N'16', N'17', N'18', N'19', N'20'
)
AND (ID1 = N'FILLER TEXT' AND ID2 >= N'' OR (ID1 > N'FILLER TEXT'))
ORDER BY ID1, ID2 OFFSET 12000000 ROWS FETCH FIRST 1 ROW ONLY
OPTION (MAXDOP 1);
Następujące zapytanie wyszukuje indeks klastrowany (jedyną różnicą jest usunięcie FORCESCAN
podpowiedzi), ale zajmuje około 18,2 sekundy czasu procesora:
SELECT ID1, ID2
FROM two_col_key_test
WHERE ID1 NOT IN
(
N'1', N'2',N'3', N'4', N'5',
N'6', N'7', N'8', N'9', N'10',
N'11', N'12',N'13', N'14', N'15',
N'16', N'17', N'18', N'19', N'20'
)
AND (ID1 = N'FILLER TEXT' AND ID2 >= N'' OR (ID1 > N'FILLER TEXT'))
ORDER BY ID1, ID2 OFFSET 12000000 ROWS FETCH FIRST 1 ROW ONLY
OPTION (MAXDOP 1);
Plany zapytań są dość podobne. Dla obu zapytań z indeksu klastrowego odczytanych jest 120000001 wierszy:
Jestem na SQL Server 2017 CU 10. Oto kod, aby utworzyć i wypełnić two_col_key_test
tabelę:
drop table if exists dbo.two_col_key_test;
CREATE TABLE dbo.two_col_key_test (
ID1 NVARCHAR(50) NOT NULL,
ID2 NVARCHAR(50) NOT NULL,
FILLER NVARCHAR(50),
PRIMARY KEY (ID1, ID2)
);
DROP TABLE IF EXISTS #t;
SELECT TOP (4000) 0 ID INTO #t
FROM master..spt_values t1
CROSS JOIN master..spt_values t2
OPTION (MAXDOP 1);
INSERT INTO dbo.two_col_key_test WITH (TABLOCK)
SELECT N'FILLER TEXT' + CASE WHEN ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) > 8000000 THEN N' 2' ELSE N'' END
, ROW_NUMBER() OVER (ORDER BY (SELECT NULL))
, NULL
FROM #t t1
CROSS JOIN #t t2;
Mam nadzieję na odpowiedź, która wykracza poza raportowanie stosu połączeń. Widzę na przykład, że sqlmin!TCValSSInRowExprFilter<231,0,0>::GetDataX
potrzeba dużo więcej cykli procesora w wolnym zapytaniu w porównaniu do szybkiego:
Zamiast się tam zatrzymać, chciałbym zrozumieć, co to jest i dlaczego istnieje tak duża różnica między tymi dwoma zapytaniami.
Dlaczego istnieje duża różnica w czasie procesora dla tych dwóch zapytań?