Oto podsumowanie: wykonuję wybrane zapytanie. Każda kolumna w klauzulach WHERE
i ORDER BY
znajduje się w jednym indeksie nieklastrowanym IX_MachineryId_DateRecorded
, jako część klucza lub jako INCLUDE
kolumna. Wybieram wszystkie kolumny, aby uzyskać przeglądanie zakładek, ale biorę tylko TOP (1)
, więc z pewnością serwer może powiedzieć, że wyszukiwanie musi być wykonane tylko raz, na końcu.
Co najważniejsze, kiedy zmuszam zapytanie do użycia indeksu IX_MachineryId_DateRecorded
, działa ono w mniej niż sekundę.Jeśli pozwolę, aby serwer zdecydował, którego indeksu użyć, wybiera IX_MachineryId
i zajmuje to minutę. To naprawdę sugeruje, że poprawiłem indeks, a serwer po prostu źle podejmuje decyzję. Dlaczego?
CREATE TABLE [dbo].[MachineryReading] (
[Id] INT IDENTITY (1, 1) NOT NULL,
[Location] [sys].[geometry] NULL,
[Latitude] FLOAT (53) NOT NULL,
[Longitude] FLOAT (53) NOT NULL,
[Altitude] FLOAT (53) NULL,
[Odometer] INT NULL,
[Speed] FLOAT (53) NULL,
[BatteryLevel] INT NULL,
[PinFlags] BIGINT NOT NULL,
[DateRecorded] DATETIME NOT NULL,
[DateReceived] DATETIME NOT NULL,
[Satellites] INT NOT NULL,
[HDOP] FLOAT (53) NOT NULL,
[MachineryId] INT NOT NULL,
[TrackerId] INT NOT NULL,
[ReportType] NVARCHAR (1) NULL,
[FixStatus] INT DEFAULT ((0)) NOT NULL,
[AlarmStatus] INT DEFAULT ((0)) NOT NULL,
[OperationalSeconds] INT DEFAULT ((0)) NOT NULL,
CONSTRAINT [PK_dbo.MachineryReading] PRIMARY KEY CLUSTERED ([Id] ASC),
CONSTRAINT [FK_dbo.MachineryReading_dbo.Machinery_MachineryId] FOREIGN KEY ([MachineryId]) REFERENCES [dbo].[Machinery] ([Id]) ON DELETE CASCADE,
CONSTRAINT [FK_dbo.MachineryReading_dbo.Tracker_TrackerId] FOREIGN KEY ([TrackerId]) REFERENCES [dbo].[Tracker] ([Id]) ON DELETE CASCADE
);
GO
CREATE NONCLUSTERED INDEX [IX_MachineryId]
ON [dbo].[MachineryReading]([MachineryId] ASC);
GO
CREATE NONCLUSTERED INDEX [IX_TrackerId]
ON [dbo].[MachineryReading]([TrackerId] ASC);
GO
CREATE NONCLUSTERED INDEX [IX_MachineryId_DateRecorded]
ON [dbo].[MachineryReading]([MachineryId] ASC, [DateRecorded] ASC)
INCLUDE([OperationalSeconds], [FixStatus]);
Tabela jest podzielona na przedziały miesięcy (choć nadal nie rozumiem, co się tam dzieje).
ALTER PARTITION SCHEME PartitionSchemeMonthRange NEXT USED [Primary]
ALTER PARTITION FUNCTION [PartitionFunctionMonthRange]() SPLIT RANGE(N'2016-01-01T00:00:00.000')
ALTER PARTITION SCHEME PartitionSchemeMonthRange NEXT USED [Primary]
ALTER PARTITION FUNCTION [PartitionFunctionMonthRange]() SPLIT RANGE(N'2016-02-01T00:00:00.000')
...
CREATE UNIQUE CLUSTERED INDEX [PK_dbo.MachineryReadingPs] ON MachineryReading(DateRecorded, Id) ON PartitionSchemeMonthRange(DateRecorded)
Zapytanie, które normalnie uruchomiłbym:
SELECT TOP (1) [Id], [Location], [Latitude], [Longitude], [Altitude], [Odometer], [ReportType], [FixStatus], [AlarmStatus], [Speed], [BatteryLevel], [PinFlags], [DateRecorded], [DateReceived], [Satellites], [HDOP], [OperationalSeconds], [MachineryId], [TrackerId]
FROM [dbo].[MachineryReading]
--WITH(INDEX(IX_MachineryId_DateRecorded)) --This makes all the difference
WHERE ([MachineryId] = @p__linq__0) AND ([DateRecorded] >= @p__linq__1) AND ([DateRecorded] < @p__linq__2) AND ([OperationalSeconds] > 0)
ORDER BY [DateRecorded] ASC
Plan zapytań: https://www.brentozar.com/pastetheplan/?id=r1c-RpxNx
Plan zapytań z wymuszonym indeksem: https://www.brentozar.com/pastetheplan/?id=SywwTagVe
Uwzględnione plany są rzeczywistymi planami wykonania, ale w bazie danych pomostowych (około 1/100 wielkości na żywo). Waham się, czy nie bawić się w bazie danych na żywo, ponieważ zacząłem w tej firmie dopiero około miesiąc temu.
Mam wrażenie, że dzieje się tak z powodu partycjonowania, a moje zapytanie zazwyczaj obejmuje każdą partycję (np. Kiedy chcę uzyskać pierwszą lub ostatnią OperationalSeconds
zapisaną dla jednego komputera). Jednak zapytania, które piszę ręcznie, działają poprawnie 10 - 100 razy szybciej niż to, co wygenerował EntityFramework , więc po prostu utworzę procedurę przechowywaną.