Dlaczego liczba wątków roboczych grupy dostępności w puli HADR wzrósłaby znacznie powyżej minimalnego użycia „ zwykle jest 3–10 wątków współdzielonych ” na replikę?
W jednym przypadku zaobserwowaliśmy użycie ponad 300 wątków z 3 grupami dostępności i 10 bazami danych ogółem. SQL Server 2014 z dodatkiem SP1.
Naszymi potencjalnymi klientami są kopie zapasowe w replice dodatkowej, duża aktywność w replice podstawowej, raporty na replice dodatkowej.
AG znajdują się w centrum danych na VMware. Łącznie 16 harmonogramów, zwykłe wątki robocze są poniżej 200. max_dop na serwerze to 2.
- 3 AG, 10 DB, po 4 repliki każda - podstawowa, 2 tylko do odczytu, 1 nieczytelna.
- 1 pomocniczy to synchronizacja, 2 asynchronizacja
- 16 vcores na 32 rdzeniach fizycznych na dużym klastrze z wieloma hostami.
- Bez nadwyżki.
- Inne mniejsze maszyny wirtualne 4-8 rdzeni są kolokowane, ale nie naciskają na procesor
Zauważyliśmy skok w wątkach roboczych, który spowodował odmowę usługi. Przypisanie wątków roboczych do AG jest naszym założeniem, ponieważ tylko te wątki robocze mogą przekroczyć limit.
Poniższe linki z bloga SQL Server Premier Field Engineer przeczytane w kontekście nie dają mi pełnej odpowiedzi: