Czy istnieje znana ogólna tabela technik statystycznych, która wyjaśnia, w jaki sposób skalują się w zależności od wielkości i wymiaru próbki? Na przykład mój przyjaciel powiedział mi kiedyś, że czas obliczeń po prostu szybkiego sortowania jednowymiarowych danych o rozmiarze n jest równy n * log (n).
Na przykład, jeśli cofniemy y względem X, gdzie X jest zmienną d-wymiarową, to czy będzie to O (n ^ 2 * d)? Jak skaluje się, jeśli chcę znaleźć rozwiązanie za pomocą dokładnego rozwiązania Gaussa-Markowa w porównaniu do najmniejszych kwadratów metodą Newtona? A może po prostu otrzymujesz rozwiązanie w porównaniu z testami istotności?
Chyba bardziej chcę dobrego źródła odpowiedzi (takiego jak artykuł podsumowujący skalowanie różnych technik statystycznych) niż dobrej odpowiedzi tutaj. Jak, powiedzmy, lista obejmująca skalowanie regresji wielokrotnej, regresji logistycznej, PCA, regresji proporcjonalnej hazardu Coxa, grupowanie K-średnich itp.