Próbuję porównać złożoność obliczeniową / szybkość estymacji trzech grup metod regresji liniowej, jak wyróżniono w Hastie i in. „Elementy statystycznego uczenia się” (wydanie drugie), rozdział 3:
- Wybór podzbioru
- Metody skurczowe
- Metody wykorzystujące pochodne kierunki wprowadzania (PCR, PLS)
Porównanie może być bardzo przybliżone, aby dać pewien pomysł. Rozumiem, że odpowiedzi mogą zależeć od wymiaru problemu i tego, jak pasuje to do architektury komputera, więc na konkretny przykład można rozważyć próbkę o wielkości 500 i 50 kandydatów na regresory. Najbardziej interesuje mnie motywacja związana ze złożonością obliczeniową / szybkością szacowania, ale nie to, jak długo zajmie to procesorowi w danym przykładzie.