Natknąłem się na proste pytanie o porównanie modeli elastycznych (tj. Splajnów) z modelami nieelastycznymi (np. Regresja liniowa) w różnych scenariuszach. Pytanie brzmi:
Ogólnie rzecz biorąc, czy oczekujemy, że działanie elastycznej metody uczenia statystycznego będzie lepsze lub gorsze niż metody nieelastycznej, gdy:
- Liczba predyktorów jest niezwykle duża, a liczba obserwacji jest niewielka?
- Wariacja składników błędu, tj. , jest wyjątkowo wysoka?
Myślę, że dla (1), gdy jest małe, modele nieelastyczne są lepsze (nie jestem pewien). W przypadku (2) nie wiem, który model jest (względnie) lepszy.