Jakie jest znaczenie rozróżnienia między modelami liniowymi i nieliniowymi? Pytanie Nieliniowy vs. uogólniony model liniowy: jak odnosisz się do regresji logistycznej, Poissona itp.? a jego odpowiedzią było niezwykle pomocne wyjaśnienie liniowości / nieliniowości uogólnionych modeli liniowych. Rozróżnienie modeli liniowych od nieliniowych wydaje się niezwykle ważne, ale nie jest dla mnie jasne, dlaczego? Rozważmy na przykład następujące modele regresji:
Oba modele 1 i 2 są liniowe, a rozwiązania istnieją w formie zamkniętej, którą można łatwo znaleźć za pomocą standardowego estymatora OLS. Nie dotyczy to modeli 3 i 4, które są nieliniowe, ponieważ (niektóre) pochodne wrt są nadal funkcjami .
Jednym prostym rozwiązaniem do oszacowania w Modelu 3 jest linearyzacja modelu poprzez ustawienie , oszacowanie za pomocą modelu liniowego, a następnie obliczenie .
Aby oszacować parametry w Modelu 4, możemy założyć, że ma rozkład dwumianowy (członek rodziny wykładniczej) i, wykorzystując fakt, że formą logistyczną modelu jest łącze kanoniczne, linearyzuje rogi modelu. To był znaczący wkład Neldera i Wedderburn .
Ale dlaczego ta nieliniowość jest przede wszystkim problemem? Dlaczego nie można po prostu użyć jakiegoś algorytmu iteracyjnego do rozwiązania Modelu 3 bez linearyzacji przy użyciu funkcji pierwiastka kwadratowego lub Modelu 4 bez wywoływania GLM. Podejrzewam, że przed rozpowszechnieniem potęgi obliczeniowej statystycy próbowali wszystko zlinearyzować. Jeśli to prawda, to może „problemy” wprowadzone przez nieliniowość są pozostałością po przeszłości? Czy komplikacje wprowadzone przez modele nieliniowe mają jedynie charakter obliczeniowy, czy też istnieją inne teoretyczne problemy, które sprawiają, że modele nieliniowe są trudniejsze w dopasowaniu do danych niż modele liniowe?