Chciałbym zadać to pytanie w dwóch częściach. Oba dotyczą uogólnionego modelu liniowego, ale pierwszy dotyczy wyboru modelu, a drugi dotyczy regularyzacji.
Tło: Używam modeli GLM (liniowych, logistycznych, regresji gamma) zarówno do prognozowania, jak i do opisu. Kiedy odnoszę się do „ normalnych rzeczy, które robi się z regresją ”, mam na myśli głównie opis z (i) przedziałami ufności wokół współczynników, (ii) przedziałami ufności wokół prognoz i (iii) testami hipotez dotyczącymi liniowych kombinacji współczynników takich jak „jest jest różnica między leczeniem A a leczeniem B? ”.
Czy słusznie tracisz zdolność robienia tych rzeczy, stosując normalną teorię pod każdym z poniższych elementów? A jeśli tak, to czy te rzeczy są naprawdę dobre tylko dla modeli używanych do czystej prognozy?
I. Gdy GLM został dopasowany w procesie wyboru modelu (dla konkretności powiedz, że jest to procedura krokowa oparta na AIC).
II. Kiedy GLM został dopasowany metodą regularyzacji (powiedzmy używając glmnet w R).
Wydaje mi się, że w przypadku I. odpowiedź brzmi technicznie, że powinieneś użyć bootstrapu do „ normalnych rzeczy, które robi się z regresją ”, ale tak naprawdę nikt tego nie przestrzega.
Dodaj:
Po otrzymaniu kilku odpowiedzi i przeczytaniu gdzie indziej, oto moje zdanie na ten temat (dla wszystkich innych korzyści, jak również w celu otrzymania korekty).
I.
A) RE: Błąd uogólnienia. W celu uogólnienia poziomów błędów w nowych danych, gdy nie ma ustalonego wstrzymania, sprawdzanie poprawności krzyżowej może działać, ale trzeba całkowicie powtórzyć proces dla każdego zagięcia - używając zagnieżdżonych pętli - dlatego każdy wybór funkcji, dostrajanie parametrów itp. Musi być wykonywane niezależnie za każdym razem. Pomysł ten powinien dotyczyć wszelkich wysiłków związanych z modelowaniem (w tym metod karanych).
B) RE: Testowanie hipotez i przedziały ufności GLM.W przypadku korzystania z wyboru modelu (wybór funkcji, dostrajanie parametrów, wybór zmiennych) dla uogólnionego modelu liniowego i istnieje zestaw wstrzymania, można trenować model na partycji, a następnie dopasować model do pozostałych danych lub pełnego zestawu danych i użyj tego modelu / danych do przeprowadzenia testów hipotez itp. Jeśli zestaw wstrzymania nie istnieje, można użyć ładowania początkowego, o ile cały proces jest powtarzany dla każdej próbki ładowania początkowego. Ogranicza to testy hipotez, które można wykonać, ponieważ być może zmienna nie zawsze będzie na przykład wybierana.
C) RE: Nie dotyczy przewidywania przyszłych zestawów danych, a następnie dopasuj celowy model kierowany teorią i kilkoma testami hipotez, a nawet rozważ pozostawienie wszystkich zmiennych w modelu (znaczących lub nie) (na wzór Hosmera i Lemeshowa). Jest to klasyczny model regresji z małym zestawem zmiennych, a następnie pozwala na zastosowanie testu CI i testu hipotez.
D) RE: Regresja karana. Żadna rada, być może uważaj to za odpowiednie tylko do przewidywania (lub jako rodzaj wyboru funkcji, aby następnie zastosować go do innego zestawu danych, jak w punkcie B powyżej), ponieważ wprowadzone odchylenie sprawia, że testy CI i hipotezy są nierozsądne - nawet w przypadku ładowania początkowego.