Używam ukaranego pakietu R, aby uzyskać skurczone oszacowania współczynników dla zbioru danych, w którym mam dużo predyktorów i mało wiem, które z nich są ważne. Po wybraniu parametrów dostrajania L1 i L2 i jestem zadowolony z moich współczynników, czy istnieje statystycznie rozsądny sposób na podsumowanie dopasowania modelu z czymś w rodzaju R-kwadrat?
Ponadto jestem zainteresowany przetestowaniem ogólnego znaczenia modelu (tzn. Czy R² = 0, czy wykonam wszystkie = 0).
Przeczytałem odpowiedzi na podobne pytanie zadane tutaj , ale nie całkiem odpowiadało na moje pytanie. Jest to doskonały poradnik na opakowaniu R że używam tutaj , a autor Jelle Goeman miał następującą notatkę na koniec samouczka dotyczącego przedziałów ufności z ukaranych modeli regresji:
To bardzo naturalne pytanie, aby zadać standardowe błędy współczynników regresji lub innych oszacowanych wielkości. Zasadniczo takie standardowe błędy można łatwo obliczyć, np. Za pomocą paska startowego.
Mimo to ten pakiet celowo ich nie udostępnia. Powodem tego jest to, że standardowe błędy nie mają większego znaczenia w przypadku silnie tendencyjnych oszacowań, takich jak wynikające z karanych metod szacowania. Ocena karana to procedura, która zmniejsza wariancję estymatorów poprzez wprowadzenie istotnego błędu. Błąd systematyczny każdego estymatora jest zatem głównym składnikiem jego średniego błędu kwadratu, podczas gdy jego wariancja może przyczyniać się tylko niewielką część.
Niestety, w większości zastosowań regresji karnej niemożliwe jest uzyskanie wystarczająco dokładnego oszacowania błędu. Wszelkie obliczenia oparte na bootstrapie mogą dać jedynie ocenę wariancji szacunków. Wiarygodne szacunki błędu są dostępne tylko wtedy, gdy dostępne są wiarygodne obiektywne szacunki, co zwykle nie ma miejsca w sytuacjach, w których stosuje się szacunki karane.
Zgłoszenie standardowego błędu w oszacowaniu podlegającym karze opowiada zatem tylko część historii. Może dawać błędne wrażenie dużej precyzji, całkowicie ignorując niedokładność spowodowaną odchyłką. Z pewnością błędem jest tworzenie oświadczeń o zaufaniu, które opierają się wyłącznie na ocenie wariancji oszacowań, takich jak przedziały ufności oparte na bootstrapie.