Czy standardowe błędy ładowania i przedziały ufności są odpowiednie w regresjach, w których naruszone jest założenie homoscedastyczności?

Jeśli w standardowych regresjach OLS zostaną naruszone dwa założenia (normalny rozkład błędów, homoscedastyczność), to czy standardowe błędy początkowe i przedziały ufności są odpowiednią alternatywą dla uzyskania znaczących wyników w odniesieniu do znaczenia współczynników regresora?

Czy testy istotności ze standardowymi błędami ładowania i przedziałami ufności nadal „działają” z heteroscedastycznością?

Jeśli tak, jakie odpowiednie przedziały ufności można zastosować w tym scenariuszu (percentyl, BC, BCA)?

Wreszcie, jeśli w tym scenariuszu właściwe jest ładowanie początkowe, jaka literatura należałoby przeczytać i zacytować, aby dojść do takiego wniosku? Wszelkie wskazówki będą mile widziane!

— David
źródło

Jeśli istnieje takie naruszenie, nie sądzę, aby bootstrap go wyleczył. Zamiast tego dlaczego nie spróbować przekształcić (zalogować) danych, aby zbliżyć się do normalności i użyć solidnego standardowego błędu, takiego jak z pakietu sandwich w R?

— B_Miner

Bootstrap działa dobrze, jeśli dostosujesz schemat ponownego próbkowania do sytuacji, w której się znajdujesz.

— Glen_b

Istnieją co najmniej trzy (może być więcej) podejścia do wykonania bootstrapu dla regresji liniowej z niezależnymi, ale nie identycznie rozłożonymi danymi. (Jeśli masz inne naruszenia „standardowych” założeń, np. Z powodu autokorelacji z danymi szeregów czasowych lub grupowania z powodu projektowania próbkowania, sprawy stają się jeszcze bardziej skomplikowane).

Możesz zmienić próbkę obserwacji jako całości, tzn. próbkę z zastąpieniem z oryginalnych danych . Będzie to asymptotycznie równoważne z wykonaniem korekcji heteroskedastyczności Hubera-White'a . $(y_j^*, {\bf x}_j^*)$ $\{ (y_i, {\bf x}_i) \}$
Możesz dopasować swój model, uzyskać resztki , i ponownie próbkować niezależnie i z zastąpieniem z ich odpowiednich rozkładów empirycznych, ale to rozkłada wzory heteroskedastyczności, jeśli takie istnieją, więc wątpię, aby ten bootstrap był spójny. $e_i = y_i - {\bf x}_i ' \hat\beta$ ${\bf x}_j^*$ $e_j^*$
Możesz wykonać dziki bootstrap, w którym ponownie próbkujesz znak rezydualny, który kontroluje warunkową drugą chwilę (i, z pewnymi dodatkowymi poprawkami, również warunkową trzecią chwilę). To byłaby procedura, którą zaleciłbym (pod warunkiem, że możesz ją zrozumieć i bronić przed innymi, gdy zostaniesz zapytany: „Co zrobiłeś, aby kontrolować heteroskedastyczność? Skąd wiesz, że to działa?”).

Ostatecznym odniesieniem jest Wu (1986) , ale Annals nie są dokładnie czytaniem książek z obrazkami.

AKTUALIZACJE na podstawie dalszych pytań OP zadanych w komentarzach:

Liczba replik wydawała mi się duża; jedyną dobrą dyskusją na temat tego parametru bootstrap, o której jestem świadomy, jest książka Intron do Bootstrap autorstwa Efron & Tibshirani .

Uważam, że ogólnie podobne poprawki braku założeń dystrybucyjnych można uzyskać przy standardowych błędach Hubera / White'a. Podręcznik Camerona i Triverdiego omawia równoważność pary bootstrap i korekcję heteroskedastyczności White'a. Równoważność wynika z ogólnej teorii odporności dla oszacowańZobacz także Hausman i Palmer (2012) na temat bardziej szczegółowych porównań w skończonych próbkach (wersja tego artykułu jest dostępna na jednej ze stron internetowych autorów $M$ ) w porównaniu między korektami bootstrap a korektami heteroskedastyczności.

— StasK
źródło

Bardzo dziękuję za Twoją pomoc! Proszę pozwolić mi na jedno dodatkowe pytanie: Jedyne założenia, które naruszam, to normalny rozkład błędów i założenia homoscedastyczności. Interesuje mnie tylko to, czy moje współczynniki regresji są sig. w oczekiwanym kierunku lub nie. Wielkość efektu nie jest ważna. Myślę, że to, co do tej pory zrobiłem, jest twoją opcją 1. Uruchomiłem standardowe błędy i wygenerowałem dodatkowo przedziały ufności. Zrobiłem to przy użyciu Stata: vce (bootstrap, reps (2500) bca), estat bootstrap. Czy to leczy moje domniemane naruszenia?

— David

Nie wykonuję diagnostyki danych tylko na podstawie twojej składni i nikt tego nie zrobi. Jaki jest rozmiar twojego zestawu danych? reps(2500)jest prawdopodobnie przesadą, przynajmniej w przypadku standardowych błędów; Myślę, że reps(500)jest w porządku dla większości praktycznych celów. W książce wprowadzającej Efron & Tibshirani znajduje się sekcja na temat liczby powtórzeń. Mają też cały rozdział o regresji, więc może to być kolejny dobry punkt odniesienia dla ciebie.

— StasK

Dziękuję za szybką odpowiedź. Zestaw danych wynosi ~ 250. Poza pytaniami dotyczącymi liczby replikacji (dziękuję za link!), Czy zgodzilibyście się, że standardowe błędy ładowania początkowego (poprzez spostrzeżenia obserwacji jako całość) i / lub przedziały ufności ładowania początkowego (np. Poprawione percentyl lub błąd systematyczny) byłyby odpowiedni sposób określenia znaczenia (lub jego braku) współczynnika regresji z uwagi na naruszenie założenia homoscedastyczności i normalnego rozkładu błędów? Bardzo dziękuję za Twój wkład!

— David

Tak, powiedziałbym, że tak jest lepiej. Jeśli użyjesz Staty, możesz uzyskać bardzo podobną odpowiedź, korzystając z robustopcji regresji. est storeoba wyniki i est tab, seje porównać ze sobą.

— StasK

Dziękuję StasK. Widziałem również następujący komentarz, który napisałeś gdzie indziej na tej stronie: „Prosty bootstrap z ponownym próbkowaniem ⇔ Solidny estymator heteroskedastyczności White'a”. W kontekście moich pytań przedstawionych powyżej: Czy opublikowano artykuły w czasopiśmie, które to potwierdzają?

— David