Regresja ważonych najmniejszych kwadratów (WLS) nie jest modelem przekształconym. Zamiast tego, po prostu traktując każdą obserwację jako mniej lub bardziej poinformowany o podstawowych relacji między i . Punkty, które są bardziej pouczające, mają większą „wagę”, a te, które mają mniej informacji, mają mniejszą wagę. Masz rację, że regresja ważonych metodą najmniejszych kwadratów (WLS) jest technicznie ważna tylko wtedy, gdy wagi są znane z góry. XY
Jednak regresja liniowa (OLS) jest dość odporna na heteroscedastyczność, a zatem podobnie jest z WLS, jeśli twoje szacunki są na pierwszym miejscu. Przy regresji OLS obowiązuje ogólna zasada, że heteroscedastyczność nie ma na nią zbyt dużego wpływu, o ile maksymalna wariancja nie jest większa niż czterokrotność wariancji minimalnej. Na przykład, jeśli wariancja reszt / błędów wzrośnie wraz z , to byłoby OK, gdyby wariancja reszt na górnym końcu była mniejsza niż czterokrotność wariancji reszt na niskim końcu. Oznacza to, że jeśli twoje ciężary mieszczą się w tym zakresie, jesteś w miarę bezpieczny. To rodzaj podkowy i granatów ręcznychXsytuacja. W rezultacie możesz spróbować oszacować funkcję odnoszącą wariancję reszt do poziomów zmiennych predykcyjnych.
Istnieje kilka kwestii związanych z tym, jak należy dokonać takiego oszacowania:
Pamiętaj, że wagi powinny być odwrotnością wariancji (lub cokolwiek użyjesz).
Jeśli Twoje dane występują tylko na dyskretnych poziomach , np. W eksperymencie lub ANOVA, możesz oszacować wariancję bezpośrednio na każdym poziomieXX i użyć tego. Jeśli szacunki są dyskretnymi poziomami zmiennej ciągłej (np. 0 mg., 10 mg., 20 mg. Itp.), Możesz je wygładzić, ale prawdopodobnie nie zrobi to dużej różnicy.
Xplot(model, which=2)
Xmediana bezwzględnego odchylenia od mediany .
XX
Uzyskiwanie wagi z resztek regresji OLS jest rozsądne, ponieważ OLS jest bezstronny, nawet w przypadku heteroscedastyczności. Niemniej jednak wagi te są zależne od oryginalnego modelu i mogą zmienić dopasowanie następnego modelu WLS. Dlatego powinieneś sprawdzić swoje wyniki, porównując szacunkowe bety z dwóch regresji. Jeśli są bardzo podobne, wszystko w porządku. Jeśli współczynniki WLS odbiegają od współczynników OLS, należy użyć oszacowań WLS do ręcznego obliczenia reszt (zgłoszone wartości resztkowe z dopasowania WLS uwzględnią wagi). Po obliczeniu nowego zestawu reszt, określ ponownie wagi i użyj nowych wag w drugiej regresji WLS. Proces ten należy powtarzać, aż dwa zestawy szacowanych bet będą wystarczająco podobne (choć nawet jednorazowe wykonanie tego jest rzadkie).
Jeśli ten proces sprawia, że czujesz się trochę niekomfortowo, ponieważ wagi są szacowane, a ponieważ zależą od wcześniejszego, niepoprawnego modelu, inną opcją jest użycie estymatora „kanapkowego” Hubera-White'a . Jest to spójne nawet w obecności heteroscedastyczności bez względu na to, jak ciężkie, i nie zależy od modelu. Jest to również potencjalnie mniej kłopotów.
Pokazuję prostą wersję ważonych najmniejszych kwadratów i użycie wielowarstwowych SE w mojej odpowiedzi tutaj: Alternatywy dla jednostronnej ANOVA dla danych heteroscedastycznych .