Którego współczynnika inflacji wariancji powinienem używać: lub ?


30

Próbuję interpretować czynniki inflacji wariancji za pomocą viffunkcji w pakiecie R car. Funkcja drukuje zarówno uogólniony i . Zgodnie z plikiem pomocy ta ostatnia wartośćVIFGVIF1/(2)df)

Aby dopasować się do wymiaru elipsoidy ufności, funkcja wypisuje również GVIF ^ [1 / (2 * df)], gdzie df jest stopniami swobody związanymi z tym terminem.

Nie rozumiem znaczenia tego wyjaśnienia w pliku pomocy, więc nie jestem pewien, czy powinienem używać lub . W moim modelu te dwie wartości są bardzo różne (maksimum wynosi ~ ; maksimum wynosi ~ ).GVIFGVIF1/(2)df)GVIF60GVIF1/(2)df)3)

Czy ktoś mógłby mi wyjaśnić, którego powinienem użyć i co należy rozumieć poprzez dostosowanie wymiaru elipsoidy zaufania?

Odpowiedzi:


25

Georges Monette i ja przedstawiliśmy GVIF w artykule „Uogólniona diagnostyka kolinearności”, JASA 87: 178-183, 1992 ( link ). Jak wyjaśniliśmy, GVIF reprezentuje kwadratowy stosunek hiperwoluminów elipsoidy pewności stawu dla podzbioru współczynników do elipsoidy „utopijnej”, który zostałby uzyskany, gdyby regresory w tym podzbiorze były nieskorelowane z regresorami w komplementarnym podzbiorze. W przypadku pojedynczego współczynnika specjalizuje się on w zwykłym VIF. Aby uczynić GVIF porównywalnymi we wszystkich wymiarach, sugerowaliśmy użycie GVIF ^ (1 / (2 * Df)), gdzie Df jest liczbą współczynników w podzbiorze. W efekcie zmniejsza to GVIF do miary liniowej, a dla VIF, gdzie Df = 1, jest proporcjonalne do inflacji ze względu na kolinearność przedziału ufności dla współczynnika.


3
Witamy na naszej stronie! Będziemy zaszczyceni, jeśli zarejestrujesz swoje konto i od czasu do czasu będziesz odwiedzać. Jedna mała uwaga dotycząca sprzątania: nie musisz podpisywać swoich postów, twój identyfikator z linkiem do strony użytkownika jest automatycznie dodawany do każdej udzielonej odpowiedzi.
gung - Przywróć Monikę

24

Natrafiłem na dokładnie to samo pytanie i próbowałem przejść przez to. Zobacz moją szczegółową odpowiedź poniżej.

Po pierwsze znalazłem 4 opcje dające podobne wartości VIF w R:

corvifpolecenie z pakietu AED,

vifpolecenie z pakietu samochodowego,

vifpolecenie z pakietu rms,

vifpolecenie z pakietu DAAG.

Używanie tych poleceń w zestawie predyktorów, nie uwzględniając żadnych czynników / zmiennych kategorialnych lub terminów wielomianowych, jest oczywiste. Wszystkie trzy polecenia generują takie same dane liczbowe, mimo że corvifpolecenie z pakietu AED oznaczy wyniki jako GVIF.

Zazwyczaj jednak GVIF wchodzi w grę tylko w przypadku czynników i zmiennych wielomianowych. Zmienne, które wymagają więcej niż 1 współczynnik, a tym samym więcej niż 1 stopień swobody, są zazwyczaj oceniane za pomocą GVIF. Dla terminów o jednym współczynniku VIF równa się GVIF.

W związku z tym możesz zastosować standardowe reguły dotyczące tego, czy kolinearność może stanowić problem, takie jak próg 3, 5 lub 10. Można jednak zachować ostrożność (patrz: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf ).

W przypadku terminów o wielu współczynnikach, takich jak np. Predyktory jakościowe, 4 pakiety dają różne wyniki. Te vifpolecenia z RMS i pakietów Daag produkować wartości Vif, natomiast dwóch pozostałych wartości produkcji GVIF.

Najpierw spójrzmy na wartości VIF z pakietów rms i DAAG:

TNAP     ICE     RegB    RegC    RegD    RegE

1.994    2.195   3.074   3.435   2.907   2.680

TNAP i ICE są ciągłymi predyktorami, a Reg jest kategoryczną zmienną przedstawianą przez manekiny RegB do RegE. W takim przypadku RegA jest punktem odniesienia. Wszystkie wartości VIF są raczej umiarkowane i zwykle nie ma się o co martwić. Problem z tym wynikiem polega na tym, że ma na to wpływ linia podstawowa zmiennej kategorialnej. Aby mieć pewność, że nie ma wartości VIF powyżej dopuszczalnego poziomu, konieczne byłoby powtórzenie tej analizy dla każdego poziomu zmiennej kategorialnej będącej linią bazową. W tym przypadku pięć razy.

Stosując corvifpolecenie z pakietu AED lub vifpolecenie z pakietu samochodowego, generowane są wartości GVIF:

     |  GVIF     | Df | GVIF^(1/2Df) |  

TNAP | 1.993964  | 1  | 1.412078     |
ICE  | 2.195035  | 1  | 1.481565     | 
Reg  | 55.511089 | 5  | 1.494301     |

GVIF jest obliczany dla zestawów powiązanych regresorów, takich jak zestaw atrapy regresorów. Dla dwóch zmiennych ciągłych TNAP i ICE jest to to samo co wcześniej wartości VIF. Dla zmiennej jakościowej Reg otrzymujemy teraz jedną bardzo wysoką wartość GVIF, mimo że wszystkie wartości VIF dla pojedynczych poziomów zmiennej jakościowej były umiarkowane (jak pokazano powyżej).

solV.jafa(1/(2)×refa))solV.jafa(1/(2)×refa))wartość zmiennej jakościowej jest podobną miarą dla zmniejszenia precyzji oszacowania współczynników z powodu kolinearności (chociaż nie jest jeszcze gotowa do cytowania, spójrz również na http://socserv2.socsci.mcmaster.ca/jfox/papers/linear- modele-problemy.pdf ).

solV.jafa(1/(2)×refa))solV.jafa(1/(2)×refa))

solV.jafa(1/(2)×refa))solV.jafa(1/(2)×refa))solV.jafa2)(1/(2)×refa))<2)


Witamy na stronie @JanPhilippS. To wydaje się być zarówno nowym pytaniem, jak odpowiedzią na pytanie PO. Użyj tylko pola „Twoja odpowiedź”, aby podać odpowiedzi. Jeśli masz własne pytanie, kliknij [ASK QUESTION]u góry i zadaj je tam, a my możemy Ci pomóc właściwie. Ponieważ jesteś tutaj nowy, możesz wybrać się na naszą wycieczkę , która zawiera informacje dla nowych użytkowników.
Gung - Przywróć Monikę

2
Cóż, to naprawdę nie jest nowe pytanie. Raczej szczegółowa odpowiedź.
Jan Philipp S

1
@JanPhilippS, dzięki za linki do źródeł do dalszego czytania. Myślę, że twój post wydawał się dobrą odpowiedzią, która pozwoliła na refleksję nad stanem rzeczy.
timothy.s.lau

6

Fox & Monette (oryginalny cytat z GVIF, GVIF ^ 1 / 2df) sugerują, że zastosowanie GVIF do potęgi 1 / 2df sprawia, że ​​wartość GVIF jest porównywalna dla różnych parametrów. „Analogicznie jest przyjąć pierwiastek kwadratowy zwykłego współczynnika inflacji wariancji” (od An R i S-Plus Companion do Applied Regression autorstwa Johna Foxa). Tak więc, podniesienie kwadratu i zastosowanie zwykłej „ogólnej zasady VIF” wydaje się rozsądne.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.