Skoncentruję się głównie na twoich pierwszych trzech pytaniach. Krótkie odpowiedzi to: (1) musisz porównać wpływ IV na DV dla każdego okresu, ale (2) tylko porównanie wielkości może prowadzić do błędnych wniosków, oraz (3) istnieje wiele sposobów, aby to zrobić, ale brak konsensusu co do tego, który z nich jest poprawny.
Poniżej opisuję, dlaczego nie można po prostu porównać wielkości współczynników i wskazać kilka rozwiązań, o których dotąd myślano.
Według Allison (1999), w przeciwieństwie do OLS, na współczynniki regresji logistycznej wpływa nieobserwowana heterogeniczność, nawet jeśli taka heterogeniczność nie jest związana ze zmienną będącą przedmiotem zainteresowania.
Po dopasowaniu regresji logistycznej, takiej jak:
(1)
ln( 11 - pja) =β0+ β1x1 i
y∗1y∗
y∗= α0+ α1x1 i+ σε
ε
αβ
βjot= αjotσj = 1 , . . . , J.
σβσ
Wynika to z faktu, że porównania mogą prowadzić do niepoprawnych wniosków, jeśli nieobserwowana różnica różni się między grupami, krajami lub okresami. Oba porównania wykorzystujące różne modele i wykorzystujące terminy interakcji w tym samym modelu cierpią z powodu tego problemu. Oprócz logit, dotyczy to również jego kuzynów probit, clog-log, cauchit, a przez to dyskretnych modeli zagrożeń czasowych oszacowanych za pomocą tych funkcji łącza. Wpływa to również na uporządkowane modele logit.
Williams (2009) argumentuje, że rozwiązaniem jest modelowanie nieobserwowanej odmiany za pomocą heterogenicznego modelu wyboru (aka, model w skali lokalizacji) i zapewnia dodatek Stata, do którego jest to wymagane oglm
(Williams 2010). W wersji R heterogeniczne modele wyboru mogą być dopasowane do hetglm()
funkcji glmx
pakietu dostępnego za pośrednictwem CRAN. Oba programy są bardzo łatwe w użyciu. Na koniec Williams (2009) wspomina o PLUM
procedurze SPSS dopasowywania tych modeli, ale nigdy jej nie użyłem i nie mogę wypowiedzieć się na temat łatwości użycia.
Istnieje jednak co najmniej jeden dokument roboczy pokazujący, że porównania przy użyciu heterogenicznych modeli wyboru mogą być jeszcze bardziej stronnicze, jeśli równanie wariancji jest źle określone lub występuje błąd pomiaru.
Mood (2010) wymienia inne rozwiązania, które nie wymagają modelowania wariancji, ale wykorzystują porównania przewidywanych zmian prawdopodobieństwa.
Najwyraźniej jest to problem, który nie został rozwiązany i często widzę artykuły na konferencjach mojej dziedziny (socjologii) wymyślające różne rozwiązania tego problemu. Radzę ci spojrzeć na to, co robią ludzie w twojej dziedzinie, a następnie zdecydować, jak sobie z tym poradzić.
Bibliografia
- Allison, PD (1999). Porównanie współczynników Logit i Probit we wszystkich grupach. Metody socjologiczne i badania, 28 (2), 186–208.
- Mood, C. (2010). Regresja logistyczna: dlaczego nie możemy robić tego, co naszym zdaniem możemy zrobić i co możemy z tym zrobić. Europejski Przegląd Socjologiczny, 26 (1), 67–82.
- Williams, R. (2009). Korzystanie z heterogenicznych modeli wyboru w celu porównania współczynników logit i probit we wszystkich grupach. Metody socjologiczne i badania, 37 (4), 531–559.
- Williams, R. (2010). Dopasowywanie heterogenicznych modeli wyboru do Oglm. The Stata Journal, 10 (4), 540–567.