Szukam porady, w jaki sposób analizować złożone dane ankietowe za pomocą modeli wielopoziomowych w R. Użyłem survey
pakietu do ważenia nierównych prawdopodobieństw wyboru w modelach jednopoziomowych, ale ten pakiet nie ma funkcji do modelowania wielopoziomowego. lme4
Opakowanie jest idealne do modelowania wielopoziomowego, ale nie jest to sposób, że wiem zawierać ciężarów na różnych poziomach grupowania. Asparouhov (2006) ustawia problem:
Modele wielopoziomowe są często używane do analizy danych z projektów próbkowania klastra. Takie projekty próbkowania często jednak wykorzystują nierówne prawdopodobieństwo wyboru na poziomie klastra i na poziomie indywidualnym. Wagi próbkowania są przypisywane na jednym lub obu poziomach, aby odzwierciedlić te prawdopodobieństwa. Jeżeli wagi próbkowania są ignorowane na każdym poziomie, oszacowania parametrów mogą być znacznie tendencyjne.
Jednym podejściem dla modeli dwupoziomowych jest wielopoziomowy estymator pseudo maksymalnego prawdopodobieństwa (MPML), który jest implementowany w MPLUS ( Asparouhov i in.,? ). Carle (2009) dokonuje przeglądu głównych pakietów oprogramowania i przedstawia kilka zaleceń dotyczących dalszego postępowania:
Aby prawidłowo przeprowadzić MLM ze złożonymi danymi ankietowymi i wagami projektowymi, analitycy potrzebują oprogramowania, które może obejmować wagi skalowane poza programem i obejmować „nowe” wagi skalowane bez automatycznej modyfikacji programu. Obecnie pozwalają na to trzy główne programy MLM: Mplus (5.2), MLwiN (2.02) i GLLAMM. Niestety ani HLM, ani SAS nie mogą tego zrobić.
West i Galecki (2013) podają bardziej zaktualizowaną recenzję, a ja zacytuję odpowiedni fragment:
Czasami analitycy chcą dopasować LMM do badania zestawów danych zebranych z próbek o złożonych projektach (patrz Heeringa i in., 2010, rozdział 12). Złożone projekty prób charakteryzują się ogólnie podziałem populacji na warstwy, wieloetapową selekcją skupisk osobników z warstw oraz nierównymi prawdopodobieństwami selekcji zarówno dla skupisk, jak i badanych osobników ostatecznych. Te nierówne prawdopodobieństwa wyboru generalnie prowadzą do konstruowania wag próbkowania dla osób, które zapewniają obiektywne oszacowanie parametrów opisowych po włączeniu do analizy. Wagi te można dodatkowo skorygować o brak odpowiedzi w badaniu i skalibrować do znanych sum populacji. Tradycyjnie, analitycy mogą rozważyć podejście projektowe do włączenia tych złożonych funkcji próbkowania przy szacowaniu modeli regresji (Heeringa i in., 2010). Niedawno statystycy zaczęli badać podejścia modelowe do analizy tych danych, wykorzystując LMM do włączenia stałych efektów warstw próbkowania i losowych efektów próbkowanych klastrów.
Podstawową trudnością związaną z opracowaniem podejść modelowych do analizy tych danych było wybranie odpowiednich metod włączenia wag próbkowania (podsumowanie zagadnień znajduje się w Gelman, 2007). Pfeffermann i in. (1998), Asparouhov i Muthen (2006) oraz Rabe-Hesketh i Skrondal (2006) opracowali teorię szacowania modeli wielopoziomowych w sposób uwzględniający wagi ankiet, a Rabe-Hesketh i Skrondal (2006), Carle (2009) i Heeringa i in. (2010, rozdział 12) przedstawili aplikacje wykorzystujące obecne procedury oprogramowania, ale nadal jest to aktywny obszar badań statystycznych. Procedury oprogramowania zdolne do dopasowania LMM znajdują się na różnych etapach wdrażania podejść zaproponowanych do tej pory w literaturze w celu włączenia złożonych funkcji projektowych, analitycy muszą wziąć to pod uwagę przy dopasowywaniu LMM do złożonych danych z badań ankietowych. Analitycy zainteresowani dopasowaniem LMM do danych zebranych z złożonych badań ankietowych będą zainteresowani procedurami, które są w stanie poprawnie włączyć wagi ankiet do procedur szacunkowych (HLM, MLwiN, Mplus, xtmixed i gllamm), zgodnie z obecną literaturą w tym dokumencie powierzchnia.
To prowadzi mnie do pytania: czy ktoś ma zalecenia dotyczące najlepszych praktyk w zakresie dopasowania LMM do złożonych danych ankietowych w R?
lmer
Funkcja w lme4
pakiecie pozwala specyfikację weights
argumentem dla procesu modelu sylwetkę, więc jeśli mają stałe ciężarów projektowych, powinieneś być w stanie włączyć je z tym argumentem. Czy mam tutaj zły koniec kija? Czy jest jakiś powód, dla którego jest to nieodpowiednie?
i've never said it before
od tego postu na temat addhealth, mogą być interesujące .. :(