Witaj Mam dwa problemy, które brzmią jak naturalni kandydaci na modele wielopoziomowe / mieszane, których nigdy nie używałem. Prostszy i taki, który mam nadzieję wypróbować jako wprowadzenie, wygląda następująco: Dane wyglądają jak wiele wierszy formularza
x y innergroup outergroup
gdzie x jest zmienną liczbową, na której chcę regresować y (inna zmienna liczbowa), każde y należy do grupy wewnętrznej, a każda grupa wewnętrzna jest zagnieżdżona w grupie zewnętrznej (tj. wszystkie y w danej grupie wewnętrznej należą do tej samej grupy zewnętrznej) . Niestety, grupa wewnątrzgrupowa ma wiele poziomów (wiele tysięcy), a każdy poziom ma stosunkowo niewiele obserwacji y, więc pomyślałem, że ten rodzaj modelu może być odpowiedni. Moje pytania są
Jak napisać ten rodzaj wielopoziomowej formuły?
Kiedy lmer pasuje do modelu, jak można zacząć przewidywać z niego? Dopasowałem kilka prostszych przykładów zabawek, ale nie znalazłem funkcji predykcji (). Większość ludzi wydaje się bardziej zainteresowana wnioskowaniem niż przewidywaniem przy użyciu tego rodzaju techniki. Mam kilka milionów wierszy, więc obliczenia mogą stanowić problem, ale zawsze mogę je odpowiednio wyciąć.
Przez jakiś czas nie będę musiał robić drugiego, ale równie dobrze mogę zacząć o tym myśleć i bawić się nim. Mam podobne dane jak poprzednio, ale bez x, a y jest teraz zmienną dwumianową formy . y również wykazuje dużą naddyspersję, nawet w grupach wewnętrznych. Większość nie więcej niż 2 lub 3 (lub mniej), a więc w celu uzyskania oszacowania wskaźników powodzenia każdej I zostały za pomocą beta-dwumianowego skurczu estymatora , gdzie isą szacowane przez MLE dla każdej grupy osobno. Jest to dość adekwatne, ale rzadkość danych wciąż mnie nęka, dlatego chciałbym wykorzystać wszystkie dostępne dane. Z jednej perspektywy problem ten jest łatwiejszy, ponieważ nie ma współzmiennej, ale z drugiej strony dwumianowa natura utrudnia. Czy ktoś ma jakieś wytyczne na wysokim (lub niskim!) Poziomie?