Załóżmy, że mam jakąś zmienną odpowiedzi która została zmierzona od j- tego rodzeństwa w i- tej rodzinie. Ponadto niektóre dane behawioralne x i j zebrano w tym samym czasie od każdego pacjenta. Próbuję przeanalizować sytuację za pomocą następującego liniowego modelu mieszanych efektów:
gdzie i α 1 oznaczają odpowiednio stały punkt przecięcia i nachylenie, δ 1 i jest nachyleniem losowym, a ε i j jest wartością resztkową.
Założenia dla efektów losowych oraz resztkowego ε i j są (przy założeniu, że w każdej rodzinie jest tylko dwoje rodzeństwa)
gdzie jest nieznanym parametrem wariancji, a struktura wariancji-kowariancji R jest symetryczną macierzą formy 2 x 2
który modeluje korelację między dwojgiem rodzeństwa.
Czy jest to odpowiedni model dla takiego rodzeństwa?
Dane są nieco skomplikowane. Spośród 50 rodzin blisko 90% z nich to bliźnięta dizygotyczne (DZ). Dla pozostałych rodzin
- dwoje ma tylko jedno rodzeństwo;
- dwa mają jedną parę DZ i jedno rodzeństwo; i
- dwa mają jedną parę DZ i dwa dodatkowe rodzeństwo.
Wierzę,
lme
że pakiet Rnlme
może łatwo poradzić sobie (1) z brakującą lub niezrównoważoną sytuacją. Mam problem z tym, jak sobie radzić z (2) i (3)? Jedną z możliwości, jaką mogę wymyślić, jest podzielenie każdej z tych czterech rodzin w (2) i (3) na dwie części, tak aby każda podrodzina miała jedno lub dwoje rodzeństwa, tak aby powyższy model mógł być nadal stosowany. Czy to w porządku? Inną opcją byłoby po prostu wyrzucenie danych z dodatkowego jednego lub dwóch rodzeństwa w (2) i (3), co wydaje się marnotrawstwem. Jakieś lepsze podejścia?Wydaje się, że
lme
pozwala to ustalić wartości pozostałej macierzy wariancji-kowariancji R , na przykład r 2 12 = 0,5. Czy ma sens narzucanie struktury korelacji, czy powinienem ją po prostu oszacować na podstawie danych?
lme