Przeszukałem wiele stron pomocy i wciąż nie jestem pewien, jak określić bardziej skomplikowane terminy zagnieżdżone w modelu mieszanym. Jestem również mylić jak wykorzystanie :
i /
oraz |
w określaniu i gniazdowania interakcje z czynnikami losowymi wykorzystujących lmer()
w lme4
opakowaniu w R
.
Na potrzeby tego pytania załóżmy, że dokładnie przedstawiłem moje dane za pomocą tego standardowego modelu statystycznego: jest naprawiony, a są losowe. jest (niejawnie) zagnieżdżony .
station
tow
day
Tow
station
Innymi słowy, mam nadzieję, że mój model obejmuje Station (i, fixed), Tow (j, random, implicite nested in Station), Day (k, random) oraz interakcję między Tow i Day oraz interakcję między Day i stacja. Skonsultowałem się ze statystykami w celu stworzenia mojego modelu i obecnie uważam, że jest on reprezentatywny dla moich danych, ale dodam także opis moich danych dla tych, którzy są zainteresowani na dole mojego postu, aby nie zaśmiecać.
Do tej pory udało mi się poskładać lmer
:
lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day),
data=my.data)
Czy to dokładnie przedstawia mój model statystyczny? Wszelkie sugestie dotyczące ulepszenia mojego kodu, jeśli nie czyta się go poprawnie?
Pogrubiłem konkretne terminy, które mam trudności z określeniem w mojej mniejszej formule
# 1. tow zagnieżdżony w stacji, gdy hol jest losowy, a stacja jest naprawiona
, jestem zdezorientowany, jednak co do rozróżnienia między warunkami zagnieżdżenia i interakcji, które są losowe przy użyciu :
i /
. W powyższym przykładzie (1|station:tow)
mam nadzieję, że czyta hol zagnieżdżony w stacji. Czytałem sprzeczne komentarze na różnych stronach, niezależnie od tego, czy powinienem ich używać, :
czy /
tutaj w losowym (1|...)
formacie lmer
.
# 2. Interakcja między stacją a dniem, gdy stacja jest stała, a dzień jest losowy,
mam, (1|station:day)
ale tym razem mam nadzieję, że odczyta interakcję między stacją a dniem. Wygląda na to, że mógłbym użyć stacji * dzień, aby uwzględnić indywidualne efekty stacji i dnia, a także ich interakcję (zamiast uwzględniać każdy z trzech terminów osobno, jak powyżej), ale nie widzę, jak to określić gdy jeden jest ustalony, a drugi losowy. Zrobiłby station*(1|day)
to?
# 3. Interakcja między holowaniem a dniem (oba losowe), gdy hol jest zagnieżdżony w stacji (naprawiony) Na
koniec mam (1|tow:day)
, mam nadzieję, odczytanie interakcji tow
i day
, ale zastanawiam się, czy muszę ponownie określić, że hol jest zagnieżdżony (domyślnie) na stacji?
Jestem nowy zarówno w modelowaniu statystycznym, jak R
i, lmer
i bardzo doceniam trud dokładnych wyjaśnień w odpowiedziach na moje pytania, jeśli to możliwe.
Więcej szczegółów na temat moich danych: pytam, czy stężenia planktonu różnią się na fizycznym froncie oceanu przybrzeżnego. Mam trzy stacje, przybrzeżne, wewnętrzne i przybrzeżne tego frontu. Stacja jest w ten sposób naprawiona. Na każdej stacji biorę trzy repliki holowników planktonowych (z których sortuję, liczę i uzyskuję stężenie pod względem liczby błędów na metr sześcienny wody). Holowanie jest losowe: w trzech holach mam nadzieję uwzględnić ogólną zmienność planktonu na tej konkretnej stacji. Holowanie jest wewnętrznie zagnieżdżone w stacji, ponieważ każda holownica nie ma unikalnego identyfikatora (123 123 123 to identyfikator holowania na każdej stacji). Potem robiłem to przez wiele niezależnych dni z nowym uformowanym frontem. Myślę, że mogę myśleć o Dniu jako o czynniku blokującym? Dzień jest losowy, ponieważ powtarzanie go w wielu niezależnych dniach frontowych próbuje uchwycić zmienność z dnia na dzień i być reprezentatywnym dla wszystkich dni, w których ten front jest obecny. Chcę wiedzieć o warunkach interakcji, aby zobaczyć, czy holowniki zmieniają zmienność z dnia na dzień i czy stacje zawsze dostarczają podobne dane, czy zależy to od dnia?
Jeszcze raz dziękuję za poświęcony czas i pomoc, doceniam to!
R
składni, IMO, jest wystarczająco statystyczny (wrt rozumienie, w jaki sposób określony model odnosi się do zagnieżdżania i interakcji itp.), Aby być na temat dla CV.
lmer()
składnią określono model, w którym występuje stały efekt station
i cztery losowe przechwyty, wspólne dla osób o tej samej (1) kombinacji station
i tow
, (2) wartości Day
, (3) kombinacji station
i day
i ( 4) połączenia tow
i day
, odpowiednio. Czy to jest to, co zamierzałeś? Nie jestem pewien, ponieważ, jak wskazał @BabekP, jak napisałeś formułę modelu, nie jest jasne. Napisałeś nazwy zmiennych, a nie parametrów. Zwykle w takim modelu kombinacje zmiennych są przechwytywane przez indeksy dolne.