Kiedy uwzględnić efekt losowy w modelu


9

Jestem nowy w modelowaniu mieszanym i jestem zdezorientowany, czy należy zastosować losowy efekt w analizie, którą wykonuję. Wszelkie porady będą mile widziane.

moje badanie bada, jak dobrze nowo opracowany wskaźnik liczebności ssaków może przewidzieć wartość ustalonego, ale bardziej pracochłonnego wskaźnika. Zmierzyłem te wskaźniki w wielu obszarach leśnych, z wieloma działkami w każdej strefie leśnej.

ponieważ nie jestem bezpośrednio zainteresowany efektem łat leśnych i ponieważ moje przykładowe działki są zagnieżdżone w łatach leśnych, używałem łaty leśnej jako efektu losowego. Mam jednak kilka pytań na ten temat:

po pierwsze wiem, że efekty losowe pozwalają uogólniać wyniki na wszystkich możliwych poziomach współczynnika losowego, a nie tylko na tych, z których pobierano próbki. ale wydaje mi się, że aby wyciągnąć takie wnioski, trzeba będzie losowo próbować swoje poziomy? Moje obszary leśne nie zostały losowo pobrane, więc czy nadal mogę ich używać jako efektu losowego?

po drugie, przeczytałem, że można sprawdzić, czy konieczne jest uzyskanie efektu losowego, wykonując np. test współczynnika prawdopodobieństwa w celu porównania modeli z efektem i bez niego. Zrobiłem to i sugeruje, że model efektów losowych nie wyjaśnia danych, a także model z efektami stałymi. moim problemem jest to, że moje działki są nadal zagnieżdżone w leśnych płatach, a więc prawdopodobnie nie są niezależne. więc czy mogę zastosować to podejście LRT, aby uzasadnić wykluczenie efektu losowego, czy nadal muszę go uwzględnić, aby uwzględnić zagnieżdżenie? a jeśli ostatecznie usunę efekt losowy, czy istnieje sposób na sprawdzenie, czy działki w obszarach leśnych można uznać za niezależne?

Dzięki za pomoc!

Sójka


Myślę, że główną konceptualną cechą efektów losowych jest to, że wszystkie powinny mieć taką samą wielkość i być wymienne - to właśnie umożliwia wnioskowanie o efektach losowych nieobjętych próbą. Ponadto należy zachować ostrożność przy stosowaniu testów LR dla efektów losowych, ponieważ może istnieć znaczna niepewność co do składnika wariancji, nawet jeśli oszacowanie ML / REML wynosi zero lub jest bliskie zeru.
probabilityislogic

Wielkie dzięki za to. Czy byłby więc jakiś sposób na wypracowanie, gdyby to konieczne, aby zachować losowy efekt?
sójka

Z tego, co rozumiem, najlepiej nie robić porównań LR z modelami dopasowanymi przez REML. Na przykład w Lmer R, powinieneś ustawić REML = FALSE podczas wykonywania LRT. (Domyślnie ustawiona jest na PRAWDA, co w innym przypadku jest lepsze.)
Wayne

Odpowiedzi:


6

Jak rozumiem, masz prosty zagnieżdżony projekt obserwacyjny (wykresy w łatach), a twoje zainteresowanie polega na korelacji / regresji między dwiema ciągłymi zmiennymi (dwoma wskaźnikami). Wielkość twojej próby wynosi m łatek xn wykresów = N par obserwacji (lub odpowiednie sumowanie, jeśli brak równowagi). Nie była zaangażowana właściwa randomizacja, ale być może możesz / powinieneś / chcesz wziąć pod uwagę, że (1) łatki zostały „losowo” wybrane ze wszystkich łat tego rodzaju lub w pewnym obszarze, a następnie (2) wykresy były „losowe” wybrane w każdej łatce.

Jeśli zignorujesz przypadkową łatkę czynnikową, możesz być pseudoreplikacją, biorąc pod uwagę, że losowo wybrałeś N wykresów „swobodnie”, nie ograniczając ich do (liczby lub typu) w tych (wcześniej) wybranych łatkach.

Twoje pierwsze pytanie: tak, na to pozwala czynnik losowy. Ważność takiego wnioskowania zależy od słuszności założenia, że ​​przypadkowa selekcja jest równoważna losowej selekcji łat (np. Że wyniki nie byłyby różne, gdyby wybrano inny zestaw łat leśnych). Ogranicza to także twoją przestrzeń wnioskowania: rodzaj lasu lub obszaru geograficznego, do którego rozciągają się twoje wyniki, zależy od maksymalnej (wyobrażonej) populacji łat, z której twoja próbka jest wiarygodną „losową” próbką. Być może twoje obserwacje stanowią „rozsądną losową” próbkę ssaków z fragmentów lasu w twoim regionie, ale byłyby podejrzanie zbiorczą próbką ssaków z całego kontynentu.

Drugi: test będzie zależeć od „stopnia pseudoreplikacji” lub dowodów w twojej próbce, że wykresy „należą” do łatek. To jest, jak duża jest zmienność między łatami i między wykresami w łatkach (poszukiwanie korelacji wewnątrzklasowej). W skrajności występuje tylko zmienność między łatkami (wszystkie wykresy w łatce są takie same) i masz „czystą pseudoreplikację”: twoje N powinno być liczbą poprawek, a próbkowanie jednej lub wielu wykresów z każdej z nich nie zapewnia Nowa informacja. Z drugiej strony, wszystkie warianty występują między poletkami i nie ma żadnej dodatkowej wariacji wyjaśnionej przez wiedzieć, do której łaty leśnej należy każda poletka (a wtedy model bez czynnika losowego wydawałby się bardziej oszczędny); masz „niezależne” fabuły. ŻADNE z ekstremów najprawdopodobniej nie nastąpi ... szczególnie w przypadku zmiennych biologicznych obserwowanych na ziemi, choćby z powodu autokorelacji przestrzennej i rozmieszczenia geograficznego ssaków. Ja osobiście wolę zachować czynniki zgodnie z projektem (np. Nawet wtedy, gdy łatki nie są istotnym źródłem zmienności W TYCH PRZYKŁADACH), aby podtrzymać wyjaśnioną powyżej analogię „eksperymentalno-obserwacyjną”; pamiętaj: brak dowodów w próbie odrzucenia hipotezy zerowej, że zmienność między łatami wynosi zero, nie oznacza, że ​​w populacji wynosi ona zero. nawet jeśli łatki nie są istotnym źródłem zmienności W TYCH PRZYKŁADACH), aby podtrzymać wyjaśnioną powyżej analogię „eksperymentalno-obserwacyjną”; pamiętaj: brak dowodów w próbie odrzucenia hipotezy zerowej, że zmienność między łatami wynosi zero, nie oznacza, że ​​w populacji wynosi ona zero. nawet jeśli łatki nie są istotnym źródłem zmienności W TYCH PRZYKŁADACH), aby podtrzymać wyjaśnioną powyżej analogię „eksperymentalno-obserwacyjną”; pamiętaj: brak dowodów w próbie odrzucenia hipotezy zerowej, że zmienność między łatami wynosi zero, nie oznacza, że ​​w populacji wynosi ona zero.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.