Czy efekty losowe mogą mieć zastosowanie tylko do zmiennych jakościowych?


9

To pytanie może wydawać się głupie, ale ... czy to prawda, że ​​losowe efekty mogą mieć zastosowanie tylko do zmiennych kategorialnych (takich jak indywidualny identyfikator, identyfikator populacji, ...), np. Powiedzxi jest zmienną kategoryczną:

yi ~ βxi

βxi ~ Norm(μ,δ2)

ale z zasady efekt losowy nie może mieć zastosowania do zmiennej ciągłej (jak wysokość, masa ...), powiedzmyzi:

yi ~ α+βzi

ponieważ wtedy jest tylko jeden współczynnik βktórego nie można ograniczyć? Brzmi logicznie, ale zastanawiam się, dlaczego w literaturze statystycznej nigdy o tym nie wspomniano! Dzięki!

EDYCJA: Ale co jeśli ograniczęzi lubić zi ~ Norm(μ,δ2)? Czy to efekt losowy? Ale różni się to od ograniczenia, które nałożyłemβxi- tutaj ograniczam zmienną, podczas gdy w poprzednim przykładzie ograniczałem współczynnik ! Zaczyna mi to wyglądać na wielki bałagan ... W każdym razie nie ma sensu nakładać tego ograniczenia, ponieważzi są znane wartości, więc może ten pomysł jest zupełnie dziwny :-)


1
Ciekawe powiązane pytanie: stats.stackexchange.com/q/61531/5509
Ciekawy

Odpowiedzi:


5

To dobre i bardzo podstawowe pytanie.

Interpretacja efektów losowych jest bardzo specyficzna dla danej dziedziny i zależy od wyboru modelowania (model statystyczny lub bycie bayesowskim lub częstym). Bardzo dobra dyskusja znajduje się na stronie 245, Gelman and Hill (2007) . W przypadku bayesowskiego wszystko jest losowe (mimo że parametry mogą mieć prawdziwą stałą wartość, są one modelowane jako losowe), a częsty może również wybrać wartość parametru jako stały efekt, który w innym przypadku byłby modelowany losowo (patrz Casella, 2008 , dyskusja na temat bloków do naprawienia lub losowych w przykładzie 3.2).

Edytuj (po komentarzu)

Dane są naprawiane po ich zaobserwowaniu. Jeśli są one ciągłe, powinny być modelowane jako ciągłe. Możesz modelować zmienne jakościowe jako jakościowe, a czasem jako ciągłe (jak w ustawieniu zmiennej porządkowej). Parametry są nieznane i mogą być modelowane jako stałe lub losowe. Parametry zasadniczo odnoszą się do odpowiedzi na predyktory. Jeśli chcesz, aby nachylenie pojedynczego predyktora (lub jego współczynnik w modelu liniowym) zmieniało się dla każdej odpowiedzi, zamodeluj go losowo, w przeciwnym razie zamodeluj jako stały. Podobnie, jeśli chcesz, aby przechwytywanie różniło się w odniesieniu do grup, należy je modelować jako losowe; w przeciwnym razie powinny zostać naprawione.


1
Dzięki za odpowiedź, ale hmmm .... Zadałem proste pytanie i oczekiwałem jakoś prostej lub ogólnej odpowiedzi :) W drugim akapicie stwierdzasz, że w języku bayesowskim wszystko jest losowe. Proszę nie komplikować tego zbytnio :) Celowo zapytałem na poziomie modelu, proszę zapomnieć o częstym lub bayesowskim - interesuje mnie zasada - do jakiego rodzaju zmiennych zazwyczaj są używane efekty losowe?
Curious

W trzecim akapicie umieściłeś specjalną aplikację z szeregami czasowymi, nie jestem pewien, czy to rozumiem, ale szeregi czasowe AFAIK są zwykle dyskretne (nie ciągłe), jeśli mówisz o korelacji szeregowej ... W każdym razie, jeśli masz jakieś bardziej ogólne odpowiedz, proszę udostępnij. Jeszcze raz dziękuję za odpowiedź!
Curious

Losowość dotyczy nieznanych rzeczy. Kiedy masz obserwacje, są one znane! Jedyne, co wiesz, to twoje dane. Nieznane są parametrami i mogą być modelowane jako losowe lub ustalone. (przepraszam za zamieszanie; zgadzam się, niepotrzebnie skomplikowałem
sprawę

dzięki za uproszczenie odpowiedzi. Tak więc dochodząc do sedna mojego pytania - oznacza to, że odpowiedź brzmi tak , tzn. Efekty losowe dotyczą tylko zmiennych kategorialnych, ponieważ efekty losowe dotyczą tylko parametrów (nie danych) i jedynych parametrów, które można modelować jak losowe są te z wieloma poziomami, tj. zmiennymi jakościowymi? A parametrów zmiennych ciągłych nie można modelować losowo, ponieważ dla zmiennej ciągłej istnieje tylko 1 parametr? Dzięki!
Curious

W twoim konkretnym ustawieniu odpowiedź brzmi TAK . Ale ogólnie odpowiedź, powiedziałbym, brzmi NIE, ponieważ zmienne ciągłe mogą się różnić w zależności od grup. Na przykład dochód mieszkańców miasta powinien być wyższy niż wioska (według ciebie mogą to być dwie odrębne zmienne kategorialne dla lokalizacji).
suncoolsu,

3

Twoje pytanie mogło już zostać rozwiązane, ale w rzeczywistości jest napisane w książce;

Efekty losowe są zmiennymi kategorialnymi, których poziomy są postrzegane jako próba z większej populacji, w przeciwieństwie do efektów stałych, których poziomy są same w sobie interesujące,

na stronie 232: Alan Grafen i Rosie Hails (2002) „Nowoczesne statystyki dla nauk o życiu”, Oxford University Press.


2
To wszystko prawda, ale nie sądzę, że to odpowiada na pytanie.
Patrick Coulombe,

1
Nie zgadzam się z powyższym komentarzem @PatrickCoulombe, myślę, że to właśnie odpowiada na pytanie. +1.
ameba

1

Myślę, że problem polega na tym, że w grę wchodzą dwie rzeczy. Typowym przykładem efektów losowych może być przewidywanie średniej punktowej (GPA) studenta na podstawie szeregu czynników, w tym ich średniej oceny w serii testów w szkole średniej.

Średnia ocena jest ciągła . Zazwyczaj będziesz miał różne przechwytywanie lub przechwytywanie i nachylenie dla średniego wyniku dla każdej osoby. Jednostka jest oczywiście kategoryczna .

Kiedy więc powiesz „dotyczy tylko zmiennych kategorialnych”, jest to trochę niejasne. Załóżmy, że bierzesz pod uwagę tylko losowe przechwytywanie dla średniego wyniku. W tym przypadku twój losowy punkt przecięcia dla wielkości ciągłej i faktycznie jest prawdopodobnie modelowany jako coś w rodzaju zmiennej gaussowskiej ze średnią i odchyleniem standardowym, które zostaną określone przez procedurę. Ale to losowe przechwytywanie jest określane w populacji studentów, w której każdego ucznia identyfikuje zmienna kategoryczna.

Możesz użyć zmiennej „ciągłej” zamiast ID studenta. Może mógłbyś wybrać wzrost ucznia. Ale zasadniczo należy go traktować tak, jakby był kategoryczny. Gdyby twoje pomiary wysokości były bardzo precyzyjne, znów uzyskałbyś unikalną wysokość dla każdego ucznia, więc nie osiągnąłbyś nic innego. Gdyby twoje pomiary wysokości nie były bardzo precyzyjne, skończyłbyś zrzucaniem razem wielu uczniów na każdej wysokości. (Mieszanie ich wyników w możliwie niezdefiniowany sposób).

Jest to swego rodzaju przeciwieństwo interakcji. W interakcji mnożymy dwie zmienne i zasadniczo traktujemy obie jako ciągłe. Zmienna kategoryczna zostałaby podzielona na zestaw zmiennych pozornych 0/1, a 0 lub 1 pomnożono by razy inną zmienną w interakcji.

Najważniejsze jest to, że „efekt losowy” jest w pewnym sensie tylko współczynnikiem, który ma rozkład (jest modelowany), a nie stałą wartość.


Zaloguj się na swoje konto główne, aby móc edytować.
ameba
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.