Zapisywanie równania matematycznego dla wielopoziomowego modelu efektów mieszanych

Pytanie CV

Próbuję podać (a) szczegółową i zwięzłą matematyczną reprezentację modelu efektów mieszanych. Korzystam z lme4pakietu w języku R. Jaka jest prawidłowa reprezentacja matematyczna dla mojego modelu?

Dane, pytanie naukowe i kod R.

Mój zestaw danych składa się z gatunków w różnych regionach. Testuję, czy występowanie gatunku zmienia się w czasie prowadzącym do wyginięcia (wyginięcie niekoniecznie musi być trwałe; może rekolonizować), czy też po kolonizacji.

lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))

Rozpowszechnienie to odsetek warstw zajmowanych przez gatunek w danym roku regionu
Czas jest zmienną ciągłą, która wskazuje czas do wyginięcia lub kolonizacji; to zawsze jest pozytywne
Typ jest zmienną kategorialną z dwoma poziomami. Te dwa poziomy to „-” i „+”. Gdy typ to -, jest to kolonizacja (poziom domyślny). Kiedy typ to +, oznacza to wyginięcie.
Reg jest kategoryczną zmienną z dziewięcioma poziomami wskazującymi region
Spp jest zmienną kategoryczną; liczba poziomów różni się w zależności od regionu i waha się od 48 poziomów do 144 poziomów.

Innymi słowy: zmienna odpowiedzi to rozpowszechnienie (odsetek zajętych warstw). Naprawiono efekty obejmujące 1) i przechwytywanie, 2) czas od zdarzenia oraz 3) interakcję między czasem do rodzaju zdarzenia (typ kolonizacji lub wyginięcia). Każdy z 3 stałych efektów zmieniał się losowo między regionami. W obrębie regionu każdy efekt zmieniał się losowo między gatunkami.

Próbuję wymyślić, jak napisać równanie matematyczne dla modelu.Myślę, że rozumiem, co się dzieje w kodzie R (chociaż jestem pewien, że mam pewne luki w wiedzy i mam nadzieję, że napisanie formalnego wyrażenia matematycznego poprawi moje rozumienie).

Dość często przeszukiwałem sieć i fora. Na pewno znalazłem mnóstwo przydatnych informacji (i może link do niektórych z nich edytuję to pytanie). Jednak nie mogłem do końca stwierdzić, że „Rosetta Stone” kodu R przetłumaczonego na matematykę (bardziej mi się podoba z kodem), który naprawdę pomógłby mi potwierdzić, że mam rację. Wiem, że są już pewne luki, ale do tego dojdziemy.

Moja próba

Podstawową formą modelu efektów mieszanych w notacji macierzowej jest (w moim rozumieniu):

Y = X β + Z γ + ϵ

$Y = X \beta + Z \gamma + \epsilon$

X = [\begin{matrix} 1 & Δ t & Δ t_{+} \\ ⋮ & ⋮ & ⋮ \\ 1 & Δ t_{n} & Δ t_{+, n} \end{matrix}]

$X = \begin{bmatrix} 1 & \Delta t & \Delta t_{+} \\ \vdots & \vdots & \vdots \\ 1 & \Delta t_n & \Delta t_{+,n} \end{bmatrix}$

β^{^{'}} = [\begin{matrix} β_{0} & β_{1} & β_{2} \end{matrix}]

$\beta^{'} = \begin{bmatrix} \beta_0 & \beta_1 & \beta_2 \end{bmatrix}$

Z = [\begin{matrix} 1 I (r_{1}) & Δ t I (r_{1}) & Δ t_{+} I (r_{1}) & \dots & 1 I (r_{9}) & Δ t I (r_{9}) & Δ t_{+} I (r_{9}) \\ ⋮ & ⋮ & ⋮ & ⋱ & ⋮ & ⋮ & ⋮ \\ 1 I (r_{1, n}) & Δ t_{n} I (r_{1, n}) & Δ t_{+, n} I (r_{1, n}) & \dots & 1 I (r_{9, n}) & Δ t I (r_{9, n}) & Δ t_{+, n} I (r_{9, n}) \end{matrix}]

$Z = \begin{bmatrix} 1 I(r_1) & \Delta t I(r_1) & \Delta t_{+} I(r_1) & \dots & 1 I(r_9) & \Delta t I(r_9) & \Delta t_{+} I(r_9) \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 1 I(r_{1,n}) & \Delta t_n I(r_{1,n}) & \Delta t_{+,n} I(r_{1,n}) & \dots & 1 I(r_{9,n}) & \Delta t I(r_{9,n}) & \Delta t_{+,n} I(r_{9,n}) \\ \end{bmatrix}$

γ^{^{'}} = [\begin{matrix} γ_{0, 1} & γ_{1, 1} & γ_{2, 1} & \dots & γ_{0, 9} & γ_{1, 9} & γ_{2, 9} \end{matrix}]

$\gamma^{'} = \begin{bmatrix} \gamma_{0,1} & \gamma_{1,1} &\gamma_{2,1} & \dots & \gamma_{0,9} & \gamma_{1,9} &\gamma_{2,9} \end{bmatrix}$

ϵ \sim N (0, Σ)

$\epsilon \sim \mathcal{N}(0,\Sigma)$

jest macierzą konstrukcja ustalonych efektów jest czasem po kolonizacji () i jest czas po ekstynkcji () $X$ $\Delta t$ time $\Delta t_{+}$ time:type
$Z$
$\beta$ $\gamma$
$\epsilon$ $\Sigma$

Zakładając, że do tej pory wszystko jest ~ poprawne, to znaczy, że jestem dobry na najwyższym poziomie. Jednak wyjaśnienie specyficznej dla gatunku zmienności parametrów, które są zagnieżdżone w każdym regionie, zaskoczyło mnie jeszcze bardziej.

Ale zgryzłem coś, co może ma sens ...

$\gamma$ $\gamma$

- gdzie jest macierzą projektową specyficzną dla regionu $U_{p,r}$ $r$ $p$ $b_{p,r}$ $S$ $\eta_{p,r}$

$\gamma_{p,r}$

γ_{0, r} = U_{0, r} b_{0, r} + η_{0, r}

$\gamma_{0,r} = U_{0,r} b_{0,r} + \eta_{0,r}$

γ_{0, r} = [\begin{matrix} 1 I (s_{1}) \dots 1 I (s_{S}) \end{matrix}] + [\begin{matrix} b_{0, 1} \\ ⋮ \\ b_{0, S} \end{matrix}] + η_{0, r}

$\gamma_{0,r} = \begin{bmatrix} 1 I(s_1) \dots 1 I(s_S) \end{bmatrix} + \begin{bmatrix} b_{0,1}\\ \vdots \\ b_{0,S} \end{bmatrix} + \eta_{0,r}$

γ_{1, r} = U_{1, r} b_{1, r} + η_{1, r}

$\gamma_{1,r} = U_{1,r} b_{1,r} + \eta_{1,r}$

γ_{1, r} = [\begin{matrix} Δ t I (s_{1}) \dots Δ t I (s_{S}) \end{matrix}] + [\begin{matrix} b_{1, 1} \\ ⋮ \\ b_{1, S} \end{matrix}] + η_{1, r}

$\gamma_{1,r} = \begin{bmatrix} \Delta t I(s_1) \dots \Delta t I(s_S) \end{bmatrix} + \begin{bmatrix} b_{1,1}\\ \vdots \\ b_{1,S} \end{bmatrix} + \eta_{1,r}$

γ_{2, r} = U_{2, r} b_{2, r} + η_{2, r}

$\gamma_{2,r} = U_{2,r} b_{2,r} + \eta_{2,r}$

γ_{2, r} = [\begin{matrix} Δ t_{+} I (s_{1}) \dots Δ t_{+} I (s_{S}) \end{matrix}] + [\begin{matrix} b_{2, 1} \\ ⋮ \\ b_{2, S} \end{matrix}] + η_{2, r}

$\gamma_{2,r} = \begin{bmatrix} \Delta t_+ I(s_1) \dots \Delta t_+ I(s_S) \end{bmatrix} + \begin{bmatrix} b_{2,1}\\ \vdots \\ b_{2,S} \end{bmatrix} + \eta_{2,r}$

$\eta \sim \mathcal{N}(0,\Sigma_{\eta})$ $\epsilon$ $\Sigma$ $G$

Edycja: inne pytania / odpowiedzi, które były nieco pomocne

To Q / A było fajne, ale nie wypisało rzeczy w pełnej formie matrycy

r mixed-model multilevel-analysis lme4-nlme

— rbatt
źródło

Wątpię, czy ten artykuł ma „odpowiedź” na twoje pytanie, ale posłużył mi również jako podkład do równań modelu HMM. Zapomnij, że jest zakorzeniony w SAS, to tylko doskonały przegląd tej klasy modeli. Judith Singer, Używając SAS Proc Mieszane, aby dopasować modele wielopoziomowe, modele hierarchiczne i indywidualne modele wzrostu, JEBS , Zima 1998, vol. 24, nr 4, str. 323–355.

— Mike Hunter,

Czytałeś tutaj rozdział 2.3 ?

— Robert Long,

Przeczytałem je i takie zasoby zaprowadziły mnie tak daleko. Być może muszę po prostu próbować, ale nie mogłem znaleźć żadnego przykładu, który byłby na tyle skomplikowany, aby dać mi wystarczające zaufanie do mojego obecnego podejścia.

— rbatt

O ile rozumiem, „zagnieżdżanie” to po prostu interakcja w mniejszych modelach. Pojęcie to wzmacnia zastosowanie tej samej składni. Uważam więc, że reg: spp może być obsługiwany przez jedną zmienną kategorialną i tylko inny zestaw bloków w Z.

— deasmhumnha

Zakładałbym również, że lmer uniknie idealnej kolinearności i uwzględni jedynie interakcje nie redundantne w obrębie dodatkowej zmiennej.

— deasmhumnha

Jeśli dobrze zrozumiałem kod, po prostu napisz coś takiego

y_{i} = (α + ν_{j [i]}^{(α)} + η_{k [i]}^{(α)}) + (β + ν_{j [i]}^{(β)} + η_{k [i]}^{(β)}) T_{i} + (δ + ν_{j [i]}^{(δ)} + η_{k [i]}^{(δ)}) (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \Big(\alpha + \nu_{j[i]}^{(\alpha)} + \eta_{k[i]}^{(\alpha)}\Big) + \Big(\beta + \nu_{j[i]}^{(\beta)} + \eta_{k[i]}^{(\beta)}\Big)T_{i} + \Big(\delta + \nu_{j[i]}^{(\delta)} + \eta_{k[i]}^{(\delta)}\Big)(T_{i} * Z_{i}) + \epsilon_i$

\begin{aligned} [ν_{j}^{(α)}, ν_{j}^{(β)}, ν_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{ν}) \\ [η_{j}^{(α)}, η_{j}^{(β)}, η_{j}^{(δ)}] & \sim Multi-Normal (0, Σ_{η}) \\ ϵ_{i} & \sim Normal (0, σ_{ϵ}) \end{aligned}

$\begin{aligned} \Big[\nu_{j}^{(\alpha)}, \nu_j^{(\beta)}, \nu_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\nu) \\ \Big[\eta_{j}^{(\alpha)}, \eta_j^{(\beta)}, \eta_j^{(\delta)}\Big] &\sim \text{Multi-Normal}(\mathbf 0, \boldsymbol \Sigma_\eta)\\ \epsilon_i & \sim \text{Normal}(0, \sigma_\epsilon) \end{aligned}$ or, if the first equation is too long, something like

y_{i} = α_{j [i], k [i]} + β_{j [i], k [i]} T_{i} + δ_{j [i], k [i]} (T_{i} * Z_{i}) + ϵ_{i}

$y_{i} = \alpha_{j[i],k[i]} + \beta_{j[i],k[i]}T_{i} + \delta_{j[i],k[i]}(T_i * Z_i) + \epsilon_i$ and

\begin{aligned} α_{j [i], k [i]} & = α + ν_{j}^{(α)} + η_{k}^{(α)} \\ β_{j [i], k [i]} & = β + ν_{j}^{(β)} + η_{k}^{(β)} \\ δ_{j [i], k [i]} & = δ + ν_{j}^{(δ)} + η_{k}^{(δ)} \end{aligned}

$\begin{aligned} \alpha_{j[i],k[i]} &= \alpha + \nu_{j}^{(\alpha)} + \eta_{k}^{(\alpha)} \\ \beta_{j[i],k[i]}&=\beta + \nu_{j}^{(\beta)} + \eta_{k}^{(\beta)}\\ \delta_{j[i],k[i]}&=\delta + \nu_{j}^{(\delta)} + \eta_{k}^{(\delta)}\\ \end{aligned}$ with the same covariance structure as above? It shows the nested structure of the data as well as which coefficients vary across which levels.

— baruuum
źródło