Interpretacja wyników uśredniania modelu w R


11

Staram się zrozumieć i wiedzieć, co zgłosić na podstawie analizy niektórych danych przy użyciu modelu uśrednionego w R.

Używam następującego skryptu do analizy wpływu metody pomiaru na daną zmienną: Oto zestaw danych: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0

Model do zamontowania:

LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4)

pogłębić pełny model

require(MuMIn)
d=dredge(LM.1)
print(d)
coefficients(d)

Uzyskaj informacje podsumowujące o wszystkich modelach, aby uzyskać oszacowania parametrów

summary(model.avg(d))

Wiem, że albo wszystkie modele można uśrednić (pełne uśrednienie modelu), albo tylko ich podzbiór (uśrednienie warunkowe). Teraz chciałbym wiedzieć: kiedy lepiej wyciągać wnioski z pełnego lub warunkowego uśredniania. Co powinienem to zgłosić w artykule naukowym? Co dokładnie oznacza wartość Z i związane z nią p dla sytuacji uśredniania modelu?

Aby ułatwić wizualizację moich pytań. Oto tabela wyników,

> summary(model.avg(d))# now, there are effects

Call:
model.avg(object = d)

Component model call: 
gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action = 
 na.fail)

Component models: 
       df  logLik   AICc delta weight
1       4 -247.10 502.52  0.00   0.34
12      5 -246.17 502.83  0.31   0.29
13      5 -246.52 503.52  1.01   0.20
123     6 -245.60 503.88  1.36   0.17
(Null)  2 -258.62 521.33 18.81   0.00
3       3 -258.38 522.95 20.43   0.00
2       3 -258.60 523.39 20.88   0.00
23      4 -258.36 525.05 22.53   0.00

Term codes: 
method    sex   turn 
     1      2      3 

Model-averaged coefficients:  
(full average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)            42.63521    0.37170     0.37447 113.856  < 2e-16 ***
methodlight chamber    -1.05276    0.36098     0.36440   2.889  0.00386 ** 
methodthermal gradient -1.80567    0.36103     0.36445   4.955    7e-07 ***
sex2                    0.19023    0.29403     0.29548   0.644  0.51970    
turn                    0.05005    0.10083     0.10141   0.494  0.62165    

(conditional average) 
                       Estimate Std. Error Adjusted SE z value Pr(>|z|)    
(Intercept)             42.6352     0.3717      0.3745 113.856  < 2e-16 ***
methodlight chamber     -1.0528     0.3609      0.3643   2.890  0.00386 ** 
methodthermal gradient  -1.8058     0.3608      0.3642   4.958  7.1e-07 ***
sex2                     0.4144     0.3089      0.3119   1.328  0.18402    
turn                     0.1337     0.1264      0.1276   1.047  0.29492    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Relative variable importance: 
                     method sex  turn
Importance:          1.00   0.46 0.37
N containing models:    4      4    4

Odpowiedzi:


5

Patrz Grueber i in. 2011, „Wnioskowanie wielomodelowe w ekologii i ewolucji: wyzwania i rozwiązania” Evolutionary Biology 24: 699-711.

To zależy od tego, czy chcesz korzystać z pełnych, czy warunkowych danych. W mojej dziedzinie użyjemy kryteriów, takich jak AICC, aby określić, które modele są najbardziej obsługiwane, a następnie wykorzystamy je jako swój podzbiór warunkowy. Informacje te zostaną następnie zgłoszone. Na przykład wszystkie cztery pierwsze modele znajdują się w odległości 2 jednostek AIC od siebie, więc wszystkie zostaną uwzględnione w twoim podzbiorze. Inne są daleko (wyższy AIC), więc włączenie informacji z nich faktycznie obniżyłoby jakość twoich szacunków beta.


2
Jednak nawet w sugerowanym przykładzie pojawią się terminy, które pojawią się w dwóch lub czterech „najlepszych” modelach. Czy bierzesz średnią z tych dwóch wartości współczynników lub dwóch wartości i dwóch wartości zerowych dla dwóch modeli, w których się nie pojawiają?
user2390246

5

Myślę, że założenie dotyczące różnicy między tym, czym dokładnie są pełne i średnie warunkowe, jest błędne. Jeden to średnia, która zawiera zera (pełne), a druga nie zawiera zer (warunkowe). z pliku pomocy dla polecenia model.avg ():

Uwaga

„Podzbiór” (lub „warunkowy”) uśrednia tylko te modele, w których pojawia się parametr. Alternatywnie, „pełna” średnia zakłada, że ​​zmienna jest zawarta w każdym modelu, ale w niektórych modelach odpowiedni współczynnik (i jego odpowiednia wariancja) jest ustawiony na zero. W przeciwieństwie do „średniej podzbioru” nie ma tendencji do odchylania wartości od zera. „Pełna” średnia jest rodzajem estymatora skurczu i dla zmiennych o słabym związku z odpowiedzią są one mniejsze niż estymatory „podzbioru”.

Jeśli chcesz używać tylko podzbioru modeli (na przykład na podstawie delta AIC), użyj argumentu podzestawu w modelu.avg (). Nadal będziesz otrzymywać warunkowe i pełne oszacowania, dopóki niektóre z uwzględnionych modeli nie będą miały niektórych zmiennych, które mają inne.


Tak. Zgadzam się. To jest właściwa interpretacja.
ecologist1234
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.