Ze Stanem i pakietów frontend rstanarm
czy brms
mogę łatwo analizować dane droga Bayesa jak ja zanim z mieszanych modeli takich jak lme
. Chociaż na biurku mam większość książek i artykułów Kruschke-Gelman-Wagenmakers itp., Nie mówią mi one, jak podsumować wyniki dla medycznej publiczności, rozdartej między Skylla gniewu Bayesiana a Charybdą recenzentów medycznych ( „chcemy znaczeń, a nie rzeczy rozproszonych”).
Przykład: Częstotliwość żołądka (1 / min) mierzy się w trzech grupach; referencje stanowią zdrowe kontrole. Dla każdego uczestnika jest kilka pomiarów, więc często korzystałem z następującego modelu mieszanego lme
:
summary(lme(freq_min~ group, random = ~1|study_id, data = mo))
Lekko edytowane wyniki:
Fixed effects: freq_min ~ group
Value Std.Error DF t-value p-value
(Intercept) 2.712 0.0804 70 33.7 0.0000
groupno_symptoms 0.353 0.1180 27 3.0 0.0058
groupwith_symptoms 0.195 0.1174 27 1.7 0.1086
Dla uproszczenia użyję 2 * standardowego błędu jako 95% CI.
W kontekście częstokrzyskim podsumowałbym to następująco:
- W grupie kontrolnej szacowana częstotliwość wyniosła 2,7 / min (może dodać tutaj CI, ale czasami tego unikam z powodu zamieszania wywołanego przez absolut i różnicę CI).
- W grupie no_symptoms częstotliwość była wyższa o 0,4 / min, CI (0,11 do 0,59) / min, p = 0,006 niż kontrola.
- W grupie with_symptoms częstotliwość była wyższa o 0,2 / min, CI (-0,04 do 0,4) / min, p = 0,11 niż kontrola.
Chodzi o maksymalną dopuszczalną złożoność publikacji medycznej, recenzent prawdopodobnie poprosi mnie o dodanie „nieistotnego” w drugim przypadku.
Oto to samo z stan_lmer
domyślnymi priorytetami.
freq_stan = stan_lmer(freq_min~ group + (1|study_id), data = mo)
contrast lower_CredI frequency upper_CredI
(Intercept) 2.58322 2.714 2.846
groupno_symptoms 0.15579 0.346 0.535
groupwith_symptoms -0.00382 0.188 0.384
gdzie CredI to 90% wiarygodnych przedziałów (patrz winieta rstanarm, dlaczego 90% jest używane jako domyślne).
Pytania:
- Jak przetłumaczyć powyższe podsumowanie na świat bayesowski?
- W jakim stopniu wymagana jest wcześniejsza dyskusja? Jestem całkiem pewien, że artykuł powróci ze zwykłym „subiektywnym założeniem”, kiedy wspomnę o aurorze; lub przynajmniej „bez dyskusji technicznej, proszę”. Ale wszystkie władze bayesowskie żądają, aby interpretacja była ważna tylko w kontekście a priori.
- Jak mogę dostarczyć surogat „znaczenia” w sformułowaniu, nie zdradzając pojęć bayesowskich? Coś w rodzaju „wiarygodnie inny” (uuuh ...) lub prawie wiarygodnie inny (buoha ..., brzmi jak „na granicy znaczenia).
Jonah Gabry i Ben Goodrich (2016). rstanarm: Bayesian Applied Regression Modeling via Stan. Wersja pakietu R 2.9.0-3. https://CRAN.R-project.org/package=rstanarm
Stan Development Team (2015). Stan: Biblioteka C ++ dla prawdopodobieństwa i próbkowania, wersja 2.8.0. URL http://mc-stan.org/ .
Paul-Christian Buerkner (2016). brms: modele regresji bayesowskiej przy użyciu Stana. Wersja pakietu R 0.8.0. https://CRAN.R-project.org/package=brms
Pinheiro J, Bates D, DebRoy S, Sarkar D and R Core Team (2016). nlme: Liniowe i nieliniowe modele efektów mieszanych . Wersja pakietu R 3.1-124, http://CRAN.R-project.org/package=nlme>.
group_nosymptoms
a następnie powiedzieć, że prawdopodobieństwo, że będzie ujemne, jest 1 / draws
. Ale w przypadku przechwytywania łańcuch nigdy nie będzie wędrować na terytorium negatywne dla tych danych, więc myślę, że można powiedzieć, że prawdopodobieństwo jest mniejsze niż 1 / draws
.
mean(as.matrix(freq_stan)[,"groupwith_symptoms"] < 0)
.