Liniowe modele efektów mieszanych nie są powszechnie stosowane w moim kącie biologii i muszę zgłosić test statystyczny, którego użyłem w artykule, który próbuję napisać. Wiem, że świadomość modelowania wielopoziomowego zaczyna pojawiać się w niektórych obszarach nauk biologicznych ( Rozwiązanie zależności: używanie analizy wielopoziomowej w celu dostosowania danych zagnieżdżonych ), ale wciąż próbuję nauczyć się raportować moje wyniki!
Mój plan eksperymentalny, w skrócie:
* Pacjentów przypisano do jednej z czterech grup leczenia
* Pomiary zmiennej zależnej wykonano w różne dni po rozpoczęciu leczenia
* Projekt jest niezrównoważony (nierówna liczba uczestników w grupach leczenia i brakuje pomiary dla niektórych pacjentów w niektóre dni)
* Leczenie A jest kategorią odniesienia
* Wyśrodkowałem dane w ostatnim dniu leczenia
Chcę wiedzieć, czy leczenie A (kategoria referencyjna) daje znacznie lepsze wyniki niż inne zabiegi (pod koniec leczenia).
Zrobiłem analizę w R, używając nlme:
mymodel <- lme(dv ~ Treatment*Day, random = ~1|Subject, data = mydf, na.action = na.omit,
+ correlation = corAR1(form = ~1 |Subject), method = "REML")
Wyjście (częściowo; obcięte dla zwięzłości) to:
>anova(mymodel)
numDF denDF F-value p-value
(Intercept) 1 222 36173.09 <.0001
Treat 3 35 16.61 <.0001
Day 7 222 3.43 0.0016
Treat:Day 21 222 3.62 <.0001
>summary(mymodel)
Fixed effects: dv ~ Treatment * Day
Value Std.Error DF t-value p-value
(Intercept) 7.038028 0.1245901 222 56.48945 0.0000
TreatmentB 0.440560 0.1608452 35 2.73903 0.0096
TreatmentC 0.510214 0.1761970 35 2.89570 0.0065
TreatmentD 0.106202 0.1637436 35 0.64859 0.5208
Wiem więc, że efekt Dnia różni się w zależności od leczenia i że w ostatnim dniu leczenia (gdzie dane są wyśrodkowane) dv różni się znacząco w leczeniu A niż w leczeniu B lub C.
Chcę powiedzieć: „Jak przewidywaliśmy, stwierdziliśmy, że zmienna zależna była znacznie niższa u pacjentów otrzymujących leczenie A (średnia +/- SE) niż u pacjentów otrzymujących leczenie B (średnia +/- SE, p = 0,0096) lub leczenie C (średnia +/- SE, p = 0,0065), jak zmierzono w ostatnim dniu leczenia. ”
Ale muszę wskazać, jaki test statystyczny został wykonany. Czy byłby to akceptowalny sposób na opisanie analizy? „[Metodę pomiaru] wykonano we wskazanych dniach i określono zmienną zależną (jednostki); przeanalizowaliśmy dane przekształcone logarytmicznie, stosując liniowy model efektów mieszanych wyśrodkowany w [ostatnim dniu leczenia]. Symbole reprezentują średnią dv; słupki błędów są błąd standardowy. W ostatnim dniu leczenia dv było znacznie niższe w Traktowaniu A (średnia +/- SE) niż w Leczeniu B (średnia +/- SE, p = 0,0096) ... ”
W szczególności:
* Czy to wystarcza na temat zastosowanego testu statystycznego? (Czytelnicy są przyzwyczajeni do postrzegania czegoś bardziej jak „średnia +/- SE, p = 0,0096, test t-Studenta”, ale dziwnie wydaje się pisać „p = 0,0096, współczynnik dla leczenia B w porównaniu do leczenia A z liniowych efektów mieszanych model na [ostatni dzień leczenia]. ”)
* Czy istnieje lepszy sposób na to?
(Sekcja metod będzie zawierała więcej informacji o statystykach: „Dane [Metoda pomiaru] zostały przeanalizowane przy użyciu pakietów R i R… Przeanalizowaliśmy przekształcone logarytmicznie dane zmiennych zależnych przy użyciu liniowych modeli efektów mieszanych, używając obiektów jako efektów losowych i struktura autokorelacji rzędu 1 (AR1). Jako ustalone efekty uwzględniliśmy Leczenie i Dzień oraz interakcję Leczenia i Dnia. Sprawdziliśmy normalność i jednorodność poprzez wizualne kontrole wykresów reszt względem dopasowanych wartości. Aby ocenić ważność w analizach efektów mieszanych przeprowadziliśmy testy współczynnika prawdopodobieństwa, porównując modele ze stałymi efektami z modelami zerowymi tylko z efektami losowymi. ”)
Wszelkie porady dotyczące zgłaszania wyników liniowego modelu mieszanych efektów dla odbiorców często niechętnych do statystyk (i napisane przez początkującego statystyki względne) byłyby bardzo mile widziane!