Wiemy, że sparowany test t jest tylko specjalnym przypadkiem jednokierunkowej ANOVA z powtarzanymi pomiarami (lub wewnątrz podmiotu), a także liniowym modelem mieszanego efektu, który można zademonstrować za pomocą funkcji lme () pakiet nlme w języku R jak pokazano niżej.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Kiedy uruchamiam następujący sparowany test t:
t.test(x1, x2, paired = TRUE)
Mam ten wynik (otrzymasz inny wynik z powodu losowego generatora):
t = -2.3056, df = 9, p-value = 0.04657
Dzięki podejściu ANOVA możemy uzyskać ten sam wynik:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Teraz mogę uzyskać ten sam wynik w lme przy użyciu następującego modelu, zakładając dodatnio określoną symetryczną macierz korelacji dla dwóch warunków:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
Lub inny model, zakładając złożoną symetrię dla macierzy korelacji dwóch warunków:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Za pomocą sparowanego testu t i jednokierunkowej ANOVA z powtarzanymi pomiarami mogę zapisać tradycyjny model średnich komórek jako
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
gdzie i indeksuje warunek, j indeksuje podmiot, Y ij jest zmienną odpowiedzi, μ jest stały dla ustalonego efektu dla średniej ogólnej, α i jest ustalonym efektem dla warunku, β j jest efektem losowym dla badanego po N (0, σ p 2 ) (σ p 2 to wariancja populacyjna), a ε ij jest resztkowe po N (0, σ 2 ) (σ 2 jest wariancją wewnątrzosobniczą).
Myślałem, że powyższy model średniej komórkowej nie byłby odpowiedni dla modeli lme, ale problem polega na tym, że nie mogę wymyślić rozsądnego modelu dla dwóch podejść lme () przy założeniu struktury korelacji. Powodem jest to, że model lme wydaje się mieć więcej parametrów dla składników losowych niż model średniej komórki powyżej oferuje. Przynajmniej model lme zapewnia dokładnie tę samą wartość F, stopnie swobody, a także wartość p, czego gls nie może. Mówiąc dokładniej, gls podaje nieprawidłowe DF ze względu na fakt, że nie uwzględnia faktu, że każdy badany ma dwie obserwacje, co prowadzi do znacznie zawyżonego DF. Model lme najprawdopodobniej jest sparametryzowany w określaniu losowych efektów, ale nie wiem, co to jest model i jakie są parametry. Tak więc problem nadal jest dla mnie nierozwiązany.