Bardzo ograniczone informacje, które posiadasz, są z pewnością poważnym ograniczeniem! Jednak rzeczy nie są całkowicie beznadziejne.
Przy tych samych założeniach, które prowadzą do asymptotycznego rozkładu dla statystyki testowej testu dobroci dopasowania o tej samej nazwie, statystyka testowa według alternatywnej hipotezy ma asymptotycznie niecentralny rozkład χ 2 . Jeśli założymy, że dwa bodźce są a) znaczące i b) mają ten sam efekt, powiązane statystyki testowe będą miały taki sam asymptotyczny niecentralny rozkład χ 2 . Możemy to wykorzystać do skonstruowania testu - zasadniczo poprzez oszacowanie parametrów noncentrality X i sprawdzając, czy statystyki testowe są daleko w ogonach w noncentral × 2 ( 18 , λ )χ2)χ2)χ2)λχ2)( 18 , λ^)dystrybucja. (Nie oznacza to jednak, że ten test będzie miał dużą moc.)
Możemy oszacować parametr niecentralności, biorąc pod uwagę dwie statystyki testowe, biorąc ich średnią i odejmując stopnie swobody (metoda estymatora momentów), dając oszacowanie 44, lub przez maksymalne prawdopodobieństwo:
x <- c(45, 79)
n <- 18
ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619
Dobra zgodność między naszymi dwoma szacunkami, nic dziwnego, biorąc pod uwagę dwa punkty danych i 18 stopni swobody. Teraz obliczyć wartość p:
> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421
Zatem nasza wartość p wynosi 0,12, co nie wystarcza do odrzucenia hipotezy zerowej, że oba bodźce są takie same.
λχ2)( λ - δ, λ + δ)δ= 1 , 2 , … , 15δ i zobacz, jak często nasz test odrzuca, powiedzmy, na poziomie ufności 90% i 95%.
nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
for (i in 1:10000)
{
x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
pval <- pchisq(min(x), n, lhat)
nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
}
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000
plot(preject05~delta, type='l', lty=1, lwd=2,
ylim = c(0, 0.4),
xlab = "1/2 difference between NCPs",
ylab = "Simulated rejection rates",
main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
expression(paste(alpha, " = 0.10"))),
lty=c(1,2), lwd=2)
co daje:
Patrząc na prawdziwe punkty hipotezy zerowej (wartość na osi x = 0), widzimy, że test jest konserwatywny, ponieważ nie wydaje się odrzucać tak często, jak wskazuje poziom, ale nie w przeważającej mierze. Tak jak się spodziewaliśmy, nie ma dużej mocy, ale jest lepszy niż nic. Zastanawiam się, czy istnieją lepsze testy, biorąc pod uwagę bardzo ograniczoną ilość dostępnych informacji.