Wartość p określa się jako prawdopodobieństwo uzyskania statystyki testowej co najmniej tak ekstremalnej, jak to, co obserwuje się, przy założeniu, że hipoteza zerowa jest prawdziwa. Innymi słowy,
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5))
hist(bimodal, breaks=100)
Załóżmy, że obserwujemy wartość statystyki testowej 60. I tutaj wiemy z obrazu, że ta wartość jest bardzo mało prawdopodobna . Idealnie więc chciałbym, aby ujawnić to procedurę statystyczną, której używam (powiedzmy wartość p). Ale jeśli obliczymy wartość p zdefiniowaną, otrzymamy całkiem wysoką wartość p
observed <- 60
# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993
Gdybym nie znał rozkładu, doszłbym do wniosku, że to, co zaobserwowałem, jest po prostu przypadkiem. Ale wiemy, że to nieprawda.
Wydaje mi się, że moje pytanie brzmi: dlaczego obliczając wartość p, obliczamy prawdopodobieństwo dla wartości „co najmniej tak ekstremalnych jak” obserwowanych? A jeśli napotkam sytuację taką jak ta, którą symulowałem powyżej, jakie jest alternatywne rozwiązanie?