Gdy czytam książkę Wassermanna Wszystkie statystyki, dostrzegam subtelną subtelność w definicji wartości p, której nie mogę zrozumieć. Nieformalnie Wassermann określa wartość p jako
[..] prawdopodobieństwo (poniżej ) zaobserwowania wartości statystyki testowej takiej samej lub bardziej ekstremalnej niż rzeczywista obserwowana.
Podkreślenie dodane. To samo bardziej formalnie (Twierdzenie 10.12):
Załóżmy, że test rozmiar ma postać
odrzucić wtedy i tylko wtedy, gdy .
Następnie,
gdzie jest obserwowaną wartością . Jeśli to
Ponadto Wassermann definiuje wartość p testu \ chi ^ 2 Pearsona (i innych testów analogicznie) jako:
Część, o którą lubię prosić o wyjaśnienie, to znak większej równości ( ) w pierwszej i większy ( ) znak w drugiej definicji. Dlaczego nie piszemy , który pasowałby do pierwszego cytatu „ to samo lub bardziej ekstremalne?”
Czy to czysta wygoda, aby obliczyć wartość p jako ? Zauważam, że R używa również definicji ze znakiem , np . W.chisq.test