Czy można udowodnić hipotezę zerową?


37

Jak stwierdza pytanie - czy można udowodnić hipotezę zerową? Z mojego (ograniczonego) zrozumienia hipotezy odpowiedź brzmi „nie”, ale nie potrafię znaleźć dokładnego wyjaśnienia. Czy pytanie ma ostateczną odpowiedź?


4
To zależy od tego, co rozumiesz przez „udowodnić”. Jak powiedziano, jest to pytanie filozoficzne, a nie statystyczne, i nie ma ostatecznej odpowiedzi (chociaż, przynajmniej od czasów Davida Hume'a, większość ludzi odpowiedziałaby „nie”).
whuber

To trochę źle postawione pytanie. Musimy znać warunki, w których ten „dowód” ma się pojawić.
Prawdopodobieństwo

Być może lepiej postawione pytanie brzmi: „W jakich warunkach / założeniach można udowodnić hipotezę zerową?”
Prawdopodobieństwo

Odpowiedzi:


19

Jeśli mówisz o prawdziwym świecie, a nie o formalnej logice, odpowiedź brzmi oczywiście. „Dowód” czegokolwiek za pomocą środków empirycznych zależy od siły wnioskowania, które z kolei jest określone przez ważność procesu testowania ocenianego w świetle wszystkiego, co wiemy o tym, jak działa świat (tj. Teorii). Ilekroć przyjmuje się, że pewne wyniki empiryczne uzasadniają odrzucenie hipotezy „zerowej”, koniecznie dokonuje się tego rodzaju osądów (ważność projektu; świat działa w określony sposób), dlatego konieczne jest przyjęcie analogicznych założeń niezbędnych do uzasadnienia wnioskowania „dowodu” null ” wcale nie stanowi problemu.

Jakie są analogiczne założenia? Oto przykład „udowodnienia zerowej”, która jest powszechna w naukach o zdrowiu i naukach społecznych. (1) Zdefiniuj „zero” lub „brak efektu” w jakikolwiek praktyczny sposób. Powiedzmy, że uważam, że powinienem postępować tak, jakby nie było znaczącej różnicy między 2 terapiami, t1 i t2, w przypadku choroby, chyba że jedno daje o 3% większe szanse na wyleczenie niż drugie. (2) Wymyśl prawidłowy projekt do testowania, czy występuje jakikolwiek efekt - w tym przypadku, czy istnieje różnica w prawdopodobieństwie odzyskania między t1 i t2. (3) Wykonaj analizę mocy, aby ustalić, czy wielkość próby jest niezbędna do wygenerowania wystarczająco wysokiego prawdopodobieństwa - na podstawie którego jestem pewien, biorąc pod uwagę, co ”zakładając, że istnieje. Zwykle ludzie mówią, że moc jest wystarczająca, jeśli prawdopodobieństwo zaobserwowania określonego efektu na określonej alfa wynosi co najmniej 0,80, ale właściwy poziom pewności jest tak naprawdę kwestią tego, jak niechętnie się mylisz - tak samo jak wtedy, gdy wybierzesz p -wartość progowa dla „odrzucenia zera”. (4) Wykonaj test empiryczny i obserwuj efekt. Jeśli jest poniżej określonej wartości „znaczącej różnicy” - 3% w moim przykładzie - „udowodniłeś”, że „nie ma efektu”.

Aby zapoznać się z dobrym podejściem do tej sprawy, patrz Streiner, DL Unicorns Do Exist: Tutorial o „Udowadnianiu” hipotezy zerowej . Canadian Journal of Psychiatry 48, 756-761 (2003).


1
+1. To dobry przykład na znaczenie jasnego określenia standardu „dowodu”. W wielu aplikacjach ten, który tu przywołujesz - standard „zachowuj się, jakby”, jeśli mogę tak to nazwać - jest tak słaby, że nikt nie zaakceptuje go jako „dowodu”. Nie zaprzeczam jednak jego przydatności i opowiadam się za tego rodzaju podejściem wspierającym racjonalne podejmowanie decyzji. (Ale może metody bayesowskie są lepsze ... :-)
whuber

1
(+1) Dobra odpowiedź. Dodałem link do internetowej wersji artykułu Streiner; Mam nadzieję, że nie masz nic przeciwko (możesz je usunąć).
chl

1
kilka innych rzeczy: (1) Traktowanie braku odrzucenia wartości zerowej jako dowodu na poparcie wartości zerowej jest szokująco częstym błędem i zwykłą okazją do stwierdzenia Streinera. Ten błąd zasadniczo zamienia silną awersję do błędu typu 1 w normie „p <0,05” w licencję na wykonanie typu 2. S mówi: „poczekaj - potrzebujesz mocy ...” (2) Whuber przytacza słynny argument Hume'a. Pt H jest właściwie tylko jako wywrotowy empirycznych dowodów odrzucających null jako dowodów na wartość zerową. H twierdzi, że indukcja nie może poprzeć wnioskowania przyczynowego. Dobrze; ale nie ma alternatywy dla badań empirycznych! Idź Pearl (i Bayes), a nie Hume, na przyczynowość!
dmk38

1
to pytanie dotyczące testowania równoważności ma również kilka dobrych sugestii stats.stackexchange.com/questions/3038/…
Anglim

Czy jest to równoznaczne z przyjęciem „nie zerowej” jako nowej hipotezy zerowej, a następnie odrzuceniem tej nowej hipotezy zerowej?

16

Odpowiedź od strony matematycznej: jest to możliwe tylko wtedy, gdy „hipotezy są wzajemnie pojedyncze”.

Jeśli przez „udowodnić” masz na myśli regułę, która może „zaakceptować” (powinienem to powiedzieć :)) z prawdopodobieństwem popełnienia błędu, który wynosi zero, to szukasz czegoś, co można nazwać „testem idealnym” i to istnieje :H0

Jeśli przeprowadzasz testy, losowa zmienna jest pobierana z lub z (tj. Testowanie porównaniu z ), wówczas istnieje test idealny tylko wtedy, gdy ( i są „wzajemnie pojedyncze”). XP0P1H0:XP0H1:XP1 P1P0P1P0

Jeśli nie wiesz, co oznacza „wzajemnie pojedyncze”, mogę podać przykład: i (mundury na i ) wzajemnie się pojedynczo. Oznacza to, jeśli chcesz przetestowaćU[0,1]U[3,4][0,1][3,4]

H0:XU[0,1] versusH1:XU[3,4]

wtedy istnieje idealny test (zgadnij, co to jest :)): test, który nigdy nie jest zły!

Jeśli i nie są pojedynczo, to nie istnieje (wynika to z „tylko jeśli część”)!P1P0

W kategoriach niematematycznych oznacza to, że możesz udowodnić zero, tylko wtedy, gdy dowód jest już w twoich założeniach (tj. Wtedy i tylko wtedy, gdy wybrałeś hipotezę i które są tak różne, że nie można zidentyfikować pojedynczej obserwacji z jako jeden z i odwrotnie). H0H1H0H1


4
+1 Ładna odpowiedź. Prostym przedstawieniem matematyki jest to, że przyjmuje się, że wartość zerowa i jej alternatywy dają rozłączne zestawy wyników; np. albo w tym pokoju jest zebra, albo jej nie ma. Oczywiście „udowodnić” obejmuje tutaj domyślnie „uwarunkowane modelem”, które samo w sobie nigdy nie jest ustanawiane z takim samym rygorem jak, powiedzmy, twierdzenie matematyczne; domyślnie obejmuje „uwarunkowane dokładnością obserwacji”; i domyślnie obejmuje to, że hipotezy można jednoznacznie interpretować. (Krytykę tego ostatniego można znaleźć w: Kobiety, ogień i niebezpieczne rzeczy George'a Lakoffa ) .
whuber

11

Tak, istnieje ostateczna odpowiedź. Ta odpowiedź brzmi: nie, nie ma sposobu na udowodnienie zerowej hipotezy. O ile wiem, najlepsze, co możesz zrobić, to rzucić przedziały ufności wokół swoich oszacowań i wykazać, że efekt jest tak mały, że równie dobrze może nie istnieć.


4
Mówiąc bardziej ogólnie, problem statystyczny nie polega na tym, że nie jesteś w stanie udowodnić hipotezy zerowej, lecz na tym, że nie jesteś w stanie dokonać żadnych oszacowań punktowych z pewnością. Oznacza to, że podobnie jak nie można powiedzieć „nie ma wpływu zmiennej”, nie można powiedzieć, że „wielkość efektu zmiennej wynosi 1,95”. Statystyki zawsze mają przedziały ufności.
russellpierce 20.01.11

1
Zgodził się, że odpowiedź brzmi: NIE, i to z bardzo mocnego powodu: poprzez konstruowanie hipotez statystycznych. Fakt, że w przyjętej odpowiedzi jest twierdzenie inaczej, jest absolutnie tragiczny. Testowanie hipotez stanowi odpowiedź: zakładając, że moja hipoteza jest prawdziwa , czy dane, z których próbowałem, są z nią zgodne? I w żadnym wypadku nie jest na odwrót. Nie trzeba wiele rozumować, aby zrozumieć, że nie można wywnioskować z tego, czy hipoteza jest prawdziwa, czy nie.
Christophe

4

Dla mnie ramy teoretyczne decyzji stanowią najprostszy sposób na zrozumienie „hipotezy zerowej”. Mówi w zasadzie, że muszą istnieć co najmniej dwie alternatywy: hipoteza zerowa i co najmniej jedna alternatywa. Zatem „problemem decyzyjnym” jest zaakceptowanie jednej z alternatyw i odrzucenie pozostałych (chociaż musimy sprecyzować, co rozumiemy przez „zaakceptowanie” i „odrzucenie” hipotezy). Widzę pytanie „czy możemy udowodnić hipotezę zerową?” analogicznie do „czy zawsze możemy podjąć właściwą decyzję?”. Z perspektywy teorii decyzji odpowiedź brzmi: tak, jeśli

1) w procesie decyzyjnym nie ma pewności, ponieważ wówczas matematycznym zadaniem jest ustalenie, jaka jest właściwa decyzja.

2) akceptujemy wszystkie inne przesłanki / założenia problemu. Najbardziej krytyczna (jak sądzę) jest to, że hipoteza, o której decydujemy, jest wyczerpująca, a jedna (i tylko jedna) z nich musi być prawdziwa, a pozostałe fałszywe.

Z bardziej filozoficznego punktu widzenia nie można niczego „udowodnić” w tym sensie, że „dowód” zależy całkowicie od założeń / aksjomatów, które prowadzą do tego „dowodu”. Widzę dowód jako rodzaj logicznej równoważności, a nie „fakt” lub „prawdę” w tym sensie, że jeśli dowód jest błędny, założenia, które do niego doprowadziły, są również błędne.

Stosując to do „udowodnienia hipotezy zerowej”, mogę „udowodnić”, że jest to prawdą, po prostu zakładając, że jest to prawda, lub zakładając, że jest to prawdą, jeżeli spełnione są określone warunki (takie jak wartość statystyki).


3

Tak, możliwe jest udowodnienie wartości zerowej - dokładnie w tym samym sensie, że można udowodnić dowolną alternatywę dla wartości zerowej. W analizie bayesowskiej jest całkowicie możliwe, że szanse na korzyść wartości zerowej w stosunku do dowolnej z proponowanych alternatyw dla niej stają się arbitralnie duże. Co więcej, fałszywe jest twierdzenie, jak twierdzą niektóre z powyższych odpowiedzi, że zero można udowodnić tylko wtedy, gdy alternatywy dla niego są rozłączne (nie nakładają się na zero). W analizie bayesowskiej każda hipoteza ma wcześniejszy rozkład prawdopodobieństwa. Rozkład ten rozkłada masę jednostkową wcześniejszego prawdopodobieństwa na proponowane alternatywy. Hipoteza zerowa stawia wszystkie wcześniejsze prawdopodobieństwa na jednej alternatywie. Zasadniczo alternatywy dla wartości zerowej mogą postawić wszystkie wcześniejsze prawdopodobieństwo na pewną alternatywę inną niż zerowa (w innym „punkcie”), ale to rzadkie. Ogólnie rzecz biorąc, zabezpieczenia alternatywne, tzn. Rozkładają tę samą masę wcześniejszego prawdopodobieństwa na inne alternatywy - albo z wyłączeniem alternatywy zerowej, albo, częściej, łącznie z alternatywą zerową. Powstaje zatem pytanie, która hipoteza stawia największe prawdopodobieństwo, w którym faktycznie spadają dane eksperymentalne. Jeśli dane spadną ciasno wokół miejsca, w którym null mówi, że powinny spaść, wówczas będzie to faworyzowanie szansy (wśród proponowanych hipotez) NAWET, ŻE JEST WŁĄCZONE W (NIEDOZWOLONE, NIE WOLNO WYŁĄCZNIE Z NIMI) ALTERNATYWY DO TO. Przekonanie, że zagnieżdżona alternatywa nie jest bardziej prawdopodobna niż zbiór, w którym jest zagnieżdżona, odzwierciedla brak rozróżnienia między prawdopodobieństwem a prawdopodobieństwem. Chociaż niemożliwe jest, aby element zestawu był mniej prawdopodobny niż cały zestaw, jest całkowicie możliwe, że prawdopodobieństwo tylnego elementu zestawu hipotez będzie większe niż prawdopodobieństwo tylnego zestawu jako całości. Tylne prawdopodobieństwo hipotezy jest iloczynem funkcji prawdopodobieństwa i wcześniejszego rozkładu prawdopodobieństwa, jaki zakłada hipoteza. Jeśli hipoteza umieści wszystkie wcześniejsze prawdopodobieństwa we właściwym miejscu (np. Na wartości zerowej), wówczas będzie miała wyższe prawdopodobieństwo z tyłu niż hipoteza, która umieści część wcześniejszego prawdopodobieństwa w niewłaściwym miejscu (nie na wartości zerowej). Tylne prawdopodobieństwo hipotezy jest iloczynem funkcji prawdopodobieństwa i wcześniejszego rozkładu prawdopodobieństwa, jaki zakłada hipoteza. Jeśli hipoteza umieści wszystkie wcześniejsze prawdopodobieństwa we właściwym miejscu (np. Na wartości zerowej), wówczas będzie miała wyższe prawdopodobieństwo z tyłu niż hipoteza, która umieści część wcześniejszego prawdopodobieństwa w niewłaściwym miejscu (nie na wartości zerowej). Tylne prawdopodobieństwo hipotezy jest iloczynem funkcji prawdopodobieństwa i wcześniejszego rozkładu prawdopodobieństwa, jaki zakłada hipoteza. Jeśli hipoteza umieści wszystkie wcześniejsze prawdopodobieństwa we właściwym miejscu (np. Na wartości zerowej), wówczas będzie miała wyższe prawdopodobieństwo z tyłu niż hipoteza, która umieści część wcześniejszego prawdopodobieństwa w niewłaściwym miejscu (nie na wartości zerowej).


2

Technicznie nie, nie można udowodnić hipotezy zerowej. Dla każdej ustalonej, skończonej wielkości próbki zawsze będzie jakiś mały, ale niezerowy rozmiar efektu, dla którego twój test statystyczny nie ma praktycznie żadnej mocy. Praktycznie jednak możesz udowodnić, że mieścisz się w niewielkim epsilonie hipotezy zerowej, tak że odchylenia mniejsze niż ten epsilon nie są praktycznie znaczące.


2

Istnieje przypadek, w którym dowód jest możliwy. Załóżmy, że masz szkołę, a twoją zerową hipotezą jest to, że liczba chłopców i dziewcząt jest równa. Wraz ze wzrostem wielkości próby niepewność w stosunku chłopców do dziewcząt ma tendencję do zmniejszania się, ostatecznie osiągając pewność (co, jak zakładam, rozumiesz przez dowody), kiedy pobierana jest próbka z całej populacji uczniów.

Ale jeśli nie masz skończonej populacji lub jeśli próbujesz z zamiennikiem i nie możesz dostrzec osobników, u których dokonano ponownej próby, nie możesz zredukować niepewności do zera za pomocą skończonej próbki.


0

Chciałbym tutaj omówić kwestię, w której wielu użytkowników jest nieco zdezorientowanych. Jakie jest prawdziwe znaczenie hipotezy zerowej H0: p = 0? Czy próbujemy ustalić, czy parametr p wynosi zero? Oczywiście, że nie, nie ma sposobu na osiągnięcie takiego celu.

Zamierzamy ustalić, że biorąc pod uwagę zestaw danych, oszacowana wartość parametru jest (lub nie) nierozróżnialna od zera. Pamiętaj, że NHST jest „niesprawiedliwy” wobec alternatywnych hipotez: zeru przypisuje się 95% poziom ufności, a tylko 5% alternatywie. W rezultacie „nieistotny” wynik nie oznacza, że ​​H0 utrzymuje się, ale po prostu nie znaleźliśmy wystarczających dowodów na to, że alternatywa jest prawdopodobna.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.