Twoja seria eksperymentów może być postrzegana jako pojedynczy eksperyment z dużo większą ilością danych, a jak wiemy, więcej danych jest korzystne (np. Zwykle standardowe błędy zmniejszają się, gdy rośnie dla niezależnych danych). Ale pytasz: „Czy to… wystarczający dowód, aby stwierdzić, że H0 jest prawdą?”n−−√
Nie. Podstawowym problemem jest to, że inna teoria może wytwarzać podobne wzorce w danych! Jak @ Björn omawia w swojej odpowiedzi, nie fałszywego jeśli twój eksperyment nie ma mocy, aby odróżnić od innych możliwości. Przez stulecia nie odrzucaliśmy teorii grawitacji Newtona, ponieważ nikt nie przeprowadził testów, w których teoria Newtona daje wystarczająco inne prognozy niż teoria względności Einsteina. Mniej ekstremalne przykłady są powszechne.H0H0
David Hume i problem indukcji
Być może przeformułowanie brzmi: „Jeśli uzyskam coraz więcej danych zgodnych z , czy mogę kiedykolwiek dojść do wniosku, że jest prawdziwy?”H0H0
Pytanie to jest głęboko związane z problemem indukcji XVIII-wiecznego filozofa Davida Hume'a . Jeśli wszystkie zaobserwowane przypadki A były B , czy możemy powiedzieć, że następnym wystąpieniem A będzie B? Hume powiedział, że nie, że nie możemy logicznie wywnioskować, że „wszystkie A są B” nawet na podstawie obszernych danych. W bardziej nowoczesnej matematyce skończony zestaw obserwacji nie może logicznie pociągać za sobą jeśli A nie jest zbiorem skończonym. Dwa godne uwagi przykłady omówione przez Magee i Passermore :∀a∈A[a∈B]
Przez wieki każdy łabędź obserwowany przez Europejczyków był biały. Następnie Europejczycy odkryli Australię i zobaczyli czarne łabędzie.
Przez stulecia prawo grawitacji Newtona zgadzało się z obserwacjami i było uważane za prawidłowe. Zostało to obalone przez teorię ogólnej teorii względności Einsteina.
Jeśli wniosek Hume'a jest poprawny, udowodnienie, że true jest nieosiągalne. To, że nie możemy składać oświadczeń z pewnością, nie jest równoznaczne z powiedzeniem, że nic nie wiemy. Eksperymentalna nauka i statystyka pomogły nam zrozumieć świat i poruszać się po nim.H0
(Niekompletna) lista sposobów postępowania:
Karl Popper i falsyfikacjonizm
W opinii Karla Poppera żadne prawo naukowe nigdy nie zostało udowodnione. Mamy tylko prawa naukowe, które nie zostały jeszcze udowodnione jako fałszywe.
Popper argumentował, że nauka rozwija się, zgadując hipotezy i poddając je rygorystycznej analizie. Postępuje naprzód poprzez dedukcję (obserwacje potwierdzające teorie fałszywe), a nie indukcję (powtarzane obserwacje potwierdzające teorie prawdziwe). Wiele statystyk częstokroć było skonstruowanych zgodnie z tą filozofią.
Poglądy Poppera były niezwykle wpływowe, ale jak twierdzili Kuhn i inni, nie do końca są zgodne z obserwowaną empirycznie praktyką udanej nauki.
Bayesowskie, subiektywne prawdopodobieństwo
Załóżmy, że interesuje nas parametr .θ
Dla statystysty parametr jest wartością skalarną, liczbą. Jeśli zamiast tego przyjmiesz subiektywny punkt widzenia Bayesa (na przykład w Foundation of Leonard Jimmie Savage's Foundation ), możesz modelować własną niepewność co do przy użyciu narzędzi prawdopodobieństwa. Dla subiektywnego bayesowskiego jest zmienną losową i masz jakieś wcześniejsze . Można wtedy mówić o subiektywnego prawdopodobieństwa z różnymi wartościami podane dane . To, jak zachowujesz się w różnych sytuacjach, ma pewną zgodność z tymi subiektywnymi prawdopodobieństwami.θθ θ P ( θ ) P ( θ ∣ X ) θ XθθP(θ)P(θ∣X)θX
Jest to logiczny sposób modelowania własnych subiektywnych przekonań, ale nie jest to magiczny sposób na uzyskanie prawdopodobieństw, które są prawdziwe pod względem zgodności z rzeczywistością. Trudnym pytaniem dla jakiejkolwiek interpretacji bayesowskiej jest to, skąd pochodzą pierwszeństwa? A co, jeśli model zostanie źle określony?
George P. Box
Słynny aforyzm George'a Boxa polega na tym, że „wszystkie modele są fałszywe, ale niektóre są przydatne”.
Prawo Newtona może nie być prawdą, ale nadal jest przydatne w przypadku wielu problemów. Widok Boxa jest dość ważny w nowoczesnym kontekście dużych zbiorów danych, w którym badania są tak obezwładnione, że można zasadniczo odrzucić każdą sensowną propozycję. Ściśle prawda a fałsz jest złym pytaniem: ważne jest, czy model pomaga zrozumieć dane.
Dodatkowe komentarze
Istnieje statystyczna różnica w statystyce między szacowaniem parametru z małym błędem standardowym a dużym błędem standardowym! Nie odchodź, myśląc, że ponieważ pewność jest niemożliwa, rygorystyczna kontrola nie ma znaczenia.θ≈0
Być może również interesujące, statystyczna analiza wyników wielu badań nazywa się metaanalizą .
To, jak daleko można wyjść poza wąskie interpretacje statystyczne, jest trudnym pytaniem.