W lutym 2016 r. Amerykańskie stowarzyszenie statystyczne opublikowało formalne oświadczenie w sprawie istotności statystycznej i wartości p. Nasz wątek na ten temat obszernie omawia te problemy. Jednak do tej pory nie pojawił się żaden organ oferujący powszechnie uznaną skuteczną alternatywę. Amerykańskie Towarzystwo Statystyczne (ASS) opublikowało swoją odpowiedź, wartości p: Co dalej?
„Wartość p nie jest zbyt dobra”.
Uważamy, że ASA nie posunęła się wystarczająco daleko. Czas przyznać, że era wartości p dobiegła końca. Statystycy z powodzeniem wykorzystali je do oszukania studentów, oszukiwania naukowców i oszukiwania redaktorów na całym świecie, ale świat zaczyna przejrzeć tę podstęp. Musimy porzucić tę próbę statystycznych z początku XX wieku, aby kontrolować podejmowanie decyzji. Musimy wrócić do tego, co faktycznie działa.
Oficjalna propozycja ASS jest następująca:
Zamiast wartości p ASS zaleca STOP (procedura SeaT-Of-Pants). Ta uświęcona i przetestowana metoda była stosowana przez starożytnych Greków, ludzi renesansu i wszystkich naukowców, dopóki nie pojawił się Ronald Fisher i zrujnował wszystko. STOP jest prosty, bezpośredni, oparty na danych i autorytatywny. Aby to zrobić, postać autorytetowa (starszy mężczyzna, z preferencji) dokonuje przeglądu danych i decyduje, czy zgadzają się z jego opinią. Kiedy decyduje, że tak, wynik jest „znaczący”. W przeciwnym razie tak nie jest i wszyscy muszą zapomnieć o całości.
Zasady
Odpowiedź dotyczy każdej z sześciu zasad ASA.
STOP może wskazywać, jak niekompatybilne są dane z określonym modelem statystycznym.
Podoba nam się to zdanie, ponieważ jest to tak fantazyjny sposób powiedzenia, że STOP odpowie na każde pytanie tak lub nie. W przeciwieństwie do wartości p lub innych procedur statystycznych nie pozostawia wątpliwości. To idealna odpowiedź dla tych, którzy mówią: „nie potrzebujemy żadnej śmierdzącej zerowej hipotezy! Co to w ogóle za *?! @? Nikt nigdy nie mógł zrozumieć, co to ma być.
STOP nie mierzy prawdopodobieństwa, że hipoteza jest prawdziwa: w rzeczywistości decyduje, czy to prawda, czy nie.
Wszyscy są zdezorientowani prawdopodobieństwami. Poprzez wyeliminowanie prawdopodobieństwa ze zdjęcia, STOP eliminuje potrzebę wieloletnich studiów licencjackich i magisterskich. Teraz każdy (wystarczająco stary i męski) może przeprowadzić analizę statystyczną bez bólu i tortur związanych ze słuchaniem choćby jednego wykładu statystycznego lub uruchamianiem tajemnego oprogramowania, które wyrzuca niezrozumiały wynik.
Wnioski naukowe oraz decyzje biznesowe lub polityczne mogą opierać się na zdrowym rozsądku i prawdziwych danych dotyczących władzy.
W każdym razie ważne decyzje zawsze były podejmowane przez władze, więc po prostu przyznajmy się i odetnijmy pośredników. Użycie STOP uwolni statystyk od robienia tego, do czego są najlepiej przystosowani: używania liczb w celu zaciemnienia prawdy i uświęcenia preferencji rządzących.
Właściwe wnioskowanie wymaga pełnego raportowania i przejrzystości.
STOP to najbardziej przejrzysta i oczywista procedura statystyczna, jaką kiedykolwiek wymyślono: patrzysz na dane i decydujesz. Eliminuje to wszystkie mylące testy Z, testy T, testy chi-kwadrat i procedury zupy alfabetycznej (ANOVA! GLM! MLE!) Używane przez ludzi do ukrycia faktu, że nie mają pojęcia, co oznaczają dane.
STOP mierzy znaczenie wyniku.
Jest to oczywiste: jeśli osoba sprawująca władzę stosuje STOP, wynik musi być ważny.
Sam STOP zapewnia dobrą miarę dowodów dotyczących modelu lub hipotezy.
Nie chcielibyśmy kwestionować władzy, prawda? Badacze i decydenci zauważą, że STOP zapewnia wszystkie informacje, które muszą znać. Z tych powodów analiza danych może zakończyć się STOP; nie ma potrzeby stosowania alternatywnych metod, takich jak wartości p, uczenie maszynowe lub astrologia.
Inne podejścia
Niektórzy statystycy preferują tak zwane „bayesowskie” metody, w których niejasne twierdzenie pośmiertnie opublikowane przez XVIII-wiecznego duchownego stosuje się bezmyślnie, aby rozwiązać każdy problem. Najbardziej znani zwolennicy swobodnie przyznają, że metody te są „subiektywne”. Jeśli zamierzamy zastosować metody subiektywne, to oczywiście im bardziej autorytatywny i kompetentny jest osoba podejmująca decyzje, tym lepszy będzie wynik. STOP staje się w ten sposób logicznym ograniczeniem wszystkich metod Bayesa. Po co męczyć się nad tymi okropnymi obliczeniami i wiązać tyle czasu komputerowego, skoro możesz po prostu pokazać dane odpowiedzialnemu facetowi i zapytać go, jakie jest jego zdanie? Koniec opowieści.
Niedawno powstała inna społeczność, aby zakwestionować kapłaństwo statystyków. Nazywają siebie „uczącymi się maszyn” i „naukowcami danych”, ale tak naprawdę to tylko hakerzy szukający wyższego statusu. To oficjalne stanowisko ASS, że ci faceci powinni założyć własną profesjonalną organizację, jeśli chcą, aby ludzie traktowali ich poważnie.
Pytanie
Czy jest to odpowiedź na problemy zidentyfikowane przez ASA za pomocą wartości p i testowania hipotez zerowych? Czy naprawdę może zjednoczyć paradygmaty bayesowskie i częste (jak domyślnie twierdzono w odpowiedzi)?