Czy analiza Bayesian Statistics wymaga analizy mocy?


19

Ostatnio badałem bayesowskie podejście do statystyki klasycznej. Po przeczytaniu o czynniku Bayesa zastanawiałem się, czy analiza mocy jest niezbędna w tym widoku statystyki. Moim głównym powodem do zastanowienia się nad tym jest fakt, że czynnik Bayesa wydaje się po prostu współczynnikiem prawdopodobieństwa. Kiedy jest to 25: 1, wydaje się, że mogę to nazwać nocą.

Czy jestem daleko? Czy mogę coś jeszcze zrobić, aby dowiedzieć się więcej? Obecnie czytam tę książkę: Wprowadzenie do statystyki bayesowskiej , WM Bolstad (Wiley-Interscience; 2nd ed., 2007).



Odpowiedzi:


10

Moc dotyczy prawdopodobieństwa długoterminowego p <0,05 (alfa) w przyszłych badaniach. W Bayes dowody z badania A zasilają priory do badania B itp. W dół linii. Dlatego władza zdefiniowana w statystyce częstokroć tak naprawdę nie istnieje.


12
Mniej ograniczony obraz władzy postrzega ją jako wyraz krzywej ryzyka dla funkcji strat 0-1. Analiza bayesowska integruje to ryzyko z poprzednim prawdopodobieństwem. Jednak dobre analizy bayesowskie uwzględniają wrażliwość ich wyników na wybór wcześniejszego rozkładu. Wydaje się, że umieszcza nas to z powrotem w dziedzinie analizy mocy. Chociaż może nie nosić tej nazwy i byłby obliczany inaczej, cel byłby taki sam: mianowicie określenie, jak duża próbka ma zostać uzyskana, aby mieć wystarczającą pewność spełnienia celów badania.
whuber

2
To bardzo dobra uwaga Whuber. Jednak nie jest to jedyny powód obliczeń mocy i wielu Bayesian twierdzi, że jest to niepotrzebne, ponieważ nie trzeba wcześniej określać N (błąd).
John

5
Jestem tym zaskoczony. Jak można ewentualnie przejść o projektowaniu eksperymentu, pozyskiwaniu środków i planuje go bez pewnego rodzaju pomysłu co powinno być? N.
whuber

2
Nie wpadłem na ten pomysł, istnieje wiele dokumentów, w których Bayesianie twierdzą, że możesz dodawać przedmioty, dopóki nie będziesz mieć wystarczających dowodów, aby podjąć decyzję, w przeciwieństwie do częstych testów, w których takie testy i procedury dodawania nie działają. Przypuszczam, że mógłbym znaleźć referencję. Przede wszystkim pojawia się to w propozycji analizy danych w badaniach klinicznych.
Jan

8
Oczywiste jest, że kiedy można postępować w tak sekwencyjny sposób, mogą istnieć doskonałe powody. Ale nawet to nie oznacza, że ​​oszacowanie jest „niepotrzebne”! Mogę nawet wierzyć w istnienie ludzi, którzy mogliby wysunąć taki argument, ale byłbym zmuszony myśleć o nich jako o innych światowych stworzeniach, które nie są zainteresowane faktycznymi eksperymentami ani gromadzeniem danych! N.
whuber

14

Testy hipotez można wykonywać za pomocą statystyk bayesowskich. Można na przykład stwierdzić, że efekt jest większy od zera, jeśli więcej niż 95% gęstości tylnej jest większe od zera. Lub alternatywnie, możesz zastosować jakąś formę binarnej decyzji opartej na czynnikach Bayesa.

Po ustanowieniu takiego systemu decyzyjnego możliwe jest oszacowanie mocy statystycznej przy założeniu danego procesu generowania danych i wielkości próby. Można to łatwo ocenić w danym kontekście za pomocą symulacji.

To powiedziawszy, podejście bayesowskie często koncentruje się bardziej na przedziale wiarygodności niż na oszacowaniu punktowym i stopniu przekonania niż na decyzji binarnej. Korzystając z tego bardziej ciągłego podejścia do wnioskowania, można zamiast tego ocenić inne efekty wnioskowania na podstawie projektu. W szczególności możesz oszacować oczekiwany rozmiar przedziału wiarygodności dla danego procesu generowania danych i wielkości próbki.


3

Ten problem prowadzi do wielu nieporozumień, ponieważ ludzie używają statystyk bayesowskich do zadawania częstych pytań. Na przykład ludzie chcą ustalić, czy wariant B jest lepszy niż wariant A. Mogą odpowiedzieć na to pytanie za pomocą statystyk bayesowskich, określając, czy 95% najwyższy przedział gęstości różnicy między tymi dwoma rozkładami bocznymi (BA) jest większy niż 0 czy a region o znaczeniu praktycznym około 0. Jeśli korzystasz ze statystyk bayesowskich, aby odpowiedzieć na często zadawane pytania, nadal możesz popełniać częste błędy: typ I (fałszywie pozytywne; opps - B wcale nie jest lepszy) i typ II (chybienie; nie zdaje sobie sprawy że B jest naprawdę lepszy).

Celem analizy mocy jest ograniczenie błędów typu II (np. Mają co najmniej 80% szans na znalezienie efektu, jeśli taki istnieje). Analiza mocy powinna być również wykorzystywana przy stosowaniu statystyk bayesowskich do zadawania częstych pytań, takich jak powyższe.

Jeśli nie użyjesz analizy mocy, a następnie wielokrotnie zerkniesz na swoje dane podczas ich gromadzenia, a następnie zatrzymasz się, gdy tylko zauważysz znaczącą różnicę, to popełnisz więcej błędów typu I (fałszywych alarmów), niż możesz się spodziewać - tak samo, jak gdybyś korzystał ze statystyk częstych.

sprawdzić:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

Warto zauważyć - Niektóre podejścia bayesowskie mogą zmniejszyć, ale nie wyeliminować, prawdopodobieństwo popełnienia błędu typu I (np. Odpowiedni uprzedni informacyjny).


0

Na przykład potrzeba analizy mocy w badaniu klinicznym polega na tym, aby móc obliczyć / oszacować, ilu uczestników rekrutuje się, aby mieć szansę na znalezienie efektu leczenia (o danym minimalnym rozmiarze), jeśli taki istnieje. Rekrutacja nieskończonej liczby pacjentów jest niewykonalna, po pierwsze z powodu ograniczeń czasowych, a po drugie z powodu ograniczeń kosztów.

Wyobraź sobie więc, że przyjmujemy bayesowskie podejście do wspomnianego badania klinicznego. Chociaż teoretycznie możliwe są płaskie przeory, wrażliwość na przeor jest i tak wskazana, ponieważ niestety dostępny jest więcej niż jeden przeor płaski (co dziwne, myślę teraz, ponieważ tak naprawdę powinien istnieć tylko jeden sposób wyrażenia całkowitej niepewności).

Wyobraźmy sobie zatem, że przeprowadzamy analizę wrażliwości (model, a nie tylko wcześniejszy, również byłby tutaj analizowany). Wymaga to symulacji z wiarygodnego modelu „prawdy”. W statystykach klasycznych / częstych jest czterech kandydatów na „prawdę”: H0, mu = 0; H1, mu! = 0, gdzie albo są obserwowane z błędem (jak w naszym świecie rzeczywistym) lub bez błędu (jak w nieobserwowalnym świecie rzeczywistym). W statystykach bayesowskich są tutaj dwaj kandydaci na „prawdę”: mu jest zmienną losową (jak w nieobserwowalnym świecie rzeczywistym); mu jest zmienną losową (jak w naszym obserwowalnym świecie rzeczywistym z punktu widzenia niepewnego człowieka).

Tak naprawdę zależy to od tego, kogo próbujesz przekonać A) na podstawie próby i B) na podstawie analizy wrażliwości. Jeśli to nie ta sama osoba, byłoby to dość dziwne.

W rzeczywistości chodzi o konsensus co do tego, co jest prawdą i co potwierdza namacalne dowody. Wspólna podstawa jest taka, że ​​rozkład prawdopodobieństwa podpisu jest możliwy do zaobserwowania w naszym prawdziwym obserwowalnym świecie, który w jakiś sposób ewidentnie ma jakąś ukrytą matematyczną prawdę, która przypadkiem dzieje się tak przez przypadek, albo przez zamierzenie. Zatrzymam się tam, ponieważ nie jest to strona sztuki, ale raczej strona nauki, albo takie jest moje rozumienie.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.