Obiektywne a subiektywne paradygmaty bayesowskie

Jaka jest różnica między obiektywnymi a subiektywnymi paradygmatami bayesowskimi?
Jakie obiekty lub procedury definiują lub interpretują inaczej?
Czy jest jakaś różnica w wyborze metod?

bayesian methodology

— Richard Hardy
źródło

+1 Moje wrażenie - które nie jest tak naprawdę autorytatywne - polega na tym, że bycie „obiektywnym” Bayesianem ma tendencję do korelowania z automatycznymi przepisami na znajdowanie priorów takich jak Jeffreys wcześniej, podczas gdy „subiektywni” pozwalają swoim prywatnym przekonaniom decydować o wyborze przeora. Być może tak też jest - ale jeszcze mniej jestem tego pewien - w przypadku poprzedniej grupy jest bardziej prawdopodobne, że zobaczy się dyskusję na temat parametru „prawdziwego” i tego, czy jakiś estymator jest mu „bliski”.

— Christoph Hanck

@ChristophHanck, dziękuję za Twój wkład. Mam nadzieję, że ktoś kompetentny może przygotować dobre podsumowanie / przegląd i opublikować je jako odpowiedź, a następnie zobaczymy, jak pasują twoje punkty.

— Richard Hardy,

Jestem również trochę zdezorientowany, czy tutaj cel odnosi się do empirycznego (uczenie się wcześniej z danych takich jak ARD / SBL), czy obiektywny w tym sensie, że daje identyczne wyniki dla częstych wyników.

— boomkin

@boomkin, AFAIK istnieją szkoły myślenia, które identyfikują się z „subiektywnymi Bayesianami” i „obiektywnymi Bayesianami”. Chciałbym poznać ich główne pomysły i różnice między tym pierwszym a drugim. Uczenie się wcześniej na podstawie danych jest cechą, którą mogą traktować inaczej.

— Richard Hardy

+1, ale uważam, że lepiej nie używać terminu „Bayesian” jako nominalnego przymiotnika. Przymiotnik „Bayesian” klasyfikuje metody, a nie ludzi. Umieszczenie statystyków w fałszywej dychotomii „tak, jakby ktoś przestrzegał tylko jednej i tylko jednej szkoły myślenia spośród kilku szkół myślenia” może powodować trudności w udzieleniu odpowiedzi na pytanie. Może to być podchwytliwe pytanie, na które nie można odpowiedzieć, ponieważ jest „błędnie” stwierdzone w pierwszej kolejności (przy użyciu niewłaściwej przesłanki o istnieniu Bayesianów).

— Sextus Empiricus

Jest to bardzo mylący temat, głównie ze względu na to, że istnieją dwa różne sposoby, w których pojęcie „subiektywizm” jest powszechnie stosowane w tych dyskusjach. $^\dagger$ Tym bardziej pogmatwany jest fakt, że istnieje klasa „subiektywizmu”, która jest zakorzeniona w uprzedniej próbie ekspertów, i ta szczególna odmiana musi być starannie wpisana w filozoficzną kategoryzację paradygmatów. Spróbuję wyjaśnić tę kwestię, wskazując różne sposoby interpretacji „subiektywizmu”, a następnie określając szerokie obszary porozumienia między Bayesianami oraz obszary, w których występują rozbieżności w podejściach filozoficznych i praktycznych. Oczekuję, że będą inni, którzy nie zgodzą się z moimi własnymi opiniami na ten temat, ale mam nadzieję, że to dobry punkt wyjścia do jasnej dyskusji.

Słaby subiektywizm: w tej interpretacji termin „subiektywny” jest używany w jego słabszym znaczeniu, co oznacza jedynie, że prawdopodobieństwo obejmuje racjonalne przekonania podmiotu. (Niektóre osoby, takie jak ja, wolą używać terminu „epistemiczny” dla tej koncepcji, ponieważ w rzeczywistości nie wymaga ona subiektywności w silniejszym znaczeniu).

Silny subiektywizm: W tej interpretacji termin „subiektywny” jest używany w jego silniejszym znaczeniu, co oznacza, że słaby subiektywizm ma, a ponadto przekonanie podmiotu nie ma żadnego zewnętrznego „obiektywnego” uzasadnienia (tj. Dwa lub więcej różnych podmiotów może mieć różne przekonania i żadne nie byłoby uważane za mniej lub bardziej błędne niż inne).

W analizie bayesowskiej na ogół jest tak, że wybrany rozkład próbkowania ma obiektywne uzasadnienie zakorzenione w pewnym zrozumieniu mechanizmu próbkowania. Rzadko jednak dostępne są informacje dotyczące parametru inne niż w przykładowych danych. Daje to początek trzem szerokim paradygmatom w statystyce bayesowskiej, które odpowiadają różnym sposobom ustalania wcześniejszego rozkładu.

Subiektywny paradygmat bayesowski: ten paradygmat zgadza się ze słabym subiektywizmem i dalej utrzymuje, że każdy zestaw przekonań probabilistycznych jest równie ważny. Tak długo, jak badani używają aktualizacji bayesowskiej dla nowych danych, uzasadnione jest użycie dowolnego wcześniejszego. Zgodnie z tym paradygmatem przeor nie wymaga żadnego obiektywnego uzasadnienia. W tym paradygmacie skupiono się na ujawnieniu wcześniej używanego, a następnie pokazaniu, jak to się aktualizuje o nowe dane. Często stosuje się w tej metodzie analizę wrażliwości pokazującą przekonania tylne w ramach szeregu wcześniejszych przekonań.

Obiektywny paradygmat bayesowski:Ten paradygmat zgadza się również ze słabym subiektywizmem, ale woli dodatkowo ograniczyć wcześniejsze przekonania (przed włączeniem jakichkolwiek danych), aby były obiektywnie „nieinformacyjne” na temat parametru. W tym paradygmacie przeor powinien dokładnie odzwierciedlać brak dostępnych informacji dotyczących parametru poza danymi. Zazwyczaj wiąże się to z przyjęciem jakiejś teorii dotyczącej sposobu ustalania wcześniejszego (np. Odniesienia priory Jeffreya, Jaynesa, Bernardo itp.). Ten paradygmat utrzymuje, że preferowany jest zestaw przekonań probabilistycznych, jeśli opiera się na wcześniejszym przekonaniu, które jest obiektywnie zdeterminowany i nieinformacyjny o parametrach w problemie zainteresowania. Zgadza się, że każdy zestaw przekonań probabilistycznych jest zgodny z kryteriami racjonalności leżącymi u podstaw analizy bayesowskiej, ale uważa przekonania oparte na „złych” priorytetach (zbyt informujących o nieznanym parametrze) jako gorsze niż przekonania oparte na „dobrych” priorytetach. W tym paradygmacie przeor wybierany jest z jakiejś nieinformacyjnej klasy, a następnie aktualizowany o nowe dane, aby uzyskać obiektywną odpowiedź na problem.

Bayernowski paradygmat eksperta:Ta metoda jest często postrzegana jako część subiektywnego paradygmatu i zwykle nie jest identyfikowana osobno, ale uważam ją za osobny paradygmat, ponieważ zawiera elementy każdego widoku. Ten paradygmat zgadza się ze słabym subiektywizmem, ale podobnie jak obiektywny paradygmat bayesowski, nie uważa on wszystkich priorów za równie ważne. Ten paradygmat traktuje obecnych „priorów” jako potomków z poprzednich doświadczeń życiowych i dlatego uważa wcześniejsze przekonania ekspertów merytorycznych za lepsze od wcześniejszych przekonań nie-ekspertów. Uznaje również, że te przekonania są prawdopodobnie oparte na danych, które nie były systematycznie rejestrowane, i nie są oparte na systematycznym stosowaniu teorii prawdopodobieństwa, więc nie jest możliwe rozłożenie tych istniejących priorytetów ekspertów na oryginalne nieinformacyjne uprzednie i dane które zaobserwował ten ekspert. (I rzeczywiście przy braku systematycznego stosowania teorii prawdopodobieństwa obecny ekspert „uprzedni” prawdopodobnie nie jest nawet zgodny z aktualizacją bayesowską.) W tym paradygmacie obecną „subiektywną” opinię eksperta traktuje się jako cenną enkapsulację wiedzy przedmiotowej, która jest traktowany jako prymitywny przeor. W tym paradygmacie analityk stara się uzyskać eksperta wcześniej poprzez pewne testy wcześniejszego przekonania, a następnie uprzedni jest formułowany jako najlepiej dopasowany do tego eksperckiego przekonania (dbając o to, aby przekonanie eksperta nie zostało zanieczyszczone przez wiedzę o teraźniejszości dane). „Subiektywne” przekonanie eksperta jest zatem traktowane jako „obiektywne” podsumowanie wiedzy merytorycznej z poprzednich danych. ) W tym paradygmacie obecną „subiektywną” opinię eksperta traktuje się jako cenną enkapsulację wiedzy merytorycznej, którą traktuje się jako prymitywny uprzedzenie. W tym paradygmacie analityk stara się uzyskać eksperta wcześniej poprzez pewne testy wcześniejszego przekonania, a następnie uprzedni jest formułowany jako najlepiej dopasowany do tego eksperckiego przekonania (dbając o to, aby przekonanie eksperta nie zostało zanieczyszczone przez wiedzę o teraźniejszości dane). „Subiektywne” przekonanie eksperta jest zatem traktowane jako „obiektywne” podsumowanie wiedzy merytorycznej z poprzednich danych. ) W tym paradygmacie obecną „subiektywną” opinię eksperta traktuje się jako cenną enkapsulację wiedzy merytorycznej, którą traktuje się jako prymitywny uprzedzenie. W tym paradygmacie analityk stara się uzyskać eksperta wcześniej poprzez pewne testy wcześniejszego przekonania, a następnie uprzedni jest formułowany jako najlepiej dopasowany do tego eksperckiego przekonania (dbając o to, aby przekonanie eksperta nie zostało zanieczyszczone przez wiedzę o teraźniejszości dane). „Subiektywne” przekonanie eksperta jest zatem traktowane jako „obiektywne” podsumowanie wiedzy merytorycznej z poprzednich danych. a następnie przeor jest formułowany jako najlepiej dopasowany do tego przekonania ekspertów (dbając o to, aby przekonanie eksperta nie zostało zanieczyszczone przez wiedzę o obecnych danych). „Subiektywne” przekonanie eksperta jest zatem traktowane jako „obiektywne” podsumowanie wiedzy merytorycznej z poprzednich danych. a następnie przeor jest formułowany jako najlepiej dopasowany do tego przekonania ekspertów (dbając o to, aby przekonanie eksperta nie zostało zanieczyszczone przez wiedzę o obecnych danych). „Subiektywne” przekonanie eksperta jest zatem traktowane jako „obiektywne” podsumowanie wiedzy merytorycznej z poprzednich danych.

Różnice w metodzie: Pod względem metody obiektywny paradygmat bayesowski różni się od paradygmatu subiektywnego, ponieważ pierwszy z nich ogranicza dopuszczalne priorytety (albo do unikalnego wcześniejszego lub bardzo małej klasy podobnych priorytetów), podczas gdy drugi nie ogranicza dopuszczalnego priorytetu priors. W obiektywnym podejściu bayesowskim przeor jest ograniczony przez teorie reprezentowania przeoratu „nieinformacyjnego”. Paradygmat uprzednich ekspertów przyjmuje inne podejście i zamiast tego identyfikuje jedną lub więcej osób, które są ekspertami, i wywołuje ich wcześniejsze przekonania.

Kiedy zrozumiemy różne poczucie różnych paradygmatów w statystyce bayesowskiej, możemy określić pewne obszary szerokiego porozumienia i obszary, w których istnieje spór. W rzeczywistości, pomimo różnic w metodach, istnieje większa zgodność co do podstawowych teorii, niż jest to zwykle korygowane.

Szerokie porozumienie w sprawie słabego subiektywizmu: Istnieje duża literatura w statystykach bayesowskich wykazująca, że „aksjomaty” prawdopodobieństwa można wyprowadzić ze wstępnych dezyderat dotyczących racjonalnego podejmowania decyzji. Obejmuje to argumenty dotyczące dynamicznej spójności przekonań (patrz np. Epstein i Le Breton 1993 ), argumenty odwołujące się do holenderskiego twierdzenia książkowego (patrz np. Lehmann 1955 , Hajek 2009). Bayesianie wszystkich tych paradygmatów zasadniczo zgadzają się, że prawdopodobieństwo należy interpretować epistemicznie, jako odnoszące się do przekonań podmiotu, ograniczonych ograniczeniami racjonalności związanymi z aksjomatami prawdopodobieństwa. Zgadzamy się, że należy stosować reguły prawdopodobieństwa, aby ograniczyć przekonania o racjonalności niepewności. To implikuje, że przekonania o niepewności wymagają aktualizacji bayesowskiej w obliczu nowych danych, ale nie nakłada żadnych dalszych ograniczeń (tj. Bez więcej nie oznacza, że jakikolwiek uprzedni jest lepszy niż jakikolwiek inny wcześniejszy). Wszystkie trzy powyższe paradygmaty się z tym zgadzają.

Istnieje zgoda, że potomni mają tendencję do zbieżności z większą liczbą danych: Istnieje wiele twierdzeń dotyczących spójności w statystykach bayesowskich, które pokazują, że jeśli masz dwie osoby z tą samą funkcją prawdopodobieństwa, ale różnymi priory, to ich późniejsze przekonania zbiegną się, gdy otrzymasz więcej i więcej danych. Oznacza to, że przy dużej ilości danych przeor nie ma większego znaczenia. Są to niezaprzeczalne twierdzenia o prawdopodobieństwie i wszystkie trzy powyższe paradygmaty się z tym zgadzają. Z tego powodu powszechnie uznaje się, że przy dużej ilości danych dowolny z trzech paradygmatów może dać podobne wyniki. W związku z tym różnice w paradygmatach są najważniejsze, gdy mamy tylko niewielką ilość danych. $^{\dagger \dagger}$

Panuje powszechna zgoda, że istnieją z grubsza „obiektywne” zasady dotyczące priorów, które są dostępne, jeśli chcesz z nich skorzystać :W statystykach bayesowskich istnieje obszerna literatura pokazująca, w jaki sposób można opracować „nieinformacyjne” priory, które są z grubsza zdeterminowane przez problem próbkowania i z grubsza obejmują brak dużej wiedzy na temat danego parametru. Mówię „z grubsza”, ponieważ istnieje tutaj kilka konkurujących ze sobą teorii, które czasem się zgadzają, ale czasem nieznacznie się różnią (np. Jeffrey, Jaynes, priory referencyjne, klasy niedokładnych priory Walleya itp.), A także mogą wystąpić pewne trudne paradoksy. Najtrudniejszą kwestią jest tutaj to, że trudno jest zrobić „nieinformacyjny” uprzedni parametr ciągły, który można poddać transformacjom nieliniowym (ponieważ „nieinformacyjność” idealnie powinna być niezmienna dla transformacji). Ponownie są to twierdzenia o prawdopodobieństwie i wszystkie paradygmaty są zgodne z ich treścią. Obiektywni Bayesianie postrzegają tę teorię jako wystarczająco dobrą, aby dawali pierwszeństwo przełożonym, podczas gdy subiektywni Bayesianie i eksperci Bayesińscy mają tendencję do postrzegania teorii jako niewystarczającej do ustalenia wyższości tych priorytetów. Innymi słowy, istnieje powszechna zgoda co do tego, że te obiektywne reguły istnieją i mogą być stosowane, ale nie ma zgody co do ich dobrego charakteru.

Istnieje spór co do ważności posiadania jednej odpowiedzi: obiektywni Bayesianie są motywowani preferencją, że problem statystyczny ze stałymi danymi i ustaloną funkcją prawdopodobieństwa powinien prowadzić do wyjątkowo określonego przekonania z tyłu (lub przynajmniej niewielkiej liczby dopuszczalnych przekonań z tyłu) które różnią się bardzo niewiele). Ta preferencja jest na ogół częścią szerszej preferencji posiadania procedur naukowych, które dają unikalną odpowiedź w przypadku zastosowania do ustalonych zestawów obiektywnych warunków. Przeciwnie, zarówno subiektywni Bayesianie, jak i eksperci Bayesi, którzy są ekspertami, uważają, że nie jest to szczególnie ważne, i ogólnie uważają, że to skupienie się na wyjątkowo zdeterminowanym a posteriori jest w rzeczywistości mylące.

Istnieje powszechna zgoda, że opinia publiczna nie są dobrze zaznajomieni z Bayesa posteriors: Wszystkie paradygmaty są zgodni, że opinia publiczna nie są dobrze zaznajomieni z podstawowymi mechaniki jak analiza Bayesa przejścia z poprzedniego do tylnej. Obiektywni Bayesianie czasami martwią się, że udzielenie więcej niż jednej dopuszczalnej odpowiedzi dla a posteriori będzie dla ludzi mylące. Subiektywni Bayesianie martwią się, że nieudzielenie więcej niż jednej dopuszczalnej odpowiedzi dla a posteriori jest mylące dla ludzi.

$^\dagger$ Warto zauważyć, że zamieszanie wokół „subiektywizmu” wynika tutaj ze szczególnego przypadku ogólnej fałszywej dychotomii w epistemologii między „subiektywizmem” i „ intrinsyzmem ” (patrz np. Piekoff ). Próbując zinterpretować prawdopodobieństwo, wielu użytkowników popełniło błąd, uważając, że każde odrzucenie aleatoryjnych teorii prawdopodobieństwa koniecznie prowadzi do interpretacji, które są „subiektywne” w silniejszym znaczeniu określonym tutaj. Aby poprawnie zrozumieć interpretacje prawdopodobieństwa, dobrym pomysłem jest zrozumienie ogólnych problemów związanych z dychotomią subiektywizm-intrinsizm, a zatem uznanie, że istnieją obiektywne interpretacje epistemiczne.

$^{\dagger \dagger}$ Dla tego wyniku wymagane są pewne ogólne warunki prawidłowości (np. oba podmioty mają uprzednie wsparcie, w tym prawdziwą wartość parametru), ale ma on bardzo szeroki zakres.

— Ben - Przywróć Monikę
źródło

Dziękuję za tak obszerną i wymowną odpowiedź! Wygląda więc na to, że priory są głównymi źródłami niezgody. Czy to to? Czy istnieją jakieś różnice zdań / różnice w, powiedzmy, definicji / interpretacji prawdopodobieństwa? Lub co to znaczy, że parametr jest zmienną losową? Zapomniałem dołączyć to do OP, ale czy mógłbyś podać kilka nazwisk, które można mniej lub bardziej wyraźnie przypisać do danego paradygmatu? Wiem, że nie wszyscy statystycy mogą być umieszczeni w tym czy innym pudełku, ale w każdym obozie muszą być założyciele lub obecni oddani zwolennicy.

— Richard Hardy,

Podstawą nieporozumień jest zdecydowanie celowość / niepożądanie obiektywnych wniosków (tj. Unikatowe lub zbliżone do unikatowych) oraz zakres tego, co stanowi „dobry” uprzedni. Nie sądzę, aby była to szersza różnica zdań co do interpretacji prawdopodobieństwa lub znaczenia zmiennej losowej. W moim rozumieniu prawie wszyscy Bayesianie zgadzają się co do interpretacji epistemicznej. Ponieważ większość podstaw paradygmatów jest ustalona w twierdzeniach, w których nie ma miejsca na spory co do ważności, jedyne nieporozumienia dotyczą wartości i celowości różnych metod.

— Ben - Przywróć Monikę

Przegląd wszystkiego znajduje się w „Biblii” (Bernardo i Smith 2001, Bayesian Theory). Subiektywny paradygmat bayesowski - patrz np. Savage, Lindley, Goldstein. Obiektywny paradygmat bayesowski - patrz np. Bernardo, Berger, Jaynes, Jeffreys. Paradygmat opinii eksperckiej - eklektyczna mieszanka autorów, ale może patrz np. Choi, Sun. Warto także przeczytać Walleya o nieprecyzyjnej analizie bayesowskiej, która wykorzystuje ustalone klasy priorytetów i skutecznie zalicza się do kategorii celów.

— Ben - Przywróć Monikę

Dziękuję Ci bardzo! Mam szczęście, że załatwiłem ci sprawę.

— Richard Hardy,

+1 Ładna odpowiedź. Jedną z rzeczy, której wydaje się brakować, jest wzmianka o metodach „empirycznych Bayesa”, w których uprzednie szacuje się na podstawie danych. Uważam, że powinna to być osobna kategoria wraz z subiektywnymi priorytetami, obiektywnymi (czyli nieinformacyjnymi) priorytetami i ekspertami.

— ameba mówi Przywróć Monikę