Wiele osób (spoza wyspecjalizowanych ekspertów), którzy uważają się za częstych, jest w rzeczywistości Bayesianami. To sprawia, że debata jest nieco bezcelowa. Myślę, że Bayesianizm wygrał, ale wciąż jest wielu Bayesian, którzy uważają się za częstych. Są ludzie, którzy myślą, że nie używają priorów i dlatego uważają, że są częstymi. To niebezpieczna logika. Nie chodzi tu tyle o priory (jednolite czy niejednolite), prawdziwa różnica jest bardziej subtelna.
(Formalnie nie pracuję w dziale statystycznym; moje wykształcenie to matematyka i informatyka. Piszę z powodu trudności, które próbowałem omówić z tą „debatą” z innymi nie-statystykami, a nawet z wczesną karierą statystyki).
MLE jest w rzeczywistości metodą bayesowską. Niektórzy powiedzą: „Jestem częstym, ponieważ używam MLE do oszacowania moich parametrów”. Widziałem to w recenzowanej literaturze. Jest to nonsens i opiera się na tym (niewypowiedzianym, ale dorozumianym) micie, że częstym jest ktoś, kto używa wcześniejszego munduru zamiast niejednolitego wcześniejszego.
Rozważ narysowanie pojedynczej liczby ze rozkładu normalnego ze znaną średnią i nieznaną wariancją. Nazwij tę wariancję .μ=0θ
X≡N(μ=0,σ2=θ)
Teraz rozważ funkcję prawdopodobieństwa. Ta funkcja ma dwa parametry, i i zwraca prawdopodobieństwo, biorąc pod uwagę , .xθθx
f(x,θ)=Pσ2=θ(X=x)=12πθ√e−x22θ
Możesz sobie wyobrazić wykreślanie tego na mapie cieplnej, z na osi x i na osi y, i używając koloru (lub osi z). Oto fabuła z liniami konturowymi i kolorami.xθ
Najpierw kilka uwag. Jeśli ustawisz jedną wartość , możesz wykonać odpowiedni poziomy przekrój przez mapę cieplną. Ten kawałek da ci pdf dla tej wartości . Oczywiście obszar pod krzywą w tym wycinku będzie wynosił 1. Z drugiej strony, jeśli ustawisz jedną wartość , a następnie spojrzysz na odpowiedni wycinek pionowy , to nie ma takiej gwarancji na temat obszaru pod krzywą .θθx
To rozróżnienie między poziomymi i pionowymi plasterkami jest kluczowe i stwierdziłem, że ta analogia pomogła mi zrozumieć częste podejście do uprzedzeń .
Bayesa jest ktoś, kto mówi
Dla tej wartości x, które wartości dają „wystarczająco wysoką” wartość ?θf(x,θ)
Alternatywnie, Bayesian może zawierać przeor, , ale wciąż o tym mówiąg(θ)
dla tej wartości x, które wartości dają wystarczająco wysoką wartość ?θf(x,θ)g(θ)
Tak więc Bayesian naprawia x i patrzy na odpowiedni pionowy wycinek na tym wykresie konturowym (lub na wykresie wariantowym zawierającym poprzednie). W tym wycinku obszar pod krzywą nie musi wynosić 1 (jak powiedziałem wcześniej). Bayesian 95% wiarygodny przedział (CI) to przedział zawierający 95% dostępnego obszaru. Na przykład, jeśli obszar wynosi 2, to obszar pod bayesowskim CI musi wynosić 1,9.
Z drugiej strony częsty zignoruje x i najpierw rozważy naprawienie i zapyta:θ
Z tego , których wartości x pojawią się najczęściej?θ
W tym przykładzie przy jedna odpowiedź na to często zadawane pytanie brzmi: „Dla danego 95% pojawi się między i . ”N(μ=0,σ2=θ)θx−3θ√+3θ√
Dlatego częsty jest bardziej zainteresowany poziomymi liniami odpowiadającymi stałym wartościom .θ
To nie jedyny sposób na konstruowanie częstych CI, nie jest to nawet dobry (wąski), ale wytrzymajcie przez chwilę.
Najlepszym sposobem interpretacji słowa „interwał” nie jest interwał na linii 1-d, ale myślenie o nim jako obszarze na powyższej płaszczyźnie 2-d. „Interwał” jest podzbiorem płaszczyzny 2-d, a nie żadnej linii 1-d. Jeśli ktoś zaproponuje taki „przedział”, wówczas musimy sprawdzić, czy „przedział” jest prawidłowy na poziomie ufności / wiarygodności 95%.
Częstochowiec sprawdzi poprawność tego „interwału”, analizując kolejno każdy wycinek poziomy i patrząc na obszar pod krzywą. Jak powiedziałem wcześniej, obszar pod tą krzywą zawsze będzie równy. Zasadniczym wymogiem jest, aby obszar w „przedziale” wynosił co najmniej 0,95.
Bayesian sprawdzi poprawność, patrząc na pionowe plastry. Ponownie obszar pod krzywą zostanie porównany z podobszarem znajdującym się poniżej przedziału. Jeśli ten ostatni stanowi co najmniej 95% tego pierwszego, wówczas „przedział” jest prawidłowym 95% Bayesowskim wiarygodnym przedziałem.
Teraz, gdy wiemy, jak sprawdzić, czy dany przedział jest „prawidłowy”, pytanie brzmi, jak wybrać najlepszą opcję spośród prawidłowych opcji. To może być czarna sztuka, ale generalnie potrzebujesz najwęższej przerwy. Oba podejścia zwykle się tutaj zgadzają - brane są pod uwagę pionowe wycinki, a celem jest, aby przedział był możliwie wąski w każdym wycinku pionowym.
W powyższym przykładzie nie próbowałem zdefiniować najwęższego możliwego przedziału ufności częstokroć. Zobacz w komentarzach @cardinal poniżej przykłady węższych odstępów czasu. Moim celem nie jest znalezienie najlepszych przedziałów, ale podkreślenie różnicy między wycinkami poziomymi i pionowymi przy określaniu ważności. Przedział, który spełnia warunki 95% częstości przedziału ufności zwykle nie spełnia warunków 95% bayesowskiego wiarygodnego przedziału i odwrotnie.
Oba podejścia wymagają wąskich przedziałów, tzn. Rozważając jeden pionowy wycinek, chcemy, aby przedział (1-d) w tym wycinku był możliwie wąski. Różnica polega na tym, w jaki sposób egzekwowane jest 95% - częsty patrzy tylko na proponowane przedziały, w których 95% powierzchni każdego wycinka poziomego znajduje się poniżej przedziału, podczas gdy Bayesian nalega, aby każdy wycinek pionowy był taki, aby 95% jego obszaru było w przedziale czasowym.
Wielu statystystów nie rozumie tego i koncentrują się tylko na pionowych segmentach; to czyni ich Bayesianami, nawet jeśli myślą inaczej.