Gdyby ktoś powiedział
„Ta metoda wykorzystuje MLE do oszacowania punktowego parametru, który maksymalizuje , dlatego jest częsty; a ponadto nie jest bayesowski.”
zgodziłbyś się?
- Aktualizacja w tle : Niedawno przeczytałem artykuł, który twierdzi, że jest częsty. Nie zgadzam się z ich twierdzeniem, w najlepszym razie uważam, że jest to niejednoznaczne. Artykuł nie wspomina wyraźnie ani o MLE (ani o MAP ). Po prostu dokonują oszacowania punktowego i po prostu postępują tak, jakby to oszacowanie punktowe było prawdziwe. Oni nieprzeprowadzić analizę rozkładu próbkowania tego estymatora lub coś podobnego; model jest dość złożony i dlatego taka analiza prawdopodobnie nie jest możliwa. W żadnym momencie nie używają też słowa „posterior”. Po prostu biorą ten szacunek punktu za wartość nominalną i przechodzą do głównego interesującego tematu - wnioskowania o brakujących danych. Nie sądzę, by w ich podejściu było coś, co sugerowałoby ich filozofię. Być może zamierzali być częstymi (ponieważ czują się zobowiązani do noszenia swojej filozofii na rękawie), ale ich rzeczywiste podejście jest dość proste / wygodne / leniwe / niejednoznaczne. Skłaniam się teraz do stwierdzenia, że badania tak naprawdę nie mają żadnej filozofii; zamiast tego myślę, że ich postawa była bardziej pragmatyczna lub wygodniejsza:
„Obserwowałem dane i chcę oszacować pewne brakujące dane, . Istnieje parametr który kontroluje związek między i . Tak naprawdę nie dbam o chyba że jako środek do celu Jeśli mam oszacowanie dla , łatwiej przewidzieć od . Wybiorę oszacowanie punktowe dla ponieważ jest to wygodne, w szczególności wybiorę która maksymalizuje . "oo θ oo x θ θ oo x θ θ P ( x | θ )
W metodach bayesowskich role danych i parametru są w pewnym sensie odwrócone. W szczególności uzależniamy teraz obserwowane dane i przechodzimy do wnioskowania na temat wartości parametru. To wymaga uprzedniego.
Jak dotąd tak dobrze, ale gdzie mieści się w tym MLE (oszacowanie maksymalnego prawdopodobieństwa)? Mam wrażenie, że wiele osób uważa, że jest to Frequentist (a dokładniej, że nie jest to Bayesian). Ale czuję, że jest to Bayesian, ponieważ polega na pobraniu zaobserwowanych danych, a następnie znalezieniu parametru maksymalizującego . MLE domyślnie używa jednolitego uprzedniego warunku danych i maksymalizuje . Czy można uczciwie powiedzieć, że MLE wygląda zarówno na częstego, jak i bayesowskiego? Czy też każde proste narzędzie musi należeć dokładnie do jednej z tych dwóch kategorii?P ( p a r a m e t e r | d a t a )
MLE jest spójny, ale uważam, że spójność można przedstawić jako ideę bayesowską. Biorąc pod uwagę arbitralnie duże próbki, oszacowanie jest zbieżne z poprawną odpowiedzią. Stwierdzenie „oszacowanie będzie równe wartości rzeczywistej” obowiązuje dla wszystkich wartości parametru. Interesujące jest to, że to stwierdzenie jest prawdziwe, jeśli warunkujesz obserwowane dane, co czyni je Bayesowskim. To ciekawe, oprócz MLE, ale nie bezstronnego estymatora.
Właśnie dlatego uważam, że MLE jest „najbardziej bayesowską” metodą, którą można by określić jako częsty.
W każdym razie większość właściwości Frequentist (takich jak obiektywizm) ma zastosowanie we wszystkich przypadkach, w tym skończonych wielkościach próbek. Fakt, że spójność zachodzi tylko w niemożliwym scenariuszu (nieskończona próbka w ramach jednego eksperymentu) sugeruje, że spójność nie jest tak przydatną własnością.
Biorąc pod uwagę realistyczną (tj. Skończoną) próbkę, czy istnieje właściwość Frequentist, która odnosi się do MLE? Jeśli nie, MLE nie jest tak naprawdę częsty.