Bardzo miłe pytanie! Rzeczywiście miałoby sens, że „dobry” wcześniejszy rozkład daje dodatnie prawdopodobieństwo lub dodatnią wartość gęstości dla „prawdziwego” parametru , ale z czysto decyzyjnego punktu widzenia nie musi tak być. Prosty przeciwny przykład do tej „intuicji”, że powinien być konieczny, gdy jest wcześniejszą gęstością, a jest „prawdziwą” wartością parametru, jest genialny wynik minimaksji Caselli i Strawdermana (1981): przy szacowaniu średniej normalnej na podstawie pojedynczej obserwacji z dodatkowym ograniczeniem, że ,θ0
π(θ0) > 0
π( ⋅ )θ0μx ∼ N( μ , 1 )| μ | <ρρjest na tyle mała, szczegółowo, minimaksowe odpowiada estymatora A (co najmniej korzystne) jednolity przed o , co oznacza, że daje równą wagę i ( i żadna inna wartość średniej )
Kiedy wzrasta, najmniej sprzyjający poprzedni, jego wsparcie rośnie, ale pozostaje skończonym zestawem możliwych wartości. Jednak późniejsze oczekiwanie, , może przyjąć dowolną wartość .
ρ ≤ 1,0567{ - ρ , ρ }π- ρρμπ( θ ) =12)δ- ρ( θ ) +12)δρ( θ )
ρE [μ | x]( - ρ , ρ )
Istotą dyskusji (patrz komentarze) może być to, że gdyby estymator Bayesa był ograniczony do punktu wsparcia
, jego właściwości byłyby zupełnie inne.π( ⋅ )
Podobnie, gdy rozważane są dopuszczalne estymatory, estymatory Bayesa powiązane z odpowiednim wcześniejszym na zwartym zbiorze są zwykle dopuszczalne, chociaż mają ograniczone wsparcie.
W obu przypadkach pojęcie częstokroć (minimaksymalność lub dopuszczalność) jest definiowane na podstawie możliwego zakresu parametrów, a nie na „prawdziwej” wartości parametru (co daje odpowiedź na pytanie 4). Na przykład, patrząc na ryzyko tylne
lub na ryzyko Bayesa
nie obejmuje prawdziwej wartości .
∫ΘL ( θ , δ) π( θ | x ) d θ
∫X∫ΘL ( θ , δ) π( θ ) f( x | θ ) d θ d x
θ0
Ponadto, jak wskazano w powyższym przykładzie, gdy estymator Bayesa jest zdefiniowany przez wyrażenie formalne, takie jak średnia tylna
dla straty kwadratowej (lub ), estymator może przyjmować wartości poza wsparciem w przypadkach, gdy wsparcie to nie jest wypukłe.
θ^π( x ) =∫Θθ π( θ | x ) d θ
L.2)π
Na marginesie, podczas czytania
aby prawda θ wygenerowała dane (tj. „istnieje”), θ musi być możliwą zmienną w ramach π, np. mieć niezerowe prawdopodobieństwo, niezerową gęstość
Uważam to za wprowadzenie w błąd co do znaczenia przeora. Wcześniejszy rozkład nie powinien oznaczać faktycznego mechanizmu fizycznego (lub rzeczywistego), który widział wartość parametru wygenerowaną z po której nastąpiła obserwacja wygenerowana z . Prior jest miarą odniesienia w przestrzeni parametrów, która zawiera wcześniejsze informacje i subiektywne przekonania na temat parametru i nie jest w żaden sposób wyjątkowa. Analiza bayesowska jest zawsze względna w stosunku do wcześniej wybranych do przeprowadzenia tej analizy bayesowskiej. Dlatego nie ma absolutnej konieczności, aby prawdziwy parametr należał do obsługi . Oczywiście, gdy to wsparcie jest kompaktowym połączonym zestawem,θ0πxfa( x |θ0)πZA, żadnej wartości parametru poza zestawem nie można konsekwentnie oszacować za pomocą średniej tylnej ale to nawet nie wyklucza dopuszczalności estymatora.ZAθ^π