Pytania otagowane jako prior

W statystyce bayesowskiej wcześniejszy rozkład formalizuje informacje lub wiedzę (często subiektywną), dostępną przed obejrzeniem próbki, w postaci rozkładu prawdopodobieństwa. Rozkład z dużym rozkładem jest stosowany, gdy niewiele wiadomo na temat parametru (ów), podczas gdy wąski wcześniejszy rozkład reprezentuje większy stopień informacji.


3
W jaki sposób niewłaściwe uprzednie postępowanie może prowadzić do prawidłowej dystrybucji tylnej?
Wiemy, że w przypadku właściwej wcześniejszej dystrybucji P(θ∣X)=P(X∣θ)P(θ)P(X)P.(θ∣X)=P.(X∣θ)P.(θ)P.(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} ∝P(X∣θ)P(θ)∝P.(X∣θ)P.(θ) \propto P(X \mid \theta)P(\theta) . Zwykle uzasadnieniem tego kroku jest to, że rozkład krańcowy , jest stały w odniesieniu do a zatem można go zignorować przy wyprowadzaniu rozkładu tylnego.P ( X ) θXXXP(X)P.(X)P(X)θθ\theta Jednak w …



2
Naturalna interpretacja hiperparametrów LDA
Czy ktoś może wyjaśnić, jaka jest naturalna interpretacja hiperparametrów LDA? ALPHAi BETAsą parametrami dystrybucji Dirichleta odpowiednio dla (na dokument) tematu i (na temat) dystrybucji słów. Jednak czy ktoś może wyjaśnić, co to znaczy wybrać większe wartości tych hiperparametrów w porównaniu do mniejszych wartości? Czy to oznacza umieszczanie jakichkolwiek wcześniejszych przekonań …

2
Dlaczego wartość
tło Jednym z najczęściej używanych słabych wcześniejszych wariantów jest odwrotna gamma o parametrach (Gelman 2006) .α = 0,001 , β= 0,001α=0,001,β=0,001\alpha =0.001, \beta=0.001 Jednak rozkład ten ma 90% CI około .[ 3 × 1019, ∞ ][3)×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001)) [1] 3.362941e+19 Inf Na tej podstawie interpretuję, …



4
W jaki sposób ramy bayesowskie są lepsze w interpretacji, gdy zwykle używamy nieinformacyjnych lub subiektywnych priorów?
Często argumentuje się, że szkielet bayesowski ma dużą przewagę interpretacyjną (nad częstokroć), ponieważ oblicza prawdopodobieństwo parametru na podstawie danych - zamiast jak w ramy dla częstych. Jak na razie dobrze.p ( x | θ )p ( θ | x )p(θ|x)p(\theta|x)p ( x | θ )p(x|θ)p(x|\theta) Ale całe równanie opiera się …

1
Czy istnieje bayesowska interpretacja regresji liniowej z równoczesną regularyzacją L1 i L2 (inaczej elastyczna siatka)?
Powszechnie wiadomo, że regresja liniowa z karą jest równoważna znalezieniu oszacowania MAP przy danym przed Gaussa współczynników. Podobnie użycie kary jest równoważne z użyciem rozkładu Laplace'a jako wcześniejszego.l2l2l^2l1l1l^1 Często zdarza się, że używa się ważonej kombinacji regularyzacji i . Czy możemy powiedzieć, że jest to równoważne wcześniejszemu rozkładowi współczynników (intuicyjnie …

2
Jaki jest związek między Jeffreys Priors a transformacją stabilizującą wariancję?
Czytałem o przeorze Jeffreysa na wikipedii: Jeffreys Prior i zobaczyłem, że po każdym przykładzie opisuje, jak transformacja stabilizująca wariancję zamienia Jeffreysa przed mundurem. Jako przykład w przypadku Bernoulliego stwierdza się, że dla monety, która jest główką z prawdopodobieństwem γ∈[0,1]γ∈[0,1]\gamma \in [0,1] , model próbny Bernoulliego daje, że Jeffreys przed parametrem …


2
Częstotliwość i priory
Robby McKilliam mówi w komentarzu do tego postu: Należy zauważyć, że z punktu widzenia częstych nie ma powodu, dla którego nie można włączyć wcześniejszej wiedzy do modelu. W tym sensie widok częstych jest prostszy, masz tylko model i niektóre dane. Nie ma potrzeby oddzielania wcześniejszych informacji od modelu Również tutaj …

1
Wybieranie między nieinformacyjnymi wersjami beta
Szukam nieinformacyjnych priorytetów dla dystrybucji beta do pracy z procesem dwumianowym (Hit / Miss). Na początku myślałem o użyciu α=1,β=1α=1,β=1\alpha=1, \beta=1 które generują jednolity plik PDF, lub Jeffrey przed α=0.5,β=0.5α=0.5,β=0.5\alpha=0.5, \beta=0.5 . Ale tak naprawdę szukam priorów, które mają minimalny wpływ na późniejsze wyniki, a potem pomyślałem o użyciu niewłaściwego …

3
Jak wybrać wcześniej w estymacji parametrów bayesowskich
Znam 3 metody szacowania parametrów, ML, MAP i podejście Bayesa. A jeśli chodzi o MAP i podejście Bayesa, musimy wybrać priory dla parametrów, prawda? Powiedzmy, że mam ten model , w którym α , β są parametrami, aby dokonać oszacowania za pomocą MAP lub Bayesa, przeczytałem w książce, że lepiej …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.