Pytania otagowane jako hierarchical-bayesian

Hierarchiczne modele bayesowskie określają priorytety parametrów i hipersprośty parametrów wcześniejszych rozkładów


2
Jaka jest różnica między „głębokim uczeniem się” a modelowaniem wielopoziomowym / hierarchicznym?
Czy „głębokie uczenie się” to kolejny termin na modelowanie wielopoziomowe / hierarchiczne? Jestem znacznie bardziej zaznajomiony z tym drugim niż ten pierwszy, ale z tego, co mogę powiedzieć, podstawowa różnica nie polega na ich definicji, ale na tym, jak są one używane i oceniane w ich domenie aplikacji. Wygląda na …

5
Jak radzić sobie z hierarchicznymi / zagnieżdżonymi danymi w uczeniu maszynowym
Wyjaśnię mój problem na przykładzie. Załóżmy, że chcesz przewidzieć dochód danej osoby na podstawie niektórych atrybutów: {Wiek, płeć, kraj, region, miasto}. Masz taki zestaw danych szkoleniowych train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 


1
Dlaczego w 8 szkolnym przykładzie Gelmana znany jest błąd standardowy szacunku indywidualnego?
Kontekst: W 8-szkolnym przykładzie Gelmana (analiza danych bayesowskich, wydanie 3, rozdz. 5.5) istnieje osiem równoległych eksperymentów w 8 szkołach testujących efekt coachingu. Każdy eksperyment daje oszacowanie skuteczności coachingu i związanego z nim błędu standardowego. Następnie autorzy budują model hierarchiczny dla 8 punktów danych efektu coachingu w następujący sposób: yi∼N(θi,sei)θi∼N(μ,τ)yi∼N(θi,sei)θi∼N(μ,τ) y_i …

2
Bayesowskie oszacowanie
To pytanie jest techniczną kontynuacją tego pytania . Mam problem ze zrozumieniem i replikacją modelu przedstawionego w Raftery (1988): Wnioskowanie o dwumianowym parametrze : hierarchiczne podejście BayesaNN.N w WinBUGS / OpenBUGS / JAGS. Nie chodzi tylko o kod, więc powinien być tutaj na temat. tło Niech będzie zbiorem liczb sukcesów …

2
Jakie wcześniejsze rozkłady mogłyby / powinny być zastosowane dla wariancji w hierarchicznym modelu bayezjańskim, gdy interesująca jest średnia wariancja?
W szeroko cytowanym artykule Wcześniejsze rozkłady parametrów wariancji w modelach hierarchicznych (916 cytowanie do tej pory na Google Scholar) Gelman sugeruje, że dobre wcześniejsze nieinformacyjne wcześniejsze rozkłady dla wariancji w hierarchicznym modelu bayesowskim to rozkład równomierny i rozkład połowy t. Jeśli dobrze rozumiem, działa to dobrze, gdy parametr lokalizacji (np. …

1
Dlaczego dodanie efektu opóźnienia oznacza dewiację w bayesowskim modelu hierarchicznym?
Tło: Obecnie pracuję nad porównaniem różnych bayesowskich modeli hierarchicznych. Dane są liczbowymi miarami dobrostanu uczestnika i oraz czasu j . Mam około 1000 uczestników i 5 do 10 obserwacji na uczestnika.yI jyjajoty_{ij}jajaijotjotj Podobnie jak w przypadku większości podłużnych zestawów danych, spodziewam się, że zobaczę jakąś formę autokorelacji, w której obserwacje, …

1
Dlaczego redundantna średnia parametryzacja przyspiesza Gibbs MCMC?
W książce Gelman & Hill (2007) (Analiza danych przy użyciu regresji i modeli wielopoziomowych / hierarchicznych) autorzy twierdzą, że uwzględnienie redundantnych parametrów średnich może przyspieszyć MCMC. Podany przykład jest nie zagnieżdżonym modelem „symulatora lotu” (równanie 13.9): yiγjδk∼N(μ+γj[i]+δk[i],σ2y)∼N(0,σ2γ)∼N(0,σ2δ)yi∼N(μ+γj[i]+δk[i],σy2)γj∼N(0,σγ2)δk∼N(0,σδ2) \begin{align} y_i &\sim N(\mu + \gamma_{j[i]} + \delta_{k[i]}, \sigma^2_y) \\ \gamma_j &\sim N(0, …

2
Jakie są parametry tylnej części Wishart-Wishart?
Podczas wnioskowania o macierzy dokładności ΛΛ\boldsymbol{\Lambda} rozkładu normalnego używanego do generowania NNN wektorów D-wymiarowych x1,..,xNx1,..,xN\mathbf{x_1},..,\mathbf{x_N} xi∼N(μ,Λ−1)xi∼N(μ,Λ−1)\begin{align} \mathbf{x_i} &\sim \mathcal{N}(\boldsymbol{\mu, \Lambda^{-1}}) \\ \end{align} zwykle umieszczamy Wishart przed ΛΛ\boldsymbol{\Lambda} ponieważ rozkład Wishart jest koniugatem przed wykluczenie wielowymiarowego rozkładu normalnego ze znaną średnią i nieznaną wariancją: Λ∼W(υ,Λ0)Λ∼W(υ,Λ0)\begin{align} \mathbf{\Lambda} &\sim \mathcal{W}(\upsilon, \boldsymbol{\Lambda_0}) \\ \end{align} …

1
Dokładny test Fishera i rozkład hipergeometryczny
Chciałem lepiej zrozumieć dokładny test Fishera, więc wymyśliłem następujący przykład zabawki, w którym f i m odpowiada płci męskiej i żeńskiej, a n i y odpowiada takiemu „zużyciu sody”: > soda_gender f m n 0 5 y 5 0 Oczywiście jest to drastyczne uproszczenie, ale nie chciałem, aby kontekst przeszkadzał. …

1
Dlaczego LKJcorr jest dobrym rozwiązaniem dla macierzy korelacji?
Czytam rozdział 13 „Przygody w kowariancji” w ( znakomitej ) książce „ Rethinking statystyczny” Richarda McElreath, w której przedstawia on następujący model hierarchiczny: ( Rjest macierzą korelacji) Autor wyjaśnia, że LKJcorrjest to słabo pouczający uprzedni, który działa jako uprzedni regularyzujący dla matrycy korelacji. Ale dlaczego tak jest? Jakie cechy LKJcorrrozkładu …

5
Co dokładnie oznacza pożyczanie informacji?
Często ludzie mówią o pożyczaniu lub udostępnianiu informacji w bayesowskich modelach hierarchicznych. Nie mogę uzyskać prostej odpowiedzi na temat tego, co to właściwie oznacza i czy jest to unikalne dla bayesowskich modeli hierarchicznych. W pewnym sensie mam pomysł: niektóre poziomy w twojej hierarchii mają wspólny parametr. Nie mam jednak pojęcia, …

2
Dlaczego Ograniczone maksymalne prawdopodobieństwo daje lepsze (obiektywne) oszacowanie wariancji?
Czytam artykuł teoretyczny Douga Batesa o pakiecie R4, aby lepiej zrozumieć drobiazgowość mieszanych modeli, i natknąłem się na intrygujący wynik, który chciałbym lepiej zrozumieć, o zastosowaniu ograniczonego maksymalnego prawdopodobieństwa (REML) do oszacowania wariancji . W części 3.3 dotyczącej kryterium REML stwierdza, że ​​zastosowanie REML do oszacowania wariancji jest ściśle związane …

1
Gęstość hiperpriora dla hierarchicznego modelu Gamma-Poissona
W hierarchicznym modelu danych którym wydaje się typowe w praktyce, aby wybierać wartości ( takie, że średnia i wariancja rozkładu gamma w przybliżeniu odpowiadają średniej i wariancji danych (np. Clayton i Kaldor, 1987 „Empirical Bayes Estimates of Standaryzated Age Relative Risks for Disease Mapping”, Biometrics ). Najwyraźniej jest to jednak …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.