Proste przykłady z prawdziwego świata do nauczania statystyki bayesowskiej?

10

Chciałbym znaleźć kilka „prawdziwych przykładów” do nauczania statystyki bayesowskiej. Statystyka bayesowska pozwala formalnie włączyć wcześniejszą wiedzę do analizy. Chciałbym podać uczniom proste przykłady badaczy z prawdziwego świata, którzy uwzględniają wcześniejszą wiedzę w swoich analizach, aby studenci mogli lepiej zrozumieć motywację, dla której można chcieć przede wszystkim wykorzystywać statystyki bayesowskie.

Czy znasz jakieś proste przykłady ze świata rzeczywistego, takie jak szacowanie średniej populacji, proporcji, regresji itp., W których badacze formalnie uwzględniają wcześniejsze informacje? Zdaję sobie sprawę, że Bayesianie mogą również wykorzystywać „nieinformacyjne” priory, ale szczególnie interesują mnie prawdziwe przykłady, w których wykorzystuje się informacyjne priory (tj. Prawdziwe wcześniejsze informacje).

bayesian teaching

— bayes003
źródło

Myślę, że IQ jest całkiem dobrym przykładem.

— hejseb

Nie jest to jednoznaczna odpowiedź, ale kiedy trzy razy rzucisz monetą, a głowa podniesie się dwa razy, żaden uczeń nie uwierzy, że głowa była dwa razy bardziej prawdopodobna niż reszka. Jest to dość przekonujące, choć z pewnością nie prawdziwe badania.

— Bernhard,

1

Możesz sprawdzić tę odpowiedź, naprawdę napisaną przez Ciebie: stats.stackexchange.com/a/134385/61496

— Yair Daon

Czy być może łączysz Regułę Bayesa, którą można zastosować w częstości prawdopodobieństwa / szacunku, oraz statystyki Bayesa, w których „prawdopodobieństwo” jest podsumowaniem przekonań?

— AdamO,

6

Bayesowska teoria wyszukiwania jest interesującą aplikacją statystyki bayesowskiej w świecie rzeczywistym, która była wielokrotnie stosowana do wyszukiwania zaginionych statków na morzu. Na początek mapa jest podzielona na kwadraty. Każdemu kwadratowi przypisuje się wcześniejsze prawdopodobieństwo zatrzymania zagubionego statku, w oparciu o ostatnią znaną pozycję, kurs, brakujący czas, prądy itp. Dodatkowo każdemu kwadratowi przypisane jest warunkowe prawdopodobieństwo znalezienia statku, jeśli faktycznie znajduje się w tym kwadracie, na podstawie rzeczy takie jak głębokość wody. Rozkłady te są łączone w celu ustalenia priorytetów kwadratów mapy, które mają największe prawdopodobieństwo uzyskania pozytywnego wyniku - niekoniecznie jest to najbardziej prawdopodobne miejsce dla statku, ale najbardziej prawdopodobne miejsce faktycznego znalezienia statku.

— Nuclear Wang
źródło

1

Fajnie, są to zastosowania opisane w zabawnej książce Teoria, która nie umrze: jak reguła Bayesa złamała kod enigmy, ścigała rosyjskie okręty podwodne i wyłoniła triumfanta z dwóch wieków kontrowersji . Również Turing zastosował tego rodzaju rozumowanie, by złamać zagadkę.

— jpmuc

Probabilistyczny, ale czy to bayesowski?

— Andrew

5

Myślę, że oszacowanie wielkości produkcji lub populacji na podstawie numerów seryjnych jest interesujące, jeśli tradycyjny przykład wyjaśniający. Tutaj próbujesz maksimum dyskretnego równomiernego rozkładu. W zależności od wcześniejszego wyboru maksymalne prawdopodobieństwo i szacunki Bayesa będą się różnić w dość przejrzysty sposób.

Być może najbardziej znanym przykładem jest szacowanie wydajności produkcji niemieckich czołgów podczas drugiej wojny światowej na podstawie pasm numerów seryjnych czołgów i kodów producenta wykonanych w ustawieniach częstych przez (Ruggles i Brodie, 1947). Alternatywna analiza z punktu widzenia bayesowskiego z pouczającymi priors została wykonana przez (Downey, 2013), a z niewłaściwymi, pozbawionymi informacji priorsami przez (Höhle i Held, 2004). Praca (Höhle i Held, 2004) zawiera także wiele innych odniesień do wcześniejszego leczenia w literaturze, a także więcej dyskusji na temat tego problemu na tej stronie.

Źródła:

Rozdział 3, Downey, Allen. Pomyśl Bayes: statystyki bayesowskie w Pythonie. „O'Reilly Media, Inc.”, 2013.

Wikipedia

Ruggles, R .; Brodie, H. (1947). „Empiryczne podejście do wywiadu gospodarczego w czasie II wojny światowej”. Journal of American Statistics Association. 42 (237): 72.

Höhle, Michael i Leonhard Held. Bayesowskie oszacowanie wielkości populacji. Nr 499. Dokument do dyskusji // Sonderforschungsbereich 386 der Ludwig-Maximilians-Universität München, 2006.

— MachineEpsilon
źródło

3

W Cressie & Wickle Statistics for Spatio-Temporal Data , Wiley jest ładna historia o (bayesowskim) poszukiwaniu USS Scorpion, łodzi podwodnej zaginionej w 1968 roku. Opowiadamy tę historię naszym studentom i każemy im wykonać ( uproszczone) wyszukiwanie za pomocą symulatora .

Podobne przykłady można zbudować wokół historii zagubionego lotu MH370; możesz spojrzeć na Davey i wsp., Bayesian Methods in the Search for MH370 , Springer-Verlag.

— F. Tusell
źródło

1

Oto przykład oszacowania średniej podstawie normalnych danych ciągłych. Zanim przejdę bezpośrednio do przykładu, chciałbym przejrzeć niektóre obliczenia matematyczne dla normalnych i normalnych modeli Bayesa. $\theta$

Rozważ losową próbkę n ciągłych wartości oznaczonych przez . Tutaj wektor reprezentuje zebrane dane. Model prawdopodobieństwa dla danych normalnych o znanej wariancji i niezależnych i identycznie rozmieszczonych (iid) próbkach to $y_1, ..., y_n$ $y = (y_1, ..., y_n)^T$

y_{1}, . . ., y_{n} | θ \sim N (θ, σ^{2})

$y_1, ..., y_n | \theta \sim N(\theta, \sigma^2)$

Lub, jak zwykle pisze Bayesian,

y_{1}, . . ., y_{n} | θ \sim N (θ, τ)

$y_1, ..., y_n | \theta \sim N(\theta, \tau)$

$\tau = 1 / \sigma^2$ $\tau$

$y_i$

f (y_{i} | θ, τ) = \sqrt{(} \frac{τ}{2 π}) \times e x p (- τ (y_{i} - θ)^{2} / 2)

$f(y_i | \theta, \tau) = \sqrt(\frac{\tau}{2 \pi}) \times exp\left( -\tau (y_i - \theta)^2 / 2 \right)$

$\hat{\theta} = \bar{y}$

$\theta$

θ \sim N (a, 1 / b)

$\theta \sim N(a,1/b)$

Rozkład tylny uzyskany z tego modelu danych Normalny-Normalny (po dużej algebrze) jest kolejnym rozkładem Normalnym.

θ | y \sim N (\frac{b}{b + n τ} a + \frac{n τ}{b + n τ} \bar{y}, \frac{1}{b + n τ})

$\theta | y \sim N(\frac{b}{b + n\tau} a + \frac{n \tau}{b + n \tau} \bar{y}, \frac{1}{b + n\tau})$

$b + n\tau$ $a$ $\bar{y}$ $\frac{b}{b + n\tau} a + \frac{n \tau}{b + n \tau} \bar{y}$

$\theta | y$ $\theta$ $\theta$

To powiedziawszy, możesz teraz użyć dowolnego podręcznika z danymi normalnymi, aby to zilustrować. Wykorzystam zestaw danych airqualityw R. Rozważmy problem szacowania średnich prędkości wiatru (MPH).

> ## New York Air Quality Measurements
> 
> help("airquality")
> 
> ## Estimating average wind speeds
> 
> wind = airquality$Wind
> hist(wind, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
>

> n = length(wind)
> ybar = mean(wind)
> ybar
[1] 9.957516 ## "frequentist" estimate
> tau = 1/sd(wind)
> 
> 
> ## but based on some research, you felt avgerage wind speeds were closer to 12 mph
> ## but probably no greater than 15,
> ## then a potential prior would be N(12, 2)
> 
> a = 12
> b = 2
> 
> ## Your posterior would be N((1/))
> 
> postmean = 1/(1 + n*tau) * a + n*tau/(1 + n*tau) * ybar
> postsd = 1/(1 + n*tau)
> 
> set.seed(123)
> posterior_sample = rnorm(n = 10000, mean = postmean, sd = postsd)
> hist(posterior_sample, col = "gray", border = "white", xlab = "Wind Speed (MPH)")
> abline(v = median(posterior_sample))
> abline(v = ybar, lty = 3)
>

> median(posterior_sample)
[1] 10.00324
> quantile(x = posterior_sample, probs = c(0.025, 0.975)) ## confidence intervals
2.5%     97.5% 
9.958984 10.047404

W tej analizie badacz (ty) może powiedzieć, że biorąc pod uwagę dane + wcześniejsze informacje, twój szacunkowy średni wiatr, używając 50 percentyla, prędkości powinny wynosić 10,00324, więcej niż po prostu używając średniej z danych. Uzyskujesz również pełny rozkład, z którego możesz wydobyć 95% wiarygodny przedział przy użyciu kwantyli 2,5 i 97,5.

Poniżej zamieszczam dwa odniesienia, gorąco polecam przeczytanie krótkiego artykułu Caselli. Jest specjalnie ukierunkowany na empiryczne metody Bayesa, ale wyjaśnia ogólną metodologię Bayesa dla modeli normalnych.

Bibliografia:

Casella, G. (1985). Wprowadzenie do empirycznej analizy danych Bayesa. The American Statistician, 39 (2), 83-87.
Gelman, A. (2004). Analiza danych bayesowskich (wydanie 2, Teksty w statystyce). Boca Raton, Fla .: Chapman & Hall / CRC.

— Jon
źródło

1

Obszarem badań, w którym uważam, że metody bayesowskie są absolutnie konieczne, jest optymalny projekt.

$x$ $\beta$ $x$

$x$ $\beta$ $\beta$ $\beta$ $x$

$n = 0$ $\hat \beta$
$\hat \beta$
$\beta = 1$ $\hat \beta = 5$ $x$ $\beta = 5$ $x$
$\beta$

$x$ $x$

$x$ $\beta$

$\beta$ $x$

$x$

— Cliff AB
źródło

1

Ostatnio myślałem o tym pytaniu i wydaje mi się, że mam przykład, w którym bayesowski ma sens, z wykorzystaniem wcześniejszego prawdopodobieństwa: współczynnika prawdopodobieństwa testu klinicznego.

Przykładem może być ten: ważność spadania moczu w codziennych warunkach praktyki (Family Practice 2003; 20: 410-2). Chodzi o to, aby zobaczyć, co pozytywny wynik zanurzenia moczu wpływa na diagnostykę infekcji moczu. Wskaźnik prawdopodobieństwa wyniku dodatniego wynosi:

L R (+) = \frac{t e s t + | H +}{t e s t + | H -} = \frac{S e n s i b i l i t y}{1 - s p e c i f i c i t y}

$LR(+) = \frac{test+|H+}{test+|H-} = \frac{Sensibility}{1-specificity}$

H +

$H+$

H -

$H-$

O R (+ | t e s t +) = L R (+) \times O R (+)

$OR(+|test+) = LR(+) \times OR(+)$

O R

$OR$

O R (+ | t e s t +)

$OR(+|test+)$

O R (+)

$OR(+)$

$LR(+) = 12.2$ $LR(-) = 0.29$

$p_{+} = 2/3$ $p_{+|test+} = 0.96$ $p_{+|test-} = 0.37$

Tutaj test jest dobry do wykrycia infekcji, ale nie tak dobry do odrzucenia infekcji.

— denis
źródło