Oceń tylny rozkład predykcyjny w regresji liniowej Bayesa


10

Jestem zdezorientowany, jak ocenić tylny rozkład predykcyjny dla regresji liniowej Bayesa, pomijając podstawowy przypadek opisany tutaj na stronie 3, i skopiowałem poniżej.

p(y~y)=p(y~β,σ2)p(β,σ2y)

Podstawowym przypadkiem jest ten model regresji liniowej:

y=Xβ+ϵ,yN(Xβ,σ2)

Jeśli użyjemy albo munduru przed , ze skalą Inv przed , LUB normalnego-odwrotnego-gamma przed (patrz tutaj ), tylna dystrybucja predykcyjna jest analityczna i jest studentem. βχ2σ2

Co z tym modelem?

y=Xβ+ϵ,yN(Xβ,Σ)

Kiedy , ale jest znane, tylny rozkład predykcyjny jest wielowymiarowy Gaussa. Zwykle nie znasz , ale musisz to oszacować. Może powiesz, że jest przekątna, i uczynisz ją w jakiś sposób funkcją zmiennych towarzyszących. Jest to omówione w rozdziale dotyczącym regresji liniowej w analizie danych bayesowskich Gelmana .yN(Xβ,Σ)ΣΣ

Czy w tym przypadku istnieje forma analityczna dla tylnego rozkładu predykcyjnego? Czy mogę po prostu podłączyć swoją ocenę tego do wielowymiarowego ucznia t? Jeśli oszacujesz więcej niż jedną wariancję, czy rozkład nadal jest wielowymiarowy dla studenta t?

Pytam, bo powiedz, że mam już trochę . Chcę wiedzieć, czy jest bardziej prawdopodobne, że można to przewidzieć np. Przez regresję liniową A, regresję liniową B. y~


1
Jeśli masz próbki tylne z rozkładu tylnego, możesz ocenić rozkład predykcyjny za pomocą przybliżenia Monte Carlo
niandra82 10.04.15

Ach, dzięki, zawsze mogłem to zrobić. Czy w tym przypadku nie ma wzoru analitycznego?
bill_e

Nawiasem mówiąc, linki są zerwane. Byłoby wspaniale, gdybyś uwzględnił referencje w inny sposób.
Maxim.K

Odpowiedzi:


6

Jeśli założysz mundur przed , to tylna dla to with Aby znaleźć rozkład predykcyjny, potrzebujemy więcej informacji. Jeśli i jest warunkowo niezależny od dającego , to Ale zazwyczaj dla tego typu modeli i nie są warunkowo niezależne, zamiast tego zazwyczaj mamy ββ

β|yN(β^,Vβ).
β^=[XΣ1X]XyandVβ=[XΣ1X]1.
y~N(X~β,Σ~)yβ
y~|yN(X~β^,Σ~+Vβ).
yy~
(yy~)N([XβX~β],[ΣΣ12Σ21Σ~]).
W takim przypadku Zakłada się, że i są znane. Jak zauważyłeś, zazwyczaj są one nieznane i należy je oszacować. W przypadku popularnych modeli o tej strukturze, np. Szeregów czasowych i modeli przestrzennych, na ogół nie będzie zamkniętej formy rozkładu predykcyjnego.
y~|yN(X~β^+Σ21Σ1(yXβ^),Σ~Σ21Σ1Σ12).
Σ,Σ12,Σ~

2

W przypadku nieinformacyjnych lub wielowymiarowych priorów normalnego życzenia, masz formę analityczną jako wielowymiarowy rozkład Studenta, dla klasycznej wielowariantowej, regresji wielokrotnej. Myślę, że zmiany w tym dokumencie są związane z twoim pytaniem (może ci się spodobać załącznik A :-)). Zazwyczaj porównywałem wynik z późniejszym rozkładem predykcyjnym uzyskanym za pomocą WinBUGS i formą analityczną: są one dokładnie równoważne. Problem staje się trudny tylko wtedy, gdy masz dodatkowe efekty losowe w modelach z efektami mieszanymi, szczególnie w przypadku niezrównoważonego projektu.

Ogólnie, przy klasycznych regresjach, yi ỹ są warunkowo niezależne (reszty są iid)! Oczywiście, jeśli tak nie jest, proponowane tutaj rozwiązanie jest nieprawidłowe.

W R (tutaj rozwiązanie dla jednolitych priorytetów), zakładając, że wykonałeś model lm (o nazwie „model”) jednej z odpowiedzi w swoim modelu i nazwałeś go „modelem”, oto jak uzyskać wielowymiarowy rozkład predykcyjny

library(mvtnorm)
Y = as.matrix(datas[,c("resp1","resp2","resp3")])
X =  model.matrix(delete.response(terms(model)), 
           data, model$contrasts)
XprimeX  = t(X) %*% X
XprimeXinv = solve(xprimex)
hatB =  xprimexinv %*% t(X) %*% Y
A = t(Y - X%*%hatB)%*% (Y-X%*%hatB)
F = ncol(X)
M = ncol(Y)
N = nrow(Y)
nu= N-(M+F)+1 #nu must be positive
C_1 =  c(1  + x0 %*% xprimexinv %*% t(x0)) #for a prediction of the factor setting x0 (a vector of size F=ncol(X))
varY = A/(nu) 
postmean = x0 %*% hatB
nsim = 2000
ysim = rmvt(n=nsim,delta=postmux0,C_1*varY,df=nu) 

Teraz kwantyle ysim są przedziałami tolerancji oczekiwań beta od rozkładu predykcyjnego, możesz oczywiście bezpośrednio użyć próbkowanego rozkładu, aby zrobić co chcesz.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.