Pracuję nad wyprowadzeniem tylnej normalnej części życzeń, ale utknąłem przy jednym z parametrów (tylnej matrycy skali, patrz na dole).
Tylko dla kontekstu i kompletności, oto model i pozostałe pochodne:
xiμΛ∼N(μ,Λ)∼N(μ0,(κ0Λ)−1)∼W(υ0,W0)
Rozszerzone formy każdego z trzech czynników są (do stałej proporcjonalności):
Prawdopodobieństwo:
N(xi|μ,Λ)∝|Λ|N/2exp(−12∑i=1N(xTiΛxi−2μTΛxi+μTΛμ))
Zwykły przed:
N(μ|(μ0,κ0Λ)−1)∝|Λ|1/2exp(−12(μTκ0Λμ−2μTκ0Λμ0+μT0κ0Λμ0))
Wishart before:
W(Λ|υ0,W0)∝|Λ|υ0−D−12exp(−12tr(W−10Λ))
Chcemy tylnego normalnego życzenia ( ), które można rozłożyć jako a także :N ( μ | μ , κ ′ Λ ) W ( Λ | υ ′ , W ′ )μ,Λ|μ′,κ′,υ′,W′N(μ|μ,κ′Λ)W(Λ|υ′,W′)
Stopień wolnościυ′
Łącząc pierwsze czynniki prawdopodobieństwa i Wishart, otrzymujemy pierwszy czynnik z Wishart z tyłu:
i dlatego mamy pierwszy parametr posterior:
υ′=υ0+N
|Λ|υ0+N−D−12
υ′=υ0+N
Współczynnik skaliκ′
Identyfikujemy elementy otoczone przez i aby ustalić, kto poprzedni jest aktualizowany według prawdopodobieństwa:
i dlatego otrzymaliśmy drugi parametr:
μ κ 0 Λ μ T ( ( κ 0 + N ) Λ ) μ κ ′ = κ 0 + NμTμκ0Λ
μT((κ0+N)Λ)μ
κ′=κ0+N
Meanμ′
Trzecie parametry pochodzą z identyfikacji zawartości :
I dlatego otrzymaliśmy trzeci parametr:
2 μ T ( Λ N ¯ x + κ 0 Λ μ 0 )2μT...μ ′ = 1
2μT(ΛNx¯¯¯+κ0Λμ0)(ΛNx¯¯¯+κ0Λμ0)(Nx¯¯¯+κ0μ0)=2μTκ′Λμ′=κ′Λμ′=κ′μ′
μ′=1k′(Nx¯¯¯+κ0μ0)
Skala macierzyW′
Czwarty parametr pochodzi z pracy nad pozostałymi parametrami:
tr(W′−1Λ)=tr(W−10Λ)+∑i=1NxTiΛxi+μT0κ0Λμ0=tr(W−10Λ)+∑i=1Ntr(xTiΛxi)+tr(μT0κ0Λμ0)=tr(W−10Λ+∑i=1NxTiΛxi+μT0κ0Λμ0)
Jak przejść dalej (jeśli dotychczas nie popełniłem błędów) i uzyskać standardowe rozwiązanie dla ?W′
Edycja 1 :
Teraz ponownie układamy warunki, dodajemy i odejmujemy niektóre czynniki, aby uzyskać dwa kwadraty, jak w rozwiązaniu standardowym:
tr(W′−1Λ)==tr(W−1Λ+∑i=1N(xTiΛxi+x¯¯¯TΛx¯¯¯−2xTiΛx¯¯¯)+κ0(μT0Λμ0+x¯¯¯TΛx¯¯¯−2x¯¯¯TΛμ0)−∑i=1Nx¯¯¯TΛx¯¯¯+2∑i=1NxTiΛx¯¯¯−κ0x¯¯¯TΛx¯¯¯+2κ0x¯¯¯TΛμ0)tr(W−1Λ+∑i=1N(xi−x¯¯¯)Λ(xi−x¯¯¯)T+κ0(x¯¯¯−μ0)Λ(x¯¯¯−μ0)T−Nx¯¯¯Λx¯¯¯T+2Nx¯¯¯Λx¯¯¯T−κ0x¯¯¯Λx¯¯¯T+2κ0x¯¯¯ΛμT0)
Upraszczamy czynniki, które pozostają poza kwadratami:
tr(W′−1Λ)=tr(W−1Λ+∑i=1N(xi−x¯¯¯)TΛ(xi−x¯¯¯)+κ0(x¯¯¯−μ0)TΛ(x¯¯¯−μ0)+(N−κ0)x¯¯¯TΛx¯¯¯+2κ0x¯¯¯TΛμ0)
Edytuj 2 ( kontynuuj dzięki odpowiedzi @bdeonovic )
Ślad jest cykliczny, więc . Następnie:
a następnie:
tr(ABC)=tr(BCA)=tr(CAB)
tr(W′−1Λ)=tr(W−1Λ+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)TΛ+κ0(x¯¯¯−μ0)(x¯¯¯−μ0)TΛ+(N−κ0)x¯¯¯x¯¯¯TΛ+2κ0x¯¯¯μT0Λ)
tr(W′−1)=tr(W−1+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)T+κ0(x¯¯¯−μ0)(x¯¯¯−μ0)T+(N−κ0)x¯¯¯x¯¯¯T+2κ0x¯¯¯μT0)
Prawie! Ale wciąż tam nie ma. Celem jest:
W−1+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)T+κ0Nκ0+N(x¯¯¯−μ0)(x¯¯¯−μ0)T