Jak uzyskać próbkowanie Gibbsa?


11

W rzeczywistości waham się zadać to pytanie, ponieważ obawiam się, że zostaną skierowane do innych pytań lub Wikipedii na temat pobierania próbek Gibbs, ale nie mam wrażenia, że ​​opisują to, co jest pod ręką.

Biorąc pod uwagę prawdopodobieństwo warunkowe : p ( x | y ) y = y 0 y = y 1 x = x 0 1p(x|y)

p(x|y)y=y0y=y1x=x01426x=x13446

I prawdopodobieństwo warunkowe : p ( y | x ) y = y 0 y = y 1 x = x 0 1p(y|x)

p(y|x)y=y0y=y1x=x01323x=x13747

Możemy wyjątkowo wymyślić wspólne prawdopodobieństwo :funique=p(x,y)

p(x,y)y=y0y=y1p(x)x=x0a0a1c0x=x1a2a3c1p(y)b0b1

Ponieważ chociaż mamy niewiadomych, mamy więcej ( ) równań liniowych:4 2 + 3842+3

a0+a1+a2+a3=1b0+b1=1c0+c1=1

Jak również:

14b0=a034b0=a226(1b0)=a146(1b0)=a313c0=a023c0=a137(1c0)=a247(1c0)=a3

Szybko rozwiązuje to , . Mianowicie poprzez zrównanie \ tfrac {2} {4} b_0 = a_1 z \ tfrac {2} {6} (1-b_0) = a_1 . To daje b_0 = \ tfrac {2} {5}, a reszta następuje.c0=34b023c0=a124b0=a126(1b0)=a1b0=25

p(x,y)y=y0y=y1p(x)x=x0110210310x=x1310410710p(y)410610

Teraz przechodzimy do ciągłego przypadku. Można sobie wyobrazić interwały i zachować powyższą strukturę w dotyku (z większą liczbą równań niż niewiadomych). Co jednak dzieje się, gdy przechodzimy do (punktowych) instancji zmiennych losowych? Jak działa pobieranie próbek

xap(x|y=yb)ybp(y|x=xa)

iteracyjnie, prowadzić do ? Odpowiednik ograniczenia , w jaki sposób zapewnia on na przykład ? Podobnie z . Czy możemy zapisać ograniczenia i wyprowadzić próbkowanie Gibbsa z pierwszych zasad?a 0 + a 1 + a 2 + a 3 = 1 X Y p ( x , y ) d y d x = 1 Y p ( y | x ) d yp(x,y)a0+a1+a2+a3=1XYp(x,y)dydx=1Yp(y|x)dy=1

Nie interesuje mnie więc, jak przeprowadzić próbkowanie Gibbsa, co jest proste, ale interesuje mnie sposób jego uzyskania, a najlepiej, jak udowodnić, że działa (prawdopodobnie pod pewnymi warunkami).

Odpowiedzi:


9

Obliczenie wspólnego rozkładu z rozkładów warunkowych jest bardzo trudne. Jeśli rozkłady warunkowe zostaną wybrane arbitralnie, wspólny rozkład wspólny może nawet nie istnieć. W takim przypadku nawet wykazanie, że rozkłady warunkowe są spójne, jest na ogół trudne. Jednym z rezultatów, który można wykorzystać do wyprowadzenia wspólnej dystrybucji, jest lemat Brook'a , wybierając stan stały , chociaż sam nigdy z powodzeniem go nie wykorzystałem do tego celu. Aby uzyskać więcej na ten temat, przyjrzałbym się pracy Juliana Besaga.

p(x)p(x)=ip(xix<i,x>i)p(xix<i,x>i),
x

Aby udowodnić, że próbkowanie Gibbsa działa, lepiej wybrać inną trasę. Jeśli łańcuch Markowa zaimplementowany przez algorytm próbkowania ma rozkład jako rozkład niezmienny i jest nieredukowalny i aperiodyczny , łańcuch Markowa zbiegnie się do tego rozkładu (Tierney, 1994) .p

Próbkowanie Gibbsa zawsze pozostawia niezmiennik wspólnego rozkładu, z którego wyprowadzono rozkłady warunkowe: Z grubsza, jeśli i , to(x0,y0)p(x0,y0)x1p(x1y0)

(x1,y0)p(x0,y0)p(x1y0)dx0=p(x1y0)p(y0)=p(x1,y0).

Oznacza to, że aktualizacja przez warunkowe próbkowanie nie zmienia rozkładu próbki.x

Jednak próbkowanie Gibbsa nie zawsze jest nieredukowalne . Chociaż zawsze możemy go zastosować bez rozbijania rzeczy (w tym sensie, że jeśli mamy już próbkę z pożądanego rozkładu, to nie zmieni rozkładu), to zależy od wspólnego rozkładu, czy próbkowanie Gibbsa rzeczywiście się do niego zbiegnie (wystarczy warunkiem nieredukowalności jest to, że gęstość jest wszędzie dodatnia, ).p(x)>0


Ciekawy problem z kompatybilnością. Sprawdzam teraz „Zgodność skończonych dyskretnych rozkładów warunkowych” (Song i in.), Którzy używają „macierzy proporcji” w celu ustalenia zgodności i niepowtarzalności. Tak więc Gibbs nie może być wyprowadzony z tych ograniczeń, ponieważ nie są one wymuszane na początek. Mogę sobie wyobrazić, że może zwrócić nieprawidłowy rozkład połączeń (suma> 1), jeśli na przykład rozkłady warunkowe są niezgodne. Jakoś jednak mam wrażenie, że to, co robię, jest czymś deterministycznym, czymś zbliżonym do transformacji Radona. Próbkowanie Gibbsa wygląda tak ... brudne.
Anne van Rossum,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.