Odnosząc się do tego wątku: Jak wyjaśniłbyś Markov Chain Monte Carlo (MCMC) laikowi? .
Widzę, że jest to kombinacja Łańcuchów Markowa i Monte Carlo: łańcuch Markowa jest tworzony z tylnym jako niezmienny ograniczający rozkład, a następnie rysuje Monte Carlo (zależne) z rozkładu ograniczającego (= nasz tylny).
Powiedzmy (wiem, że tutaj upraszczam), że po krokach jesteśmy na granicy dystrybucji (*).Π
Łańcuch Markowa jest sekwencją losowych zmiennych, otrzymuję sekwencję , gdzie jest zmienną losową, a jest ograniczeniem „ „zmienna losowa”, z której chcemy próbkować. X i Π
MCMC zaczyna się od wartości początkowej, tj. jest zmienną losową o całej masie przy tej jednej wartości . Jeśli użyję wielkich liter dla zmiennych losowych i małych liter do realizacji zmiennej losowej, wówczas MCMC daje mi sekwencję . Zatem długość łańcucha MCMC wynosi L + n.x 1 x 1 , x 2 , x 3 , ... x L , π 1 , π 2 , π 3 , . . . . π n
[[* Uwaga: wielkie litery to zmienne losowe (tj. Cała wiązka wyników), a małe to wyniki, tj. Jedna konkretna wartość. *]]
Oczywiście tylko należą do mojego „tylnego” i dla przybliżenia tylnej „studni” wartość powinna być „wystarczająco duża”. n
Jeśli to podsumuję, to mam łańcuch MCMC o długości , tylko są istotne dla mojego tylnego przybliżenia, a powinno być wystarczająco duże. N = L + n π 1 , π 2 , … , π n n
Jeśli uwzględnię część (tj. Realizacji przed osiągnięciem niezmiennego rozkładu) w obliczeniach aproksymacji tylnej części ciała, to będzie to „hałaśliwe”.
Znam długość łańcucha MCMC , ale bez znajomości , tj. Etapu, w którym jestem pewien, że próbkuję z ograniczającego rozkładu, nie mogę być pewien, że nie uwzględniłem hałasu, ani nie mogę bądź pewien, że , wielkość mojej próbki z ograniczającego rozkładu, w szczególności nie mogę być pewien, czy jest ona „wystarczająco duża”. L n = N - L
Tak więc, o ile rozumiem, ta wartość ma decydujące znaczenie dla jakości aproksymacji tylnej (wykluczenie hałasu i dużej próbki z niego) .
Czy są jakieś sposoby na znalezienie rozsądnego oszacowania dla kiedy aplikuję MCMC?
(*) Myślę, że ogólnie będzie zależeć od wartości początkowej .x 1