Przeglądałem dokumentację Stana, którą można pobrać stąd . Byłem szczególnie zainteresowany ich wdrożeniem diagnostyki Gelmana-Rubina. Oryginalny artykuł Gelman i Rubin (1992) definiuje potencjalny współczynnik redukcji skali (PSRF) w następujący sposób:
Niech będą -tym łańcuchem Markowa, z którego pobrano próbkę, i niech będzie próbka z całych niezależnych łańcuchów. Niech będzie średnią z tego łańcucha, a będzie średnią ogólną. Zdefiniuj,
Określić V = ( N - 1 PSRF szacuje się na √
Dokumentacja Stan na stronie 349 ignoruje termin z usuwa, a także ( M + 1 ) / M mnożnikowy okresie. To jest ich formuła,
Estymatorem wariancji jest Na koniec, możliwość statystyczne zmniejszenie skali jest określony przez R = √
Z tego, co widziałem, nie zawierają one odniesienia do tej zmiany formuły i nie dyskutują o tym. Zwykle nie jest zbyt duże i często może być tak niskie, jak 2 , więc ( M + 1 ) / M nie należy ignorować, nawet jeśli wartość d f można aproksymować za pomocą 1.
Skąd więc ta formuła?
EDYCJA: Znalazłem częściową odpowiedź na pytanie „ skąd pochodzi ta formuła? ”, Ponieważ książka Bayesian Data Analysis autorstwa Gelmana, Carlina, Sterna i Rubina (wydanie drugie) ma dokładnie tę samą formułę. Jednak książka nie wyjaśnia, w jaki sposób / dlaczego uzasadnione jest ignorowanie tych terminów?