Pobieranie próbek z niewłaściwej tylnej (gęstości) nie ma sensu z probabilistycznego / teoretycznego punktu widzenia. Powodem tego jest to, że funkcja f nie ma całki skończonej w przestrzeni parametrów i w związku z tym nie może być powiązana z modelem prawdopodobieństwa ( miara skończona) ( Ω , σ , P ) (przestrzeń, sigma-algebra, miara prawdopodobieństwa ).fafa( Ω , σ, P )
Jeśli masz model z niewłaściwym przodem, który prowadzi do niewłaściwego tylnego odcinka, w wielu przypadkach możesz nadal pobierać z niego próbki za pomocą MCMC, na przykład Metropolis-Hastings, a „próbki tylne” mogą wyglądać rozsądnie. Na pierwszy rzut oka wygląda to intrygująco i paradoksalnie. Powodem tego jest jednak to, że metody MCMC są ograniczone do ograniczeń numerycznych komputerów w praktyce, a zatem wszystkie podpory są ograniczone (i dyskretne!) Dla komputera. Następnie, zgodnie z tymi ograniczeniami (ograniczeniami i dyskrecją), w większości przypadków tylne jest właściwe.
Jest świetne odniesienie Hoberta i Caselli, które przedstawia przykład (nieco innej natury), w którym możesz skonstruować próbnik Gibbs dla a posterior, próbki a posterior wyglądają zupełnie rozsądnie, ale a posterior jest niewłaściwy!
http://www.jstor.org/stable/2291572
Podobny przykład ostatnio pojawił się tutaj . W rzeczywistości Hobert i Casella ostrzegają czytelnika, że metod MCMC nie można użyć do wykrycia niewłaściwości tylnej części ciała i że należy to sprawdzić osobno przed wdrożeniem jakichkolwiek metod MCMC. W podsumowaniu:
- Niektóre samplery MCMC, takie jak Metropolis-Hastings, mogą (ale nie powinny) być używane do próbkowania z niewłaściwej tylnej części, ponieważ komputer ogranicza i dyktuje przestrzeń parametrów. Tylko jeśli masz ogromne próbek, to może być w stanie zaobserwować jakieś dziwne rzeczy. To, jak dobrze możesz wykryć te problemy, zależy również od dystrybucji „instrumentalnej” zastosowanej w twoim samplerze. Ta ostatnia kwestia wymaga szerszej dyskusji, więc wolę ją tutaj zostawić.
- (Hobert i Casella). Fakt, że możesz zbudować próbnik Gibbsa (model warunkowy) dla modelu z niewłaściwym wyprzedzeniem, nie oznacza, że tylny (model połączenia) jest właściwy.
- Formalna probabilistyczna interpretacja próbek tylnych wymaga właściwości tylnej. Wyniki i dowody konwergencji są ustalane tylko dla właściwych rozkładów / miar prawdopodobieństwa.
PS (nieco język w policzek): Nie zawsze wierz w to, co ludzie robią w uczeniu maszynowym. Jak powiedział prof. Brian Ripley: „uczenie maszynowe to statystyka pomniejszona o sprawdzenie modeli i założeń”.