Pytanie: Za pomocą 10-wymiarowego łańcucha MCMC powiedzmy, że jestem przygotowany na przekazanie macierzy losowań: 100 000 iteracji (wierszy) na 10 parametrów (kolumn). Jak najlepiej zidentyfikować tryby tylne? Szczególnie interesuje mnie wiele trybów.
Tło:Uważam się za doświadczonego obliczeniowo statystykę, ale kiedy kolega zadał mi to pytanie, wstydziłem się, że nie mogłem znaleźć rozsądnej odpowiedzi. Głównym problemem jest to, że może pojawić się wiele trybów, ale tylko wtedy, gdy weźmie się pod uwagę co najmniej osiem z dziesięciu wymiarów. Moją pierwszą myślą było użycie oszacowania gęstości jądra, ale przeszukanie R nie wykazało niczego obiecującego dla problemów większych niż trzy wymiary. Kolega zaproponował doraźną strategię binowania w dziesięciu wymiarach i szukał maksimum, ale martwię się, że przepustowość może albo prowadzić do znacznych problemów z rzadkością, albo do braku rozdzielczości w celu rozróżnienia wielu trybów. To powiedziawszy, chętnie przyjmę sugestie dotyczące automatycznych sugestii przepustowości, łącza do estymatora gęstości jądra 10 lub cokolwiek innego, o czym wiesz.
Obawy:
Uważamy, że rozkład może być dość wypaczony; dlatego chcemy zidentyfikować tryby tylne, a nie środki tylne.
Obawiamy się, że może istnieć kilka trybów bocznych.
Jeśli to możliwe, wolelibyśmy sugestię opartą na R. Ale każdy algorytm działa tak długo, jak nie jest niewiarygodnie trudny do wdrożenia. Chyba wolałbym nie implementować estymatora gęstości jądra Nd z automatycznym wyborem przepustowości od zera.