Stabilność walidacji krzyżowej w modelach bayesowskich


19

Dopasowuję Bayesian HLM w JAGS przy użyciu k-krotnej walidacji krzyżowej (k = 5). Chciałbym wiedzieć, czy szacunki parametru są stabilne we wszystkich fałdach. Jak najlepiej to zrobić?β

Jednym z pomysłów jest znalezienie różnic w tylnej stronie i sprawdzenie, czy 0 jest w 95% CI różnicy. Innymi słowy, wynosi 0 w 95% przedziale (a następnie powtórz dla wszystkich par ).ββk=1-βk=2)

Innym pomysłem jest traktowanie tylnych z każdej zakładki jako różnych łańcuchów MCMC i obliczenie Gelmana (Potential Scale Reduction Factor) dla tych pseudo-łańcuchów.R^

Czy jedna z nich jest lepsza i czy istnieją alternatywy?


1
Dziwnie jest patrzeć, czy zero jest wśród wiarygodnych różnic, ponieważ na pewno spodziewasz się różnicy między fałdami. Jedną z sugestii byłoby obliczenie oszacowań punktowych dla każdej zakładki i przyjrzenie się ich rozkładowi. β
Rasmus Bååth

3
Tylko ogólny komentarz na temat walidacji krzyżowej i Bayesian: Dlaczego nie po prostu obliczyć WAIC? Jest asymptotycznie równoważny LOOCV i nadal możesz korzystać ze wszystkich swoich danych.
Brash Equilibrium

1
Jak wygenerowałbyś późniejsze symulacje ? βk=1-βk=2)
Stéphane Laurent,

W naszych testach w mojej byłej fabryce musieliśmy udowodnić, że spadek wydajności o 0% był w 95% CI. Dominowały pytania o odpowiednie, niezależne próbki i charakter testu dwumianowego. Czy możesz podać pojęcie wielkości próbek?
EngrStudent - Przywróć Monikę

Odpowiedzi:


2

Nie wiem, czy to kwalifikuje się jako komentarz czy odpowiedź. Stawiam tutaj, ponieważ wydaje mi się, że to odpowiedź.

W k-krotnej walidacji krzyżowej dzielisz dane na k grup. Jeśli omawiasz nawet „podstawy”, to losowo wybierasz członków dla każdego z k przedziałów.

Kiedy mówię o danych, myślę o każdym wierszu jako próbce, a każdej kolumnie o wymiarze. Jestem przyzwyczajony do używania różnych metod określania znaczenia zmiennej, ważności kolumny.

Co jeśli, jako ćwiczenie myślowe, przypadkowo odszedłeś od munduru „podręcznika” i ustaliłeś, które wiersze są ważne? Może informują pojedynczą zmienną na raz, ale może informują więcej. Czy są jakieś wiersze, które są mniej ważne niż inne? Może wiele punktów ma charakter informacyjny, a może niewiele.

Znając znaczenie zmiennej, być może możesz podzielić je według ważności. Może mógłbyś zrobić jeden pojemnik z najważniejszymi próbkami. To może zdefiniować rozmiar twojego „k”. W ten sposób określasz „najbardziej informacyjny” k-segment i porównujesz go z innymi oraz z najmniej informacyjnym.

To może dać ci wyobrażenie o maksymalnej zmienności parametrów twojego modelu. To tylko jedna forma.

Drugim sposobem podziału k-tego segmentu jest wielkość i kierunek wpływu. Możesz więc umieścić próbki, które kołyszą parametr lub parametry w jednym kierunku, w jednym wiadrze i umieścić próbki, które kołyszą ten sam parametr lub parametry w przeciwnym kierunku w innym wiadrze.

Zmienność parametrów w tej formie może poszerzyć zakres zmiennych, w oparciu nie o gęstość informacji, ale o rasę informacji.

Powodzenia.


0

To może nie być pełna odpowiedź, ale jeśli 0 nie jest w 95% CI dla kilku różnic, całkiem bezpiecznie jest powiedzieć, że nie są one identyczne na poziomie 0,05.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.