Czy pytanie o ciekawość oznacza, że moja odpowiedź tutaj nie odpowiada ? Jeśli nie...
Dalsze dochodzenie w tej skomplikowanej kwestii wykazała, że nie istnieją powszechnie stosowanym zasada-of-kciuk, które stwierdza dwa modele są nie do odróżnienia od I C kryterium, jeśli różnica | A I C 1 - A I C 2 | < 2 . To samo, co faktycznie przeczytasz w artykule Wikipedii na temat A I C (uwaga, że link można kliknąć!). Tylko dla tych, którzy nie klikają linków:AIC|AIC1−AIC2|<2AIC
szacuje względne poparcie dla modelu. Aby zastosować to w praktyce, zaczynamy od zestawu modeli kandydujących, a następnie znajdujemy odpowiadające imwartości A I C modeli. Następnie określić minimalną I C wartość. Wyboru modelu można następnie dokonać w następujący sposób.A jadoA jadoA jado
Z grubsza ogólną zasadą jest, że modele posiadające w granicach minimum mają znaczne wsparcie i powinny być brane pod uwagę przy dokonywaniu wniosków. Modele posiadające w granicach około minimum mają znacznie mniejsze wsparcie, podczas gdy modele z powyżej minimum nie mają zasadniczo żadnego wsparcia i mogą zostać pominięte w dalszych rozważaniach lub przynajmniej nie wyjaśnić pewnych istotnych różnic strukturalnych w dane.A jadoA I C 4 - 7 A I C > 101 - 2A jado4 - 7A jado> 10
Bardziej ogólne podejście jest następujące ...
Oznacz wartości modeli kandydujących według , . Niech oznacza minimum tych wartości. Następnie można interpretować jako względne prawdopodobieństwo, że ty model minimalizuje (oczekiwaną szacowaną) utratę informacji.A I C 1 A I C 2 , A I C 3 , … , A I C R A I C m i n e ( A I C m i n - A I C i ) / 2 iA jadoA jado1A jado2 , A Ido3 , … , A IdoRA jadom i nmi( A Idom i n - A Idoi ) / 2ja
Załóżmy na przykład, że w zestawie kandydackim znajdowały się trzy modele o wartościach , i . Następnie drugi model to razy bardziej prawdopodobny niż pierwszy model w celu zminimalizowania utraty informacji, a trzeci model to razy tak prawdopodobne, jak pierwszy model minimalizujący utratę informacji. W takim przypadku możemy pominąć trzeci model i rozważyć średnią ważoną pierwszych dwóch modeli, odpowiednio o wagach i . Wnioskowanie statystyczne byłoby wówczas oparte na ważonym multimodelu.100 102 110 E ( 100 - 102 ) / 2 = 0,368 E ( 100 - 110 ) / 2 = 0,007 1 0,368A jado100102110mi( 100 - 102 ) / 2= 0,368mi( 100 - 110 ) / 2= 0,00710,368
Ładne wyjaśnienie i przydatne sugestie, moim zdaniem. Po prostu nie bój się czytać tego, co można kliknąć!
W uzupełnieniu , nuta po raz kolejny, jest mniej korzystne dla zbiorów danych na dużą skalę. Oprócz przydatne może być zastosowanie wersji kryterium (możesz użyć tego kodu lub użyć wzoru , gdzie to liczba szacowanych parametrów). Ogólna zasada będzie jednak taka sama. B I C A I C A I C c A I C c = A I C + 2 p ( p + 1 )A jadoB IdoA jadoA jadodoR
pA jadoc = A Ido+ 2 p ( p + 1 )n - p - 1p