AIC oznacza Akaike Information Criterion, która jest jedną z technik stosowanych do wyboru najlepszego modelu z klasy modeli z wykorzystaniem karanego prawdopodobieństwa. Mniejszy AIC oznacza lepszy model.
Mam problem z uznaniem korzyści oznaczania czynnika modelowego za losowy z kilku powodów. Wydaje mi się, że prawie we wszystkich przypadkach optymalnym rozwiązaniem jest traktowanie wszystkich czynników jako ustalonych. Po pierwsze, rozróżnienie między ustalonym a losowym jest dość arbitralne. Standardowe wyjaśnienie jest takie, że jeśli ktoś interesuje się konkretnymi jednostkami …
Interesuje mnie wybór modelu w ustawieniach szeregów czasowych. Dla konkretności załóżmy, że chcę wybrać model ARMA z puli modeli ARMA o różnych rzędach opóźnień. Ostatecznym celem jest prognozowanie . Wyboru modelu można dokonać za pomocą krzyżowa walidacja, stosowanie kryteriów informacyjnych (AIC, BIC), wśród innych metod. Rob J. Hyndman zapewnia sposób …
Szukam przykładów, jak interpretować szacunki AIC (kryterium informacji Akaike) i BIC (kryterium informacji bayesowskiej). Czy ujemną różnicę między kodami BIC można interpretować jako późniejsze szanse jednego modelu na drugi? Jak mogę to wyrazić słowami? Na przykład BIC = -2 może sugerować, że szanse lepszego modelu na drugi model wynoszą w …
Jak zwykle porównywane są (liniowe) modele efektów mieszanych? Wiem, że można zastosować testy współczynnika prawdopodobieństwa, ale to nie działa, jeśli jeden model nie jest „podzbiorem” drugiego, prawda? Czy oszacowanie modeli df jest zawsze proste? Szacowana liczba stałych efektów + liczba składników wariancji? Czy ignorujemy oszacowania efektów losowych? Co z walidacją? …
Jestem zupełnie nowy w tej kwestii R, ale nie jestem pewien, który model wybrać. Zrobiłem stopniowe naprzód regresji wybranie każdej zmiennej opartej na najniższym AIC. Wymyśliłem 3 modele, które nie jestem pewien, który jest „najlepszy”. Model 1: Var1 (p=0.03) AIC=14.978 Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC = 12.543 …
W małym zestawie danych ( ), z którym pracuję, kilka zmiennych daje mi idealne przewidywanie / separację . Dlatego do rozwiązania tego problemu używam regresji logistycznej Firtha .n ∼ 100n∼100n\sim100 Jeżeli wybiorę najlepszy model według AIC lub BIC , czy powinienem uwzględnić prawdopodobieństwo kary Firth przy obliczaniu tych kryteriów informacyjnych?
Podczas obliczania AIC AIC=2k−2lnLAIC=2k−2lnLAIC = 2k - 2 ln L k oznacza „liczbę parametrów”. Ale co liczy się jako parametr? Na przykład w modelu y=ax+by=ax+by = ax + b Czy aib są zawsze liczone jako parametry? Co jeśli nie dbam o wartość przechwytywania, czy mogę to zignorować, czy nadal się …
Powiedzmy, że mamy GLMM mod1 <- glmer(y ~ x + A + (1|g), data = dat) mod2 <- glmer(y ~ x + B + (1|g), data = dat) Te modele nie są zagnieżdżone w zwykłym sensie: a <- glmer(y ~ x + A + (1|g), data = dat) b <- …
Po przeczytaniu książki Galit Shmueli „Wyjaśnić lub przewidzieć” (2010) zastanawia mnie pozorna sprzeczność. Istnieją trzy przesłanki, AIC - wybór modelu na podstawie BIC (koniec str. 300 - początek str. 301): po prostu, AIC powinien być używany do wybierania modelu przeznaczonego do przewidywania, podczas gdy BIC powinien być używany do wybierania …
Przeczytałem niezliczoną liczbę postów na tej stronie, które są niezwykle przeciwne stosowaniu stopniowego wyboru zmiennych przy użyciu dowolnego kryterium, niezależnie od tego, czy będzie to oparte na wartościach p, AIC, BIC itp. Rozumiem, dlaczego te procedury są ogólnie dość kiepskie w doborze zmiennych. Prawdopodobnie słynny post Gunga jasno ilustruje dlaczego; …
To pytanie jest kontynuacją lub próbą wyjaśnienia możliwych nieporozumień dotyczących tematu, który ja i wiele innych osób uważam za nieco trudny, jeśli chodzi o różnicę między AIC i BIC. W bardzo ładnej odpowiedzi @Dave Kellen na ten temat ( /stats//a/767/30589 ) czytamy: Twoje pytanie sugeruje, że AIC i BIC próbują …
Istota mojego pytania brzmi: Niech będzie wielowymiarową normalną zmienną losową ze średnią i macierzą kowariancji . Niech , tj. . Jak porównać AIC modelu dopasowanego do obserwowanych realizacji z modelem dopasowanym do obserwowanych realizacji ? μ Σ Z : = log ( Y ) Z i = log ( Y …
(To pytanie może wydawać się bardziej odpowiednie dla filozofii SE. Mam nadzieję, że statystycy mogą wyjaśnić moje nieporozumienia na temat wypowiedzi Boxa i Shmueli, dlatego zamieszczam je tutaj). George Box (o sławie ARIMA) powiedział: „Wszystkie modele są błędne, ale niektóre są przydatne”. Galit Shmueli w swoim słynnym artykule „Wyjaśnić lub …
Właśnie natknąłem się na „kryterium informacyjne Akaike” i zauważyłem dużą ilość literatury na temat wyboru modelu (wydaje się, że istnieją również takie rzeczy jak BIC). Dlaczego współczesne metody uczenia maszynowego nie wykorzystują kryteriów wyboru modeli BIC i AIC?
Próbowałem obliczyć AIC regresji liniowej w R, ale bez użycia AICfunkcji: lm_mtcars <- lm(mpg ~ drat, mtcars) nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2) [1] 97.98786 Jednak AICdaje inną wartość: AIC(lm_mtcars) [1] 190.7999 Czy ktoś mógłby mi powiedzieć, co robię źle?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.