Rozumiem więc, że wybór zmiennych jest częścią wyboru modelu. Ale na czym dokładnie polega wybór modelu? Czy to coś więcej niż następujące:
1) wybierz rozkład dla swojego modelu
2) wybrać zmienne objaśniające,?
Pytam o to, ponieważ czytam artykuł Burnham i Anderson: AIC kontra BIC, w którym mówią o AIC i BIC w wyborze modeli. Czytając ten artykuł, zdaję sobie sprawę, że myślałem o „wyborze modelu” jako o „wyborze zmiennej” (zob. Komentarze Czy BIC próbuje znaleźć prawdziwy model? )
Fragment artykułu, w którym mówią o 12 modelach o rosnącym stopniu „ogólności”, a modele te pokazują „zwężające się efekty” (ryc. 1), gdy wykreślono informacje KL względem 12 modeli:
RÓŻNE FILOZOFIE I MODELE DOCELOWE ... Mimo że cel BIC jest bardziej ogólnym modelem niż model docelowy dla AIC, model najczęściej wybierany tutaj przez BIC będzie mniej ogólny niż Model 7, chyba że n jest bardzo duży. Może to być Model 5 lub 6. Wiadomo (z licznych prac i symulacji w literaturze), że w kontekście zwężających się efektów (Ryc. 1) AIC działa lepiej niż BIC. Jeśli taki jest kontekst analizy danych rzeczywistych, należy zastosować AIC.
Jak można BIC kiedykolwiek wybrać model bardziej skomplikowany niż AIC w wyborze modelu nie rozumiem! Czym konkretnie jest „wybór modelu” i kiedy konkretnie BIC wybiera bardziej „ogólny” model niż AIC?
Jeśli mówimy o wyborze zmiennych, to BIC musi z pewnością zawsze wybierać model z najmniejszą liczbą zmiennych, prawda? Termin w BIC zawsze będzie karać dodawane zmienne bardziej niż termin w AIC. Ale czy nie jest to nieuzasadnione, gdy „ cel BIC jest bardziej ogólnym modelem niż model docelowy dla AIC ”?
EDYCJA :
Z dyskusji w komentarzach w Czy jest jakiś powód, aby preferować AIC lub BIC nad drugim? widzimy krótką dyskusję między @Michael Chernick i @ user13273 w komentarzach, co prowadzi mnie do przekonania, że nie jest to wcale takie trywialne:
Myślę, że właściwsze jest nazywanie tej dyskusji „selekcją funkcji” lub selekcją „zmiennych towarzyszących”. Dla mnie wybór modelu jest znacznie szerszy i obejmuje specyfikację rozkładu błędów, formę funkcji łącza i formę zmiennych towarzyszących. Kiedy mówimy o AIC / BIC, zwykle znajdujemy się w sytuacji, w której wszystkie aspekty budowy modelu są ustalone, z wyjątkiem wyboru zmiennych towarzyszących. - user13273, 13 sierpnia o 21:17
Decyzja o określonych współzmiennych, które należy uwzględnić w modelu, często wiąże się z terminem wyboru modelu i istnieje wiele książek z wyborem modelu w tytule, które decydują przede wszystkim o tym, jakie współzmienne / parametry modelu należy uwzględnić w modelu. - Michael Chernick 24 sierpnia o godz. 14:44