Jestem trochę zdezorientowany co do zalet mieszanych modeli w zakresie modelowania predykcyjnego. Ponieważ modele predykcyjne mają zwykle przewidywać wartości wcześniej nieznanych obserwacji, wydaje mi się oczywiste, że jedynym sposobem, w jaki model mieszany może być użyteczny, jest jego zdolność do przewidywania na poziomie populacji (to znaczy bez dodawania żadnych efektów losowych). Problem polega jednak na tym, że do tej pory z mojego doświadczenia przewidywania na poziomie populacji oparte na modelach mieszanych są znacznie gorsze niż prognozy oparte na standardowych modelach regresji z tylko ustalonymi efektami.
Jaki jest sens modeli mieszanych w odniesieniu do problemów z prognozowaniem?
EDYTOWAĆ. Problem jest następujący: dopasowałem model mieszany (z efektami stałymi i losowymi) i standardowy model liniowy tylko z efektami stałymi. Kiedy przeprowadzam walidację krzyżową, otrzymuję następującą hierarchię dokładności predykcyjnej: 1) modele mieszane podczas przewidywania za pomocą stałych i losowych efektów (ale działa to oczywiście tylko w przypadku obserwacji ze znanymi poziomami zmiennych efektów losowych, więc to podejście predykcyjne wydaje się nie nadają się do rzeczywistych aplikacji predykcyjnych!); 2) standardowy model liniowy; 3) model mieszany przy stosowaniu prognoz na poziomie populacji (czyli z wyrzucanymi losowymi efektami). Zatem jedyną różnicą między standardowym modelem liniowym a modelem mieszanym jest nieco inna wartość współczynników z powodu różnych metod szacowania (tj. Istnieją te same efekty / predyktory w obu modelach, ale mają one różne powiązane współczynniki).
Moje zamieszanie sprowadza się zatem do pytania, dlaczego miałbym kiedykolwiek używać modelu mieszanego jako modelu predykcyjnego, skoro stosowanie modelu mieszanego do generowania prognoz na poziomie populacji wydaje się być gorszą strategią w porównaniu ze standardowym modelem liniowym.