Spotkałem niektórych statystyk, którzy nigdy nie używają modeli innych niż regresja liniowa do przewidywania, ponieważ uważają, że „modele ML”, takie jak losowy wzrost lasu lub zwiększenie gradientu, są trudne do wyjaśnienia lub „niemożliwe do interpretacji”.
W regresji liniowej, biorąc pod uwagę, że zestaw założeń jest weryfikowany (normalność błędów, homoskedastyczność, brak wielokoliniowości), testy t zapewniają sposób przetestowania znaczenia zmiennych, testy, które według mojej wiedzy nie są dostępne w losowe lasy lub modele zwiększające gradient.
Dlatego mam pytanie, czy chcę modelować zmienną zależną za pomocą zestawu zmiennych niezależnych, czy ze względu na interpretację powinienem zawsze używać regresji liniowej?