W jednym zdaniu
Modelowanie predykcyjne polega na „tym, co może się zdarzyć?”, Podczas gdy modelowanie wyjaśniające dotyczy „co możemy z tym zrobić?”
W wielu zdaniach
Myślę, że główna różnica polega na tym, co należy zrobić z analizą. Sugerowałbym, że wyjaśnienie jest znacznie ważniejsze dla interwencji niż przewidywanie. Jeśli chcesz zrobić coś, aby zmienić wynik, najlepiej staraj się wyjaśnić, dlaczego tak jest. Modelowanie objaśniające, jeśli zostanie wykonane dobrze, powie Ci, jak interweniować (które dane wejściowe należy dostosować). Jeśli jednak chcesz po prostu zrozumieć, jaka będzie przyszłość, bez zamiaru (lub zdolności) do interwencji, modelowanie predykcyjne jest bardziej prawdopodobne.
Jako niewiarygodnie luźny przykład, wykorzystujący „dane dotyczące raka”.
Modelowanie predykcyjne z wykorzystaniem „danych na temat raka” byłoby odpowiednie (a przynajmniej przydatne), gdybyś finansował oddziały raka różnych szpitali. Naprawdę nie musisz wyjaśniać, dlaczego ludzie chorują na raka, potrzebujesz jedynie dokładnego oszacowania, ile usług będzie wymaganych. Modelowanie objaśniające prawdopodobnie niewiele by tu pomogło. Na przykład wiedza o tym, że palenie prowadzi do wyższego ryzyka raka, sama w sobie nie mówi, czy należy przeznaczyć więcej środków na oddział A czy oddział B.
Objaśniające modelowanie „danych na temat raka” byłoby właściwe, gdybyś chciał zmniejszyć ogólnokrajowy wskaźnik zachorowań na raka - modelowanie predykcyjne byłoby tutaj dość przestarzałe. Zdolność do dokładnego przewidywania zachorowań na raka raczej nie pomoże ci zdecydować, jak ją zmniejszyć. Jednak wiedza, że palenie prowadzi do wyższego ryzyka zachorowania na raka, jest cenną informacją - ponieważ jeśli zmniejszysz częstość palenia (np. Zwiększając koszty papierosów), prowadzi to do większej liczby osób o mniejszym ryzyku, co (miejmy nadzieję) prowadzi do oczekiwanego zmniejszenia zachorowalności na raka stawki.
Patrząc na ten problem w ten sposób, sądzę, że modelowanie objaśniające skupiałoby się głównie na zmiennych, które kontrolują użytkownik, bezpośrednio lub pośrednio. Może zaistnieć potrzeba zebrania innych zmiennych, ale jeśli nie możesz zmienić żadnej ze zmiennych w analizie, wątpię, aby modelowanie objaśniające było przydatne, z wyjątkiem może dającego chęć uzyskania kontroli lub wpływu na te zmienne które są ważne. Modelowanie predykcyjne, z grubsza, po prostu szuka powiązań między zmiennymi, niezależnie od tego, czy są kontrolowane przez użytkownika, czy nie. Musisz tylko znać dane wejściowe / cechy / zmienne niezależne / itp., Aby dokonać prognozy, ale musisz mieć możliwość modyfikowania lub wpływania na dane wejściowe / cechy / zmienne niezależne / itp. W celu interwencji i zmiany wyniku .