Wiele osób ma doskonałe odpowiedzi, oto moje 0,02 $.
Istnieją dwa sposoby spojrzenia na „najlepszy model” lub „wybór modelu”, mówiąc statystycznie:
1 Wyjaśnienie, które jest tak proste, jak to możliwe, ale nie prostsze (Attrib. Einstein)
- This is also called Occam's Razor, as explanation applies here.
- Have a concept of True model or a model which approximates the truth
- Explanation is like doing scientific research
2 Prognozowanie to zainteresowanie, podobne do rozwoju inżynierii.
- Prediction is the aim, and all that matters is that the model works
- Model choice should be based on quality of predictions
- Cf: Ein-Dor, P. & Feldmesser, J. (1987) Attributes of the performance of central processing units: a relative performance prediction model. Communications of the ACM 30, 308–317.
Powszechna (błędna) koncepcja:
Wybór modelu jest równoznaczny z wyborem najlepszego modelu
Dla wyjaśnienia powinniśmy być czujni, aby istniała możliwość istnienia kilku (z grubsza) równie dobrych modeli objaśniających. Prostota pomaga zarówno w komunikowaniu pojęć zawartych w modelu, jak i w tym, co psychologowie nazywają uogólnieniem, umiejętnością „pracy” w scenariuszach bardzo odmiennych od tych, w których model był badany. Jest więc premia za kilka modeli.
Do przewidywania: dobrą analogią (doktora Ripleya) jest wybór między opiniami ekspertów: jeśli masz dostęp do dużego panelu ekspertów, jak wykorzystałbyś ich opinie?
Cross Validation zajmuje się aspektem przewidywania. Aby uzyskać szczegółowe informacje na temat CV, zapoznaj się z prezentacją dr. BD Ripleya Prezentacja dr. Briana D. Ripleya na temat wyboru modelu
Cytat: Należy pamiętać, że wszystko w tej odpowiedzi pochodzi z cytowanej powyżej prezentacji. Jestem wielkim fanem tej prezentacji i podoba mi się. Inne opinie mogą się różnić. Tytuł prezentacji brzmi: „Wybór wśród dużych klas modeli” i został wygłoszony na Sympozjum ku czci 80. urodzin Johna Neldera, Imperial College, 29/30 marca 2004 r. Przez dr Briana D. Ripleya.