W kontekście nauk społecznych, z którego pochodzę, problemem jest to, czy interesuje Cię (a) przewidywanie lub (b) testowanie ukierunkowanego pytania badawczego. Jeśli celem jest przewidywanie, odpowiednie są podejścia oparte na danych. Jeśli celem jest zbadanie ukierunkowanego pytania badawczego, ważne jest, aby rozważyć, który model regresji konkretnie testuje twoje pytanie.
Na przykład, jeśli Twoim zadaniem było wybranie zestawu testów selekcyjnych do przewidywania wydajności pracy, cel może w pewnym sensie być postrzegany jako maksymalizacja przewidywania wydajności pracy. Przydatne byłyby zatem podejścia oparte na danych.
Natomiast jeśli chcesz zrozumieć względną rolę zmiennych osobowości i zmiennych zdolności w wpływie na wydajność, bardziej odpowiednie może być podejście oparte na porównywaniu modeli.
Zazwyczaj podczas badania szczegółowych pytań badawczych celem jest wyjaśnienie podstawowych procesów przyczynowych, które działają, w przeciwieństwie do opracowania modelu z optymalną prognozą.
Gdy jestem w trakcie opracowywania modeli dotyczących procesów opartych na danych przekrojowych, uważałbym na: (a) uwzględnianie predyktorów, które teoretycznie można by traktować jako konsekwencje zmiennej wynikowej. Na przykład przekonanie osoby, że jest dobrym wykonawcą, jest dobrym prognostykiem wydajności pracy, ale jest prawdopodobne, że jest to przynajmniej częściowo spowodowane faktem, że zaobserwowała ona własne wyniki. (b) obejmujący dużą liczbę predyktorów, które odzwierciedlają te same podstawowe zjawiska. Np. W tym 20 pozycji, z których każda mierzy satysfakcję z życia na różne sposoby.
Tak więc skoncentrowane pytania badawcze opierają się w większym stopniu na wiedzy specyficznej dla danej dziedziny. To prawdopodobnie tłumaczy, dlaczego podejścia oparte na danych są rzadziej stosowane w naukach społecznych.