Obecnie pracuję nad problemem, w którym mamy niewielki zestaw danych i interesuje mnie wpływ przyczynowy leczenia na wynik.
Mój doradca polecił mi wykonać regresję jednowymiarową na każdym predyktorze z wynikiem jako odpowiedzią, a następnie przypisaniem leczenia jako odpowiedzią. Tzn. Poproszono mnie o dopasowanie regresji do jednej zmiennej na raz i sporządzenie tabeli wyników. Zapytałem „dlaczego powinniśmy to zrobić?”, A odpowiedź brzmiała: „jesteśmy zainteresowani, które czynniki predykcyjne są związane z przypisaniem do leczenia i jego wynikiem, ponieważ prawdopodobnie oznaczałoby to zamieszanie”. Mój doradca jest wyszkolonym statystykiem, a nie naukowcem z innej dziedziny, więc jestem skłonny im zaufać.
Ma to sens, ale nie jest jasne, jak wykorzystać wynik analizy jednowymiarowej. Czy wybranie z tego modelu wyboru modelu nie spowodowałoby istotnego błędu szacunków i wąskich przedziałów ufności? Dlaczego ktoś miałby to robić? Jestem zdezorientowany, a mój doradca jest dość niejasny w tej kwestii, kiedy ją poruszam. Czy ktoś ma zasoby na temat tej techniki?
(Uwaga: mój doradca powiedział, że NIE używamy wartości p jako wartości odcięcia, ale chcemy rozważyć „wszystko”).