Miałem kilka pytań dotyczących interpretacji ilorazów szans dla zmiennych ciągłych w regresji logistycznej. Wydaje mi się, że są to podstawowe pytania dotyczące regresji logistycznej (i prawdopodobnie ogólnie regresji) i chociaż wstydzę się nieco, że nie znam odpowiedzi, przełknę dumę i zapytam, aby je poznać przyszłość!
Oto moja sytuacja ... Patrzę na próbę osądzonej młodzieży, która w ramach okresu próbnego została zapisana na program szkolenia umiejętności zawodowych / życiowych. Chciałem zobaczyć, w jakim stopniu wiek, w którym zostali zwolnieni z programu, przewidywał zatrudnienie sześć miesięcy po zwolnieniu z programu.
(Pamiętaj również, że w modelu są inne predyktory, ale je wykluczyłem, ponieważ nie są one istotne statystycznie i chcę, aby było to jak najbardziej jasne).
Predyktor: wiek zwolnienia z programu treningowego (średni wiek = 17,4, SD = 1,2, zakres 14,3-20,5)
Wynik: zatrudniony czy nie (zatrudniony = 1, niezatrudniony = 0)
Wynik: iloraz szans 3,01 (p <0,005) (wykluczyłem statystyki dopasowania, itp., Ponieważ szukam odpowiedzi tylko na interpretację ilorazu szans; czuję się komfortowo z oceną dopasowania modelu, CI itp.)
Ujmując to słowami: wraz ze wzrostem wieku o jeden rok szanse na zatrudnienie sześć miesięcy po zwolnieniu wzrastają o trzy jednostki.
Pytania:
1) Kiedy mówię „Kiedy wiek wzrasta o rok ...”, jaki jest punkt wyjścia do wieku?
Czy wiek zaczyna się od zera? Na przykład: „Gdy wiek rośnie od 0 [tj. Najniższy wiek, jeśli miałbyś umieścić ten model na wykresie] ...”
Czy wiek zaczyna się od najniższego wieku spośród przedziałów wiekowych w próbie? Na przykład „Wraz ze wzrostem wieku z 14,3 ...”
LUB
Czy wiek zaczyna się od średniego wieku próbki? Na przykład „Wraz ze wzrostem wieku z 17,4 ...”,
2) Czy centrowanie pomogłoby mi zinterpretować ten wynik LUB czy jest to skuteczne tylko w interpretacji y-int? Jeśli to pomogłoby, zastanawiałem się nad centralnym wycięciem lub odjęciem najniższego wieku w przedziale od wszystkich innych grup wiekowych w próbie. Jakieś sugestie?
3) Wreszcie, czy należy powiedzieć, że w porównaniu z 14-letnią młodzieżą 17-letnia młodzież ma 9-krotnie większe szanse na zatrudnienie? Pytam, bo wiem, że regresja logistyczna zakłada związek sigmoidalny i jestem ciekawa, czy ten wzrost szans o 3 jednostki pozostaje spójny w dowolnym punkcie wzdłuż linii regresji.
Dzięki wielkie!
Aaron