W standardowej wielokrotnej regresji liniowej zdolność dopasowania szacunków zwykłych najmniejszych kwadratów (OLS) w dwóch krokach pochodzi z twierdzenia Frisch – Waugh – Lovell . Twierdzenie to pokazuje, że oszacowanie współczynnika dla konkretnego predyktora w wielokrotnym modelu liniowym jest równe oszacowaniu uzyskanemu przez regresję reszt odpowiedzi (reszt z regresji zmiennej odpowiedzi względem innych zmiennych objaśniających) względem reszt predyktora (reszty z regresji zmiennej predykcyjnej względem innych zmiennych objaśniających). Najwyraźniej poszukujesz analogii do tego twierdzenia, którą można zastosować w modelu regresji logistycznej.
W przypadku tego pytania pomocne jest przypomnienie charakterystyki ukrytej zmiennej regresji logistycznej :
Yi=I(Y∗i>0)Y∗i=β0+βXxi+βZzi+εiεi∼IID Logistic(0,1).
W tej charakterystyce modelu zmienna utajona odpowiedź jest nieobserwowalna, a zamiast tego obserwujemy wskaźnik który mówi nam, czy utajona odpowiedź jest dodatnia. Ta forma modelu wygląda podobnie do wielokrotnej regresji liniowej, z tym wyjątkiem, że stosujemy nieco inny rozkład błędów (rozkład logistyczny zamiast rozkładu normalnego), a co ważniejsze, obserwujemy tylko wskaźnik pokazujący, czy ukryta odpowiedź jest dodatnia, czy nie .Y∗iYi
Stwarza to problem przy każdej próbie utworzenia dwuetapowego dopasowania modelu. To twierdzenie Frisch-Waugh-Lovell opiera się na zdolności do uzyskiwania pośrednich reszt dla odpowiedzi i predyktora zainteresowania w porównaniu z innymi zmiennymi objaśniającymi. W niniejszym przypadku resztki możemy uzyskać jedynie ze „skategoryzowanej” zmiennej odpowiedzi. Utworzenie dwuetapowego procesu dopasowania dla regresji logistycznej wymagałoby użycia resztkowych odpowiedzi z tej skategoryzowanej zmiennej odpowiedzi, bez dostępu do ukrytej odpowiedzi leżącej u podstaw. Wydaje mi się to poważną przeszkodą i chociaż nie okazuje się to niemożliwe, wydaje się, że niemożliwe jest dopasowanie modelu w dwóch etapach.
Poniżej przedstawię opis tego, co byłoby wymagane, aby znaleźć dwuetapowy proces dopasowywania do regresji logistycznej. Nie jestem pewien, czy istnieje rozwiązanie tego problemu, czy też istnieje dowód niemożliwości, ale materiał tutaj powinien pomóc ci zrozumieć, co jest wymagane.
Jak wyglądałoby dopasowanie dwuetapowej regresji logistycznej? Załóżmy, że chcemy skonstruować dwuetapowe dopasowanie do modelu regresji logistycznej, w którym parametry są szacowane za pomocą oszacowania maksymalnego prawdopodobieństwa na każdym etapie. Chcemy, aby proces obejmował etap pośredni, który pasuje do następujących dwóch modeli:
Yi=I(Y∗∗i>0)Y∗∗i=α0+αXxi+τi Zi=γ0+γXxi+δiτi∼IID Logistic(0,1),δi∼IID g.
Szacujemy współczynniki tych modeli (za pośrednictwem MLE), co daje wartości dopasowania pośredniego . Następnie w drugim kroku dopasowujemy model:α^0,α^X,γ^0,γ^X
Yi=logistic(α^0+α^1xi)+βZ(zi−γ^0−γ^Xxi)+ϵiϵi∼IID f.
Jak podano, procedura ma wiele stałych elementów, ale funkcje gęstości i w tych krokach pozostają nieokreślone (chociaż powinny to być rozkłady o zerowej średniej, które nie zależą od danych). Aby uzyskać dwuetapową metodę dopasowania przy tych ograniczeniach, musimy wybrać i aby upewnić się, że MLE dla w tym dwustopniowym algorytmie dopasowania modelu jest taki sam, jak MLE uzyskany z jednoetapowego modelu regresji logistycznej powyżej.gfgfβZ
Aby sprawdzić, czy jest to możliwe, najpierw piszemy wszystkie oszacowane parametry z pierwszego kroku:
ℓy|x(α^0,α^X)ℓz|x(γ^0,γ^X)=maxα0,αX∑i=1nlnBern(yi|logistic(α0+αXxi)),=maxγ0,γX∑i=1nlng(zi−γ0−γXxi).
Niech , aby funkcja logarytmu wiarygodności dla drugiego kroku była:ϵi=yi−logistic(α^0−α^1xi)+βZ(zi−γ^0−γ^Xxi)
ℓy|z|x(βZ)=∑i=1nlnf(yi−logistic(α^0−α^1xi)+βZ(zi−γ^0−γ^Xxi)).
Wymagamy, aby maksymalizującą wartość tej funkcji był MLE modelu wielokrotnej regresji logistycznej. Innymi słowy wymagamy:
arg max βXℓy|z|x(βZ)=arg max βXmaxβ0,βZ∑i=1nlnBern(yi|logistic(β0+βXxi+βZzi)).
Pozostawiam to innym do ustalenia, czy istnieje rozwiązanie tego problemu, czy dowód braku rozwiązania. Podejrzewam, że „kategoryzacja” zmiennej utajonej odpowiedzi w regresji logistycznej uniemożliwi znalezienie dwuetapowego procesu.