Jeśli ma więcej niż dwie kategorie, twoje pytanie o „przewagę” jednej regresji nad drugą jest prawdopodobnie pozbawione sensu, jeśli zamierzasz porównać parametry modeli , ponieważ modele będą się zasadniczo różnić:Y
dla każdegoıbinarnego logistycznejregresji ilogP(i)P(not i)=logiti=linear combinationi
dla każdegoıkategorii,stwardnienie logistycznejregresjiRjest wybranej kategorii odniesienia (I≠R).logP(i)P(r)=logiti=linear combinationiri≠r
Jeśli jednak Twoim celem jest jedynie przewidywanie prawdopodobieństwa każdej kategorii każde z tych podejść jest uzasadnione, chociaż mogą one dawać różne szacunki prawdopodobieństwa. Wzór na oszacowanie prawdopodobieństwa jest ogólny:i
, gdziei,j,…,rsą wszystkimi kategoriami , a jeślirwybrano jako referencyjny, jegoexp(logP′(i)=exp(logiti)exp(logiti)+exp(logitj)+⋯+exp(logitr)i,j,…,rr . Tak więc dla logiki binarnej ta sama formuła staje się P ′ ( i ) = e x p ( l o g i t i )exp(logit)=1 . Logistyka wielomianowa opiera się na (nie zawsze realistycznym) założeniuniezależności nieistotnych alternatyw,podczas gdy szereg binarnych prognoz logistycznych nie.P′(i)=exp(logiti)exp(logiti)+1
Osobnym tematem są techniczne różnice między wielomianowymi i binarnymi regresjami logistycznymi w przypadku, gdy jest dychotomiczny . Czy będą jakieś różnice w wynikach? Przez większość czasu przy braku zmiennych towarzyszących wyniki będą takie same, jednak istnieją różnice w algorytmach i opcjach wyjściowych. Pozwólcie, że zacytuję Pomoc SPSS na ten temat w SPSS:Y
Modele binarnej regresji logistycznej można dopasować przy użyciu procedury regresji logistycznej lub procedury wielomianowej regresji logistycznej. Każda procedura ma opcje niedostępne w drugiej. Ważnym teoretycznym rozróżnieniem jest to, że procedura regresji logistycznej generuje wszystkie prognozy, wartości rezydualne, statystyki wpływu i testy dobroci dopasowania z wykorzystaniem danych na poziomie poszczególnych przypadków, niezależnie od tego, jak dane są wprowadzane i czy liczba wzorców towarzyszących jest mniejsza niż całkowita liczba przypadków, podczas gdy procedura wielomianowej regresji logistycznej wewnętrznie agreguje przypadki, tworząc subpopulacje o identycznych wzorcach zmiennych dla predyktorów, tworząc prognozy, reszty i testy dobroci dopasowania oparte na tych subpopulacjach.
Regresja logistyczna zapewnia następujące unikalne funkcje:
• Test Hosmera-Lemeshowa na temat dopasowania modelu do modelu
• Analizy krok po kroku
• Kontrastuje w celu zdefiniowania parametryzacji modelu
• Alternatywne punkty cięcia dla klasyfikacji
• Wykresy klasyfikacyjne
• Model dopasowany do jednego zestawu skrzynek do wyciągniętego zestawu skrzynek
• Zapisuje prognozy, wartości resztkowe i statystyki wpływu
Wielomianowa regresja logistyczna zapewnia następujące unikalne funkcje:
• Testy chi-kwadrat Pearsona i dewiacji pod kątem dopasowania modelu
• Specyfikacja subpopulacji do grupowania danych w celu przeprowadzenia testów dopasowania
• Lista zliczeń, przewidywanych zliczeń i wartości resztowych według subpopulacji
• Korekta szacunków wariancji dla nadmiernej dyspersji
• Macierz kowariancji oszacowań parametrów
• Testy liniowych kombinacji parametrów
• Jawna specyfikacja modeli zagnieżdżonych
• Dopasuj 1-1 dopasowanych modeli warunkowej regresji logistycznej z wykorzystaniem zmiennych różnicowych