Tak, możesz i tak właśnie robi pakiet R GLMNET dla wielomianowej regresji logistycznej. Zapisywanie funkcji wiarygodności dziennika jako:
LogL=∑i∑cniclog(pic)
Gdzie oznacza obserwacje, a oznacza kategorie wielomianowe to obserwowana liczba obserwacji w kategorii . Obserwacje są zdefiniowane przez ich unikalne kombinacje zmiennych towarzyszących - lub alternatywnie możemy zezwolić na duplikaty i ustawić każde , abyśmy mieli kategoryczne dane „binarne” (.... nie wiem, co to jest liczba mnoga binarna). ...) Dla regresji logistycznej prawdopodobieństwa są zdefiniowane jako:c n i c i c n i c = 1icnicicnic=1
pic=exp(xTiβc)∑c′exp(xTiβc′)
Jest to parametryzacja niepełna rangi i może być użyteczna, jeśli używasz prawdopodobieństwa karanego (takiego jak GLMNET). Zasadniczo moglibyśmy użyć IRLS / newton rhapson na pełnej macierzy beta , jednak otrzymacie macierze nie przekątnej. Alternatywnie możemy zoptymalizować „styl Gibbsa”, ustawiając wszystkie kategorie bet z wyjątkiem jednej, a następnie optymalizując nieco powyżej tej kategorii. Następnie przejdź do następnej kategorii i tak dalej. Widać to, ponieważ prawdopodobieństwa mają formę(β1,…,βC)
pic′=B
pic=exp(xTiβc)exp(xTiβc)+A where ∂A∂βc=0
pic′=Bexp(xTiβc)+A where ∂B∂βc=0
Że kwadratowe rozwinięcie o będzie miało taką samą formę jak dla regresji logistycznej, ale z wagami IRLS obliczonymi inaczej - chociaż nadal mamy w zwykłej aktualizacji wersji beta.βcWii,c=nicpic(1−pic)(XTWX)−1XTWY