Chcę modelować regresję logistyczną z niezrównoważonymi danymi (9: 1). Chciałem wypróbować opcję wag w glmfunkcji w R, ale nie jestem w 100% pewien, co ona robi.
Powiedzmy, że moja zmienna wyjściowa to c(0,0,0,0,0,0,0,0,0,1). teraz chcę nadać „1” 10-krotnie większą wagę. więc podaję argument wagi weights=c(1,1,1,1,1,1,1,1,1,1,1,10).
Gdy to zrobię, zostanie to wzięte pod uwagę przy obliczaniu maksymalnego prawdopodobieństwa. Czy mam rację? błędna klasyfikacja „1” jest tylko 10 razy gorsza niż błędne sklasyfikowanie „0”.