Moje pytanie brzmi: jaki jest matematyczny związek między rozkładem Beta a współczynnikami modelu regresji logistycznej ? Aby zilustrować: funkcję logistyczną (sigmoid) podano przez f(x)=11+exp(−x)f(x)=11+exp(−x)f(x) = \frac{1}{1+\exp(-x)} i służy do modelowania prawdopodobieństw w modelu regresji logistycznej. Niech AAA będzie wynikiem dychotomicznym (0,1)(0,1)(0,1) a XXX macierzą projektową. Model regresji logistycznej podano przez …
Ryc. 1. Funkcja logistyczna Ryc. 2. Funkcja sigmoidalna czy jest bardziej jak uogólniony rodzaj funkcji sigmoidalnej, w którym można mieć wyższą wartość maksymalną?
Znalazłem zalety analizy dyskryminacyjnej i mam pytania na ich temat. Więc: Gdy klasy są dobrze rozdzielone, oszacowania parametrów regresji logistycznej są zaskakująco niestabilne. Współczynniki mogą sięgać nieskończoności. LDA nie cierpi z powodu tego problemu. Jeśli liczba cech jest niewielka, a rozkład predyktorów XXX jest w przybliżeniu normalny w każdej z …
W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji logistycznej? Wszystkie oznaczenia widziałem nie może pozbyć się suma nad wszystkimi punktami …
Zrobiłem model regresji logistycznej używając glm w R. Mam dwie niezależne zmienne. Jak wykreślić granicę decyzyjną mojego modelu na wykresie rozrzutu dwóch zmiennych. Na przykład, jak wykreślić rysunek taki jak: http://onlinecourses.science.psu.edu/stat557/node/55 Dzięki.
Wydaje mi się, że mam pewne podstawowe zamieszanie co do działania funkcji w regresji logistycznej (a może po prostu funkcjonuje jako całość). Jak to się dzieje, że funkcja h (x) tworzy krzywą widoczną po lewej stronie obrazu? Widzę, że jest to wykres dwóch zmiennych, ale te dwie zmienne (x1 i …
Próbuję użyć, lme4::glmer()aby dopasować dwumianowy uogólniony model mieszany (GLMM) ze zmienną zależną, która nie jest binarna, ale zmienna ciągła od zera do jednego. Można myśleć o tej zmiennej jako o prawdopodobieństwie; w rzeczywistości jest to prawdopodobieństwo zgłaszane przez ludzi (w eksperymencie, który pomagam analizować). Tj. Nie jest to ułamek „dyskretny”, …
Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
Powiedzmy, że mamy następujący problem: Wytypuj, którzy klienci najprawdopodobniej przestaną kupować w naszym sklepie w ciągu najbliższych 3 miesięcy. Dla każdego klienta znamy miesiąc, w którym zaczęliśmy kupować w naszym sklepie, a ponadto mamy wiele funkcji behawioralnych w agregatach miesięcznych. „Najstarszy” klient kupuje od pięćdziesięciu miesięcy; oznaczmy czas, od którego …
Myślałem o tym problemie. Zwykłą funkcją logistyczną do modelowania danych binarnych jest: Jednak czy funkcja logit, która jest krzywą w kształcie litery S, zawsze jest najlepsza do modelowania danych? Być może masz powód, by sądzić, że twoje dane nie są zgodne z normalną krzywą w kształcie litery S, ale z …
W moim projekcie chcę stworzyć model regresji logistycznej do przewidywania klasyfikacji binarnej (1 lub 0). Mam 15 zmiennych, z których 2 są kategoryczne, a pozostałe są mieszaniną zmiennych ciągłych i dyskretnych. Aby dopasować model regresji logistycznej, zalecono mi sprawdzenie liniowej separowalności za pomocą SVM, perceptronu lub programowania liniowego. Jest to …
Próbuję powielić wyniki z sklearnbiblioteki regresji logistycznej przy użyciu glmnetpakietu w języku R. Z dokumentacjisklearn regresji logistycznej próbuje zminimalizować funkcję kosztu w ramach kary l2 minw , c12)wT.w + C∑i = 1N.log( exp( - yja( XT.jaw + c ) ) + 1 )minw,do12)wT.w+do∑ja=1N.log(exp(-yja(XjaT.w+do))+1)\min_{w,c} \frac12 w^Tw + C\sum_{i=1}^N \log(\exp(-y_i(X_i^Tw+c)) + 1) …
Mam trudności z wyprowadzeniem Hesji funkcji celu, , w regresji logistycznej, gdzie wynosi: l(θ)l(θ)l(\theta)l(θ)l(θ)l(\theta)l(θ)=∑i=1m[yilog(hθ(xi))+(1−yi)log(1−hθ(xi))]l(θ)=∑i=1m[yilog(hθ(xi))+(1−yi)log(1−hθ(xi))] l(\theta)=\sum_{i=1}^{m} \left[y_{i} \log(h_\theta(x_{i})) + (1- y_{i}) \log (1 - h_\theta(x_{i}))\right] hθ(x)hθ(x)h_\theta(x) to funkcja logistyczna. Hessian to . Próbowałem to wyliczyć, obliczając , ale wtedy nie było dla mnie oczywiste, jak dostać się do notacji macierzowej z …
Niedawno otrzymałem następujące pytanie przez e-mail. Odpowiem poniżej, ale chciałem usłyszeć, co myślą inni. Czy nazwałbyś regresję logistyczną testem nieparametrycznym? Rozumiem, że samo oznaczenie testu nieparametrycznego, ponieważ jego dane nie są normalnie dystrybuowane, jest niewystarczające. Chodzi raczej o brak założeń. regresja logistyczna ma założenia.
Czy właściwe jest wykonanie regresji logistycznej, w której zmienne zależne i niezależne są binarne? na przykład zmienną zależną jest 0 i 1, a predyktorami są zmienne kodowane kontrastowo -1 i 1?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.