Mam pytanie dotyczące pominiętej zmienności stronniczej w regresji logistycznej i liniowej. Powiedzmy, że pomijam niektóre zmienne z modelu regresji liniowej. Udawaj, że te pominięte zmienne nie są skorelowane ze zmiennymi, które zawarłem w moim modelu. Te pominięte zmienne nie wpływają na współczynniki w moim modelu. Ale w regresji logistycznej właśnie …
Uruchomiłem tę porządkową regresję logistyczną w R: mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars) Mam to podsumowanie modelu: summary(mtcars_ordinal) Re-fitting to get Hessian Call: polr(formula = as.factor(carb) ~ mpg, data = mtcars) Coefficients: Value Std. Error t value mpg -0.2335 0.06855 -3.406 Intercepts: Value Std. Error t value 1|2 -6.4706 1.6443 …
Mam dwie grupy badanych, A i B, każda o wielkości około 400 i około 300 predyktorów. Moim celem jest zbudowanie modelu predykcyjnego dla zmiennej odpowiedzi binarnej. Mój klient chce zobaczyć wynik zastosowania modelu zbudowanego z A na B. (W swojej książce „Strategie modelowania regresji” @FrankHarrell wspomina, że lepiej jest połączyć …
Pracujemy z pewnymi regresjami logistycznymi i zdaliśmy sobie sprawę, że średnie oszacowane prawdopodobieństwo zawsze równa jest proporcji jednych w próbie; to znaczy, średnia dopasowanych wartości jest równa średniej próbki. Czy ktoś może mi wyjaśnić przyczynę lub podać źródło, w którym mogę znaleźć tę demonstrację?
Mam dopasowany model (z literatury). Mam również surowe dane dla zmiennych predykcyjnych. Jakie równanie powinienem zastosować, aby uzyskać prawdopodobieństwa? Zasadniczo, jak połączyć surowe dane i współczynniki, aby uzyskać prawdopodobieństwa?
Mam nadzieję, że mogę zadać to pytanie w prawidłowy sposób. Mam dostęp do play-by-play danych, więc jest to większy problem z najlepszym podejściem i konstruowania dane poprawnie. Co szukam zrobić to obliczyć prawdopodobieństwo wygranej jest NHL gra dany wynik i czas pozostały do rozporządzenia. I postać mogę używać regresji logistycznej, …
Aby skalibrować poziom ufności do prawdopodobieństwa w nadzorowanym uczeniu się (powiedzmy, aby odwzorować pewność z SVM lub drzewa decyzyjnego przy użyciu danych z nadpróbkowanych danych) jedną z metod jest zastosowanie skalowania Platta (np. Uzyskiwanie skalibrowanych prawdopodobieństw z wzmocnienia ). Zasadniczo używa się regresji logistycznej do mapowania na . Zmienna zależna …
Dane podstawowe : mam ~ 1000 osób oznaczonych ocenami: „1”, „dobry”, „2”, „środkowy] lub„ 3 ”[zły] - to wartości, które staram się przewidzieć dla ludzi w przyszłości . Oprócz tego mam pewne informacje demograficzne: płeć (kategorycznie: M / K), wiek (liczbowo: 17-80) i rasę (kategorycznie: czarny / kaukaski / latino). …
Grupa osób odpowiada na jedno pytanie. Odpowiedź może brzmieć „tak” lub „nie”. Badacz chce wiedzieć, czy wiek jest związany z rodzajem odpowiedzi. Powiązanie oceniono za pomocą regresji logistycznej, w której wiek jest zmienną objaśniającą, a typ odpowiedzi (tak, nie) jest zmienną zależną. Rozwiązano to osobno, obliczając średni wiek grup, które …
W moim badaniu będę mierzyć obciążenie pracą za pomocą kilku wskaźników. Ze zmiennością tętna (HRV), aktywnością elektrodową (EDA) i ze skalą subiektywną (IWS). Po normalizacji IWS ma trzy wartości: Obciążenie pracą niższe niż normalnie Obciążenie pracą jest średnie Nakład pracy jest większy niż zwykle. Chcę zobaczyć, jak dobrze środki fizjologiczne …
Pytanie Staram się zrozumieć, w jaki sposób prognoza jest utrzymywana w przedziale [0,1][0,1][0,1] podczas klasyfikacji binarnej z funkcją wzmocnienia gradientu. Załóżmy, że pracujemy nad problemem klasyfikacji binarnej, a naszą funkcją celu jest utrata logów, −∑yilog(Hm(xi))+(1−yi)log(1−Hm(xi))−∑yilog(Hm(xi))+(1−yi)log(1−Hm(xi))-\sum y_i \log(H_m(x_i)) + (1-y_i) \log(1-H_m(x_i)) , gdzie yyy jest zmienną docelową a jest naszym obecnym …
Próbuję użyć straty kwadratowej, aby dokonać klasyfikacji binarnej na zestawie danych zabawki. Korzystam z mtcarszestawu danych, wykorzystuję milę na galon i wagę, aby przewidzieć rodzaj transmisji. Poniższy wykres pokazuje dwa typy danych typu transmisji w różnych kolorach oraz granicę decyzji wygenerowaną przez inną funkcję strat. Kwadratowa strata wynosi ∑i(yi−pi)2∑ja(yja-pja)2)\sum_i (y_i-p_i)^2 …
Wiem, że znormalizowane pozostałości Pearson uzyskuje się w tradycyjny probabilistyczny sposób: ri=yi−πiπi(1−πi)−−−−−---√rja=yja-πjaπja(1-πja) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} i Pozostałości dewiacji są uzyskiwane w bardziej statystyczny sposób (udział każdego punktu w prawdopodobieństwie): reja= sja- 2 [ yjalogπja^+(1−yi)log(1−πi)]−−−−−−−−−−−−−−−−−−−−−−−−−−√di=si−2[yilogπi^+(1−yi)log(1−πi)] d_i = s_i \sqrt{-2[y_i \log \hat{\pi_i} + (1 - y_i)\log(1-\pi_i)]} gdzie sisis_i = 1 jeśli yiyiy_i …
Jak rozumiem, sztuczna sieć neuronowa perceptron / jednowarstwowa z funkcją aktywacji logistycznej sigmoidu jest tym samym modelem co regresja logistyczna. Oba modele podano w równaniu: F(x)=11−e−βXF(x)=11−e−βXF(x) = \frac{1}{1-e^{-\beta X}} Algorytm uczenia się perceptronu jest online i oparty na błędach, podczas gdy parametry regresji logistycznej można nauczyć przy użyciu różnych algorytmów …
Czy w logistycznej regresji trzeba być tak samo zaniepokojonym wielokoliniowością, jak w przypadku regresji OLS? Na przykład, w przypadku regresji logistycznej, w której występuje wielokoliniowość, czy trzeba być ostrożnym (podobnie jak w przypadku regresji OLS) przy wyciąganiu wniosków ze współczynników Beta? W przypadku regresji OLS jedną „poprawką” wysokiej wielokoliniowości jest …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.