Mam duży zbiorczy zestaw danych rynkowych dotyczących sprzedaży wina w USA i chciałbym oszacować popyt na niektóre wina wysokiej jakości. Te udziały w rynku zostały zasadniczo wyprowadzone z losowego modelu użytkowego w postaci Uja j t= X′j tβ- α pj t+ ξj t+ ϵja j t≡ δj t+ ϵj tUijt=Xjt′β−αpjt+ξjt+ϵijt≡δjt+ϵjtU_{ijt} …
Jest dla mnie jasne i dobrze wyjaśnione na wielu stronach, jakie informacje wartości na przekątnej macierzy kapelusza dają regresję liniową. Macierz kapeluszowa modelu regresji logistycznej jest dla mnie mniej jasna. Czy jest identyczny z informacjami uzyskanymi z matrycy kapelusza przy zastosowaniu regresji liniowej? Oto definicja macierzy kapelusza, którą znalazłem na …
Skorelowałem dane i używam modelu mieszanych efektów regresji logistycznej do oszacowania indywidualnego (warunkowego) efektu dla predyktora zainteresowania. Wiem, że w przypadku standardowych modeli brzeżnych wnioskowanie na temat parametrów modelu za pomocą testu Walda jest spójne dla współczynników prawdopodobieństwa i testów punktowych. Zazwyczaj są one w przybliżeniu takie same. Ponieważ Wald …
Mam zestaw danych z 8000 klastrami i 4 milionami obserwacji. Niestety moje oprogramowanie statystyczne, Stata, działa dość wolno, gdy używa swojej funkcji danych panelowych do regresji logistycznej: xtlogitnawet z podpróbką 10%. Jednak w przypadku korzystania z logitfunkcji niepanelowej wyniki pojawiają się znacznie wcześniej. Dlatego mogę korzystać ze logitzmodyfikowanych danych uwzględniających …
Czy możemy interpretować późniejsze prawdopodobieństwo uzyskane z klasyfikatora, który generuje przewidywaną wartość klasy i prawdopodobieństwo (na przykład regresję logistyczną lub Naive Bayesa) jako pewnego rodzaju wynik ufności przypisany do tej przewidywanej wartości klasy?
To pytanie jest dość ogólne i wyczerpujące, ale proszę o wyrozumiałość. W mojej aplikacji mam wiele zestawów danych, z których każdy składa się z ~ 20 000 punktów danych z ~ 50 funkcjami i jedną zależną zmienną binarną. Usiłuję modelować zestawy danych przy użyciu regularnej regresji logistycznej (pakiet R glmnet …
Mam następującą funkcję prawdopodobieństwa: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} gdzie z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. Mój model wygląda Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} Jest to wizualizowane za pomocą krzywej prawdopodobieństwa, która wygląda jak ta poniżej. Zastanawiam się nad dodaniem kilku zmiennych do mojego pierwotnego …
W poprzednim poście zastanawiałem się, jak radzić sobie z wynikami EQ-5D . Ostatnio natknąłem się na logistyczną regresję kwantyli zaproponowaną przez Bottai i McKeown, która wprowadza elegancki sposób radzenia sobie z ograniczonymi rezultatami. Formuła jest prosta: l o gi t ( y) = l o g( y- ym i nym …
Oto lista współczynników regresji logistycznej (pierwszy to przechwycenie) -1059.61966694592 -1.23890500515482 -8.57185269220438 -7.50413155570413 0 1.03152408392552 1.19874787949191 -4.88083274930613 -5.77172565873336 -1.00610998453393 Dziwne wydaje mi się, że przecięcie jest tak niskie i mam współczynnik, który w rzeczywistości jest równy 0. Nie jestem w pełni pewien, jak bym to zinterpretował. Czy 0 wskazuje, że konkretna …
Jeśli Hosmer-Lemeshow wskazuje na brak dopasowania, ale AIC jest najniższy spośród wszystkich modeli ... czy nadal powinieneś używać tego modelu? Jeśli usunę zmienną, statystyka Hosmera-Lemeshowa nie będzie znacząca (co oznacza, że nie ma rażącego braku dopasowania). Ale AIC wzrasta. Edycja : Ogólnie myślę, że jeśli AIC różnych modeli są sobie …
Istnieją różne metody przewidywania zmiennych porządkowych i kategorialnych. Nie rozumiem, jak ważne jest to rozróżnienie. Czy istnieje prosty przykład, który może wyjaśnić, co się stanie, jeśli złożę zamówienie? W jakich okolicznościach to nie ma znaczenia? Na przykład, jeśli wszystkie zmienne niezależne również są kategoryczne / porządkowe, czy byłaby różnica? To …
Pełne ujawnienie: To zadanie domowe. Zamieściłem link do zestawu danych ( http://www.bertelsen.ca/R/logistic-regression.sav ) Moim celem jest zmaksymalizowanie prognozy osób spłacających zaległości kredytowe w tym zbiorze danych. Każdy model, który do tej pory wymyśliłem, przewiduje> 90% domyślnych, ale <40% domyślnych, co daje ogólną skuteczność klasyfikacji ~ 80%. Zastanawiam się więc, czy …
Zaprogramowałem regresję logistyczną przy użyciu algorytmu IRLS . Chciałbym zastosować karę LASSO , aby automatycznie wybrać odpowiednie funkcje. Przy każdej iteracji rozwiązuje się następujące kwestie: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Niech będzie nieujemną liczbą rzeczywistą. Nie penalizuję przechwytywania, jak sugerowano w The Elements of. Nauka statystyczna . To samo dotyczy już zerowych współczynników. …
Chciałbym zrozumieć, co robi następujący kod. Osoba, która napisała kod, już tu nie pracuje i jest prawie całkowicie nieudokumentowana. Zostałem poproszony o zbadanie go przez kogoś, kto myśli „ to bayesowski model regresji logistycznej ” bglm <- function(Y,X) { # Y is a vector of binary responses # X is …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.