Statystyki i duże zbiory danych logistic

2

Symulacja analizy mocy regresji logistycznej - zaprojektowane eksperymenty

To pytanie jest odpowiedzią na odpowiedź udzieloną przez @Greg Snow na pytanie, które zadałem, dotyczące analizy mocy z regresją logistyczną i SAS Proc GLMPOWER. Jeśli projektuję eksperyment i przeanalizuję wyniki w silnej regresji logistycznej, jak mogę użyć symulacji (i tutaj ) do przeprowadzenia analizy mocy? Oto prosty przykład, w którym …

39 r logistic generalized-linear-model simulation power-analysis

2

Model regresji logistycznej nie jest zbieżny

Mam dane na temat lotów linii lotniczych (w ramce danych o nazwie flights) i chciałbym sprawdzić, czy czas lotu ma jakikolwiek wpływ na prawdopodobieństwo znacznie opóźnionego przybycia (co oznacza 10 lub więcej minut). Uznałem, że użyję regresji logistycznej, z czasem lotu jako predyktorem i czy każdy lot był znacznie opóźniony …

39 r logistic separation

3

Czy potrzebna jest standaryzacja przed dopasowaniem regresji logistycznej?

Moje pytanie brzmi: czy musimy dopasować zestaw danych, aby upewnić się, że wszystkie zmienne mają tę samą skalę, między [0,1], przed dopasowaniem regresji logistycznej. Formuła jest następująca: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Mój zestaw danych ma 2 zmienne, opisują to samo dla dwóch kanałów, ale głośność jest inna. Powiedzmy, że jest to liczba odwiedzin …

39 regression logistic standardization

2

Interpretacja wyniku R dla regresji dwumianowej

Jestem całkiem nowy z dwumianowymi testami danych, ale musiałem to zrobić, a teraz nie jestem pewien, jak interpretować wynik. Zmienna y, zmienna odpowiedzi, jest dwumianowa, a czynniki objaśniające są ciągłe. Oto co otrzymałem podsumowując wynik: glm(formula = leaves.presence ~ Area, family = binomial, data = n) Deviance Residuals: Min 1Q …

38 r regression logistic binomial interpretation

3

Porównanie SVM i regresji logistycznej

Czy ktoś może mi podpowiedzieć, kiedy wybrać SVM lub LR? Chcę zrozumieć intuicję stojącą za różnicą między kryteriami optymalizacji uczenia się hiperpłaszczyzny tych dwóch, gdzie odpowiednie cele są następujące: SVM: Spróbuj zmaksymalizować margines między najbliższymi wektorami wsparcia LR: Maksymalizuj prawdopodobieństwo tylnej klasy Rozważmy liniową przestrzeń cech dla SVM i LR. …

37 regression logistic svm optimization

1

Dlaczego moje wartości p różnią się między wynikami regresji logistycznej, testem chi-kwadrat i przedziałem ufności dla OR?

Zbudowałem regresję logistyczną, w której zmienna wynikowa jest leczona po otrzymaniu leczenia ( Curevs. No Cure). Wszyscy pacjenci w tym badaniu zostali poddani leczeniu. Interesuje mnie, czy cukrzyca jest związana z tym wynikiem. W R mój wynik regresji logistycznej wygląda następująco: Call: glm(formula = Cure ~ Diabetes, family = binomial(link …

37 r hypothesis-testing logistic generalized-linear-model odds-ratio

2

Regresja logistyczna a LDA jako klasyfikatory dwuklasowe

Próbuję owinąć głowę wokół różnicy statystycznej między liniową analizą dyskryminacyjną a regresją logistyczną . Czy słusznie rozumiem, że w przypadku problemu klasyfikacji dwóch klas LDA przewiduje dwie funkcje gęstości normalnej (po jednej dla każdej klasy), które tworzą granicę liniową w miejscu ich przecięcia, podczas gdy regresja logistyczna przewiduje jedynie funkcję …

36 regression logistic classification discriminant-analysis

2

Wielomianowa regresja logistyczna a regresja binarna logistyczna jeden na jeden

Powiedzmy, że mamy zmienną zależną z kilkoma kategoriami i zestawem zmiennych niezależnych. YYY Jakie są zalety wielomianowej regresji logistycznej w porównaniu z zestawem binarnych regresji logistycznych (tj. Schemat jeden do reszty )? Przez zestaw binarnej regresji logistycznej rozumiem, że dla każdej kategorii budujemy osobny binarny model regresji logistycznej z celem …

36 logistic categorical-data multinomial

1

Regresja logistyczna: test chi-kwadrat anova vs. istotność współczynników (anova () vs podsumowanie () w R)

Mam logistyczny model GLM z 8 zmiennymi. Przeprowadziłem test chi-kwadrat w R, anova(glm.model,test='Chisq')a 2 zmienne okazały się predykcyjne, gdy zamówiono je u góry testu, i nie tak bardzo, gdy zamówiono u dołu. summary(glm.model)Sugeruje, że ich współczynniki są nieznaczne (wysoka wartość p). W tym przypadku wydaje się, że zmienne nie są …

35 r regression logistic statistical-significance generalized-linear-model

4

Dlaczego regresja logistyczna staje się niestabilna, gdy klasy są dobrze rozdzielone?

Dlaczego regresja logistyczna staje się niestabilna, gdy klasy są dobrze rozdzielone? Co oznaczają dobrze oddzielone klasy? Byłbym bardzo wdzięczny, gdyby ktoś mógł wyjaśnić na przykładzie.

34 r regression logistic separation

1

Czy próbkowanie w dół zmienia współczynniki regresji logistycznej?

Jeśli mam zestaw danych z bardzo rzadką klasą dodatnią i próbkuję w dół klasę ujemną, a następnie wykonuję regresję logistyczną, czy muszę dostosowywać współczynniki regresji, aby odzwierciedlić fakt, że zmieniłem częstość występowania klasy dodatniej? Załóżmy na przykład, że mam zestaw danych z 4 zmiennymi: Y, A, B i C. Y, …

34 logistic unbalanced-classes case-control-study

3

Dlaczego istnieje różnica pomiędzy ręcznym obliczeniem regresji logistycznej 95% przedziału ufności a użyciem funkcji confint () w R?

Drodzy wszyscy - zauważyłem coś dziwnego, czego nie potrafię wyjaśnić, prawda? Podsumowując: ręczne podejście do obliczania przedziału ufności w modelu regresji logistycznej oraz funkcja R confint()dają różne wyniki. Przechodziłem przez regresję logistyczną stosowaną przez Hosmer & Lemeshow (2. edycja). W trzecim rozdziale znajduje się przykład obliczenia ilorazu szans i 95% …

34 r regression logistic confidence-interval profile-likelihood correlation mcmc error mixture measurement data-augmentation r logistic goodness-of-fit r time-series exponential descriptive-statistics average expected-value data-visualization anova teaching hypothesis-testing multivariate-analysis r r mixed-model clustering categorical-data unsupervised-learning r logistic anova binomial estimation variance expected-value r r anova mixed-model multiple-comparisons repeated-measures project-management r poisson-distribution control-chart project-management regression residuals r distributions data-visualization r unbiased-estimator kurtosis expected-value regression spss meta-analysis r censoring regression classification data-mining mixture

2

Stopnie swobody w teście Hosmera-Lemeshowa

Statystyka testu dla testu Hosmera-Lemeshowa (HLT) dla dobroci dopasowania (GOF) modelu regresji logistycznej jest zdefiniowana następująco: Próbka jest następnie dzielona na decyli, , na decyl jeden oblicza następujące ilości:d=10d=10d=10D1,D2,…,DdD1,D2,…,DdD_1, D_2, \dots , D_{d} O1d=∑i∈DdyiO1d=∑i∈DdyiO_{1d}=\displaystyle \sum_{i \in D_d} y_i , tj. Zaobserwowana liczba pozytywnych przypadków w decylu ;DdDdD_d O0d=∑i∈Dd(1−yi)O0d=∑i∈Dd(1−yi)O_{0d}=\displaystyle \sum_{i \in …

33 regression logistic goodness-of-fit degrees-of-freedom hosmer-lemeshow-test

2

Regresja logistyczna: zmienne Bernoulliego vs. dwumianowe odpowiedzi

Chcę przeprowadzić regresję logistyczną z następującą odpowiedzią dwumianową oraz z i jako moimi predyktorami. X1X1X_1X2X2X_2 Mogę przedstawić te same dane, co odpowiedzi Bernoulliego w następującym formacie. Wyniki regresji logistycznej dla tych 2 zestawów danych są w większości takie same. Wartości odchylenia i AIC są różne. (Różnica między dewiacją zerową a …

32 logistic binomial aic bernoulli-distribution deviance

7

Czy istnieją algorytmy obliczania „działających” parametrów regresji liniowej lub logistycznej?

Artykuł „Dokładne obliczanie wariancji biegu” na stronie http://www.johndcook.com/standard_deviation.html pokazuje, jak obliczyć średnią biegu, wariancję i odchylenia standardowe. Czy istnieją algorytmy, w których parametry modelu regresji liniowej lub logistycznej mogą być podobnie „dynamicznie” aktualizowane w miarę dostarczania każdego nowego rekordu szkolenia?

32 regression logistic online

Pytania otagowane jako logistic