Statystyki i duże zbiory danych logistic

1

Dlaczego Anova () i drop1 () podają różne odpowiedzi dla GLMM?

Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

2

Wykładniczy współczynnik regresji logistycznej inny niż iloraz szans

Jak rozumiem, wykładnicza wartość beta z regresji logistycznej jest ilorazem szans tej zmiennej dla zmiennej zależnej zainteresowania. Jednak wartość nie odpowiada ręcznie obliczonemu współczynnikowi szans. Mój model przewiduje stunting (miarę niedożywienia) przy użyciu, między innymi, ubezpieczenia. // Odds ratio from LR, being done in stata logit stunting insurance age ... …

10 regression logistic interpretation odds-ratio

2

Najlepszy sposób na połączenie odpowiedzi binarnej i ciągłej

Staram się znaleźć najlepszy sposób, aby przewidzieć kwotę płatności dla agencji windykacyjnej. Zmienna zależna jest różna od zera tylko po dokonaniu płatności. Zrozumiałe jest, że istnieje ogromna liczba zer, ponieważ większość ludzi nie jest w stanie dotrzeć lub nie jest w stanie spłacić długu. Istnieje również bardzo silna ujemna korelacja …

10 regression predictive-models logistic

3

Założenia wielomianowej regresji logistycznej

Jakie są właściwe założenia wielomianowej regresji logistycznej? A jakie są najlepsze testy, aby spełnić te założenia przy użyciu SPSS 18?

10 logistic spss assumptions multinomial multinomial-logit

2

Regresja logistyczna dla wieloklasowej

Mam model regresji logistycznej dla wieloklasowej, który podaje P(Y=j|X(i))=exp(θTjX(i))1+∑km=1exp(θTmX(i))P(Y=j|X(i))=exp⁡(θjTX(i))1+∑m=1kexp⁡(θmTX(i)) P(Y=j|X^{(i)}) = \frac{\exp(\theta_j^TX^{(i)})}{1+ \sum_{m=1}^{k}\exp(\theta_m^T X^{(i)})} gdzie k to liczba klas theta to parametr do oszacowania j to j-ta klasa Xi to dane treningowe Cóż, jedna rzecz, której nie dostałem, to dlaczego część mianownika znormalizowała model. Mam na myśli, że prawdopodobieństwo pozostanie …

10 logistic multinomial

6

Jak ocenić moc predykcyjną zestawu predyktorów jakościowych wyniku binarnego? Oblicz prawdopodobieństwo lub regresję logistyczną?

Próbuję ustalić, czy proste prawdopodobieństwa będą działać na mój problem, czy też lepiej będzie użyć (i dowiedzieć się więcej) bardziej wyrafinowanych metod, takich jak regresja logistyczna. Zmienna odpowiedzi w tym problemie jest odpowiedzią binarną (0, 1). Mam wiele zmiennych predykcyjnych, które są kategoryczne i nieuporządkowane. Próbuję ustalić, które kombinacje zmiennych …

10 r probability logistic

3

Resztki regresji logistycznej i odległości Cooka

Czy istnieją jakieś szczególne założenia dotyczące błędów regresji logistycznej, takie jak stała wariancja terminów błędów i normalność reszt? Czy zazwyczaj usuwasz je również, gdy masz punkty o odległości Cooka większej niż 4 / n? Jeśli je usuniesz, jak możesz stwierdzić, czy model z usuniętymi punktami jest lepszy?

10 regression logistic residuals diagnostic cooks-distance

1

Skrzyżowane efekty losowe i niezrównoważone dane

Modeluję niektóre dane, w których, jak sądzę, mam dwa skrzyżowane losowe efekty. Ale zestaw danych nie jest zrównoważony i nie jestem pewien, co należy zrobić, aby to uwzględnić. Moje dane to zestaw zdarzeń. Zdarzenie ma miejsce, gdy klient spotyka się z dostawcą w celu wykonania zadania, które się powiedzie lub …

10 r mixed-model random-effects-model logistic

5

Czy regresja logistyczna jest tendencyjna, gdy zmienna wynikowa jest podzielona między 5% a 95%?

Buduję model skłonności za pomocą regresji logistycznej dla klienta użyteczności publicznej. Obawiam się, że z całej próby moje „złe” konta wynoszą zaledwie 5%, a reszta jest dobra. Przepowiadam „źle”. Czy wynik zostanie zakłócony? Jaka jest optymalna proporcja „złej do dobrej”, aby zbudować dobry model?

10 logistic modeling

2

Która metoda jądra daje najlepsze wyniki prawdopodobieństwa?

Niedawno użyłem skalowania Platta wyjść SVM do oszacowania prawdopodobieństwa zdarzeń domyślnych. Bardziej bezpośrednimi alternatywami wydają się być „regresja logistyczna jądra” (KLR) i związana z nią „maszyna wektorów importu”. Czy ktoś może powiedzieć, która metoda jądra dająca wyniki prawdopodobieństwa jest obecnie najnowocześniejsza? Czy istnieje R-implementacja KLR? Bardzo ci dziękuje za pomoc!

10 logistic svm kernel-trick

3

Jak radzić sobie z niebinarnymi zmiennymi kategorialnymi w regresji logistycznej (SPSS)

Muszę wykonać binarną regresję logistyczną z wieloma niezależnymi zmiennymi. Większość z nich ma charakter binarny, ale kilka zmiennych kategorialnych ma więcej niż dwa poziomy. Jaki jest najlepszy sposób radzenia sobie z takimi zmiennymi? Na przykład, dla zmiennej o trzech możliwych wartościach, przypuszczam, że należy utworzyć dwie zmienne fikcyjne. Następnie, w …

10 logistic categorical-data spss ordinal-data categorical-encoding

1

Interpretacja efektów stałych z regresji logistycznej efektu mieszanego

Jestem zdezorientowany stwierdzeniami na stronie UCLA o regresji logistycznej z efektami mieszanymi. Pokazują tabelę stałych współczynników efektów z dopasowania takiego modelu, a pierwszy akapit poniżej wydaje się interpretować współczynniki dokładnie tak, jak normalna regresja logistyczna. Ale kiedy mówią o ilorazach szans, mówią, że musisz je interpretować zależnie od losowych efektów. …

10 logistic mixed-model generalized-linear-model random-effects-model

1

Jaka jest różnica między funkcją decyzyjną, prognozą_proba i funkcją prognozowania dla problemu regresji logistycznej?

Przeglądałem dokumentację sklearn, ale nie jestem w stanie zrozumieć celu tych funkcji w kontekście regresji logistycznej. Dla decision_functionniego mówi, że jego odległość między hiperpłaszczyznę i instancji testowej. w jaki sposób te konkretne informacje są przydatne? i jak to się odnosi predicti predict-probametody?

10 regression logistic prediction scikit-learn decision

2

Regresja logistyczna i porządkowe zmienne niezależne

Znalazłem ten post: Tak. Współczynnik odzwierciedla zmianę ilorazów logarytmicznych dla każdego przyrostu zmiany w predyktorze porządkowym. Ta (bardzo powszechna) specyfikacja modelu zakłada, że predyktor ma liniowy wpływ na swoje przyrosty. Aby przetestować to założenie, możesz porównać model, w którym używasz zmiennej porządkowej jako pojedynczego predyktora, z modelem, w którym dyskretyzujesz …

10 regression logistic references ordinal-data

2

Czy istnieje jakaś funkcjonalna różnica między ilorazem szans a ilorazem ryzyka?

W regresji logistycznej iloraz szans równy 2 oznacza, że zdarzenie jest 2 razy bardziej prawdopodobne, biorąc pod uwagę wzrost o jedną jednostkę predyktora. W regresji Coxa współczynnik ryzyka wynoszący 2 oznacza, że zdarzenie wystąpi dwa razy częściej w każdym punkcie czasowym, biorąc pod uwagę wzrost o jedną jednostkę predyktora. Czy …

10 logistic cox-model odds-ratio hazard

Pytania otagowane jako logistic