Statystyki i duże zbiory danych regression

2

W R drop1polecenie wypisuje coś porządnego. Te dwa polecenia powinny dostarczyć ci trochę danych wyjściowych: example(step)#-> swiss drop1(lm1, test="F") Mój wygląda następująco: > drop1(lm1, test="F") Single term deletions Model: Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum of Sq RSS AIC F value Pr(F) <none> …

14 r regression self-study stepwise-regression

3

Jak wykryć nadmierne dopasowanie modelu regresji?

Kiedy jesteś tym, który wykonuje tę pracę, mając świadomość tego, co robisz, masz poczucie, że nadmiernie dopasowujesz się do modelu. Po pierwsze, możesz śledzić trend lub pogorszenie w skorygowanym kwadracie R. modelu. Można również śledzić podobne pogorszenie wartości p współczynników regresji głównych zmiennych. Ale kiedy właśnie czytasz kogoś innego i …

14 regression multivariate-analysis overfitting

3

Czy modele CART mogą być solidne?

Mój kolega z mojego biura powiedział mi dzisiaj: „Modele drzew nie są dobre, ponieważ przyłapują ich ekstremalne obserwacje”. Wyszukiwanie tutaj zaowocowało tym wątkiem, który zasadniczo obsługuje roszczenie. Co prowadzi mnie do pytania - w jakiej sytuacji model CART może być solidny i jak to pokazano?

14 regression classification robust cart

4

MIŁOŚĆ, która pozwala na nieciągłości

Czy istnieje technika modelowania, taka jak LOESS, która pozwala na zero, jedną lub więcej nieciągłości, w których czas nieciągłości nie jest znany apriori? Jeśli istnieje technika, czy istnieje implementacja w języku R?

14 r regression curve-fitting change-point loess

1

Różnica między modelem przechwytywania z regresem logistycznym lub bez niego

Lubię rozumieć różnicę między modelem przechwytywania z regresem logistycznym lub bez niego Czy jest między nimi jakaś różnica oprócz tego, że przy przecinaniu współczynniki uwzględniają log (iloraz szans) w stosunku do grupy wyjściowej, a bez przecięcia uwzględniają log (szanse)? z tego, co widziałem, współczynniki są takie same w obu przypadkach, …

14 regression logistic interpretation model intercept

3

Jak znaleźć współczynniki regresji w regresji kalenicowej?

W regresji grzbietu funkcją celu, którą należy zminimalizować, jest:RSS+λ∑β2j.RSS+λ∑βj2.\text{RSS}+\lambda \sum\beta_j^2. Czy można to zoptymalizować za pomocą metody mnożnika Lagrange'a? Czy jest to proste różnicowanie?

14 regression regularization ridge-regression

3

Czy w GLM prawdopodobieństwo dziennika modelu nasyconego zawsze wynosi zero?

Jako część danych wyjściowych uogólnionego modelu liniowego do oceny modelu wykorzystywane są odchylenie zerowe i rezydualne. Często widzę formuły dla tych wielkości wyrażone jako prawdopodobieństwo dziennika modelu nasyconego, na przykład: /stats//a/113022/22199 , Regresja logistyczna: jak uzyskać model nasycony Model nasycony, o ile rozumiem, jest modelem, który doskonale pasuje do obserwowanej …

14 regression generalized-linear-model deviance log-likelihood

5

Jak zniechęcić szeregi czasowe?

Jak zniechęcić szeregi czasowe? Czy wystarczy wziąć pierwszą różnicę i przeprowadzić test Dickeya Fullera, a jeśli jest stacjonarny, jesteśmy dobrzy? Odkryłem również w Internecie, że mogę odrzucić szeregi czasowe, robiąc to w Stata: reg lncredit time predict u_lncredit, residuals twoway line u_lncredit time dfuller u_lncredit, drift regress lags(0) Jakie jest …

14 regression time-series stata stationarity

3

Jaka jest różnica między wielokrotnością R i R podniesioną do kwadratu?

W regresji liniowej często otrzymujemy wielokrotność R i R do kwadratu. Jakie są między nimi różnice?

14 regression r-squared

4

Co oznacza po prostu zredukowana forma?

Co w ekonometrii oznacza zredukowana forma? Czego ludzie szukają, gdy mówią „Chciałbym zobaczyć mniejszą liczbę formularzy”. Zostało to rzucone w pracy, a indywidualne wyjaśnienia i wyszukiwania w Google są zbyt techniczne. Mając nadzieję, że ktoś mógłby podać prosty przykład.

14 regression multiple-regression econometrics

3

Oblicz wariancję wyjaśnioną przez każdy predyktor w regresji wielokrotnej przy użyciu R.

Przeprowadziłem regresję wielokrotną, w której model jako całość jest znaczący i wyjaśnia około 13% wariancji. Muszę jednak znaleźć wielkość wariancji wyjaśnioną przez każdy znaczący predyktor. Jak mogę to zrobić za pomocą R? Oto kilka przykładowych danych i kodu: D = data.frame( dv = c( 0.75, 1.00, 1.00, 0.75, 0.50, 0.75, …

14 r regression variance

1

Współczynniki regresji, czyli pytania o Kronmal

Niedawno losowe przeglądanie pytań wywołało wspomnienie podpowiedzi jednego z moich profesorów sprzed kilku lat ostrzegających o stosowaniu współczynników w modelach regresji. Zacząłem więc o tym czytać, prowadząc ostatecznie do Kronmal 1993. Chcę się upewnić, że poprawnie interpretuję jego sugestie dotyczące sposobu ich modelowania. Dla modelu o stosunku o tym samym …

14 regression modeling interaction weighted-regression ratio

1

Czy regresja Poissona zawiera błąd?

Zastanawiałem się tylko, czy regresja Poissona zawiera termin błędu? Czy regresja Poissona może mieć losowe skutki i błąd? Jestem zdezorientowany co do tego punktu. W regresji logistycznej nie występuje termin błędu, ponieważ zmienna wynikowa jest binarna. Czy to jedyny model glm, który nie ma terminu rezydualnego?

14 regression mixed-model generalized-linear-model poisson-regression

2

Matematyka za drzewami klasyfikacji i regresji

Czy ktoś może wyjaśnić matematykę związaną z klasyfikacją w CART? Chcę zrozumieć, jak przebiegają dwa główne etapy. Na przykład przeszkoliłem klasyfikator CART na zestawie danych i użyłem testowego zestawu danych, aby oznaczyć jego predykcyjne działanie, ale: Jak wybiera się początkowy korzeń drzewa? Dlaczego i jak powstaje każda gałąź? Mój zestaw …

14 regression classification data-mining cart

1

Założenia uogólnionego modelu liniowego

Stworzyłem uogólniony model liniowy z pojedynczą zmienną odpowiedzi (ciągła / normalnie rozłożona) i 4 zmiennymi objaśniającymi (z których 3 to czynniki, a czwarta to liczba całkowita). Użyłem rozkładu błędów Gaussa z funkcją łącza tożsamości. Obecnie sprawdzam, czy model spełnia założenia uogólnionego modelu liniowego, którymi są: niezależność Y poprawna funkcja łącza …

14 regression generalized-linear-model ancova assumptions scatterplot

Pytania otagowane jako regression