W R drop1polecenie wypisuje coś porządnego. Te dwa polecenia powinny dostarczyć ci trochę danych wyjściowych: example(step)#-> swiss drop1(lm1, test="F") Mój wygląda następująco: > drop1(lm1, test="F") Single term deletions Model: Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum of Sq RSS AIC F value Pr(F) <none> …
Kiedy jesteś tym, który wykonuje tę pracę, mając świadomość tego, co robisz, masz poczucie, że nadmiernie dopasowujesz się do modelu. Po pierwsze, możesz śledzić trend lub pogorszenie w skorygowanym kwadracie R. modelu. Można również śledzić podobne pogorszenie wartości p współczynników regresji głównych zmiennych. Ale kiedy właśnie czytasz kogoś innego i …
Mój kolega z mojego biura powiedział mi dzisiaj: „Modele drzew nie są dobre, ponieważ przyłapują ich ekstremalne obserwacje”. Wyszukiwanie tutaj zaowocowało tym wątkiem, który zasadniczo obsługuje roszczenie. Co prowadzi mnie do pytania - w jakiej sytuacji model CART może być solidny i jak to pokazano?
Czy istnieje technika modelowania, taka jak LOESS, która pozwala na zero, jedną lub więcej nieciągłości, w których czas nieciągłości nie jest znany apriori? Jeśli istnieje technika, czy istnieje implementacja w języku R?
Lubię rozumieć różnicę między modelem przechwytywania z regresem logistycznym lub bez niego Czy jest między nimi jakaś różnica oprócz tego, że przy przecinaniu współczynniki uwzględniają log (iloraz szans) w stosunku do grupy wyjściowej, a bez przecięcia uwzględniają log (szanse)? z tego, co widziałem, współczynniki są takie same w obu przypadkach, …
W regresji grzbietu funkcją celu, którą należy zminimalizować, jest:RSS+λ∑β2j.RSS+λ∑βj2.\text{RSS}+\lambda \sum\beta_j^2. Czy można to zoptymalizować za pomocą metody mnożnika Lagrange'a? Czy jest to proste różnicowanie?
Jako część danych wyjściowych uogólnionego modelu liniowego do oceny modelu wykorzystywane są odchylenie zerowe i rezydualne. Często widzę formuły dla tych wielkości wyrażone jako prawdopodobieństwo dziennika modelu nasyconego, na przykład: /stats//a/113022/22199 , Regresja logistyczna: jak uzyskać model nasycony Model nasycony, o ile rozumiem, jest modelem, który doskonale pasuje do obserwowanej …
Jak zniechęcić szeregi czasowe? Czy wystarczy wziąć pierwszą różnicę i przeprowadzić test Dickeya Fullera, a jeśli jest stacjonarny, jesteśmy dobrzy? Odkryłem również w Internecie, że mogę odrzucić szeregi czasowe, robiąc to w Stata: reg lncredit time predict u_lncredit, residuals twoway line u_lncredit time dfuller u_lncredit, drift regress lags(0) Jakie jest …
Co w ekonometrii oznacza zredukowana forma? Czego ludzie szukają, gdy mówią „Chciałbym zobaczyć mniejszą liczbę formularzy”. Zostało to rzucone w pracy, a indywidualne wyjaśnienia i wyszukiwania w Google są zbyt techniczne. Mając nadzieję, że ktoś mógłby podać prosty przykład.
Przeprowadziłem regresję wielokrotną, w której model jako całość jest znaczący i wyjaśnia około 13% wariancji. Muszę jednak znaleźć wielkość wariancji wyjaśnioną przez każdy znaczący predyktor. Jak mogę to zrobić za pomocą R? Oto kilka przykładowych danych i kodu: D = data.frame( dv = c( 0.75, 1.00, 1.00, 0.75, 0.50, 0.75, …
Niedawno losowe przeglądanie pytań wywołało wspomnienie podpowiedzi jednego z moich profesorów sprzed kilku lat ostrzegających o stosowaniu współczynników w modelach regresji. Zacząłem więc o tym czytać, prowadząc ostatecznie do Kronmal 1993. Chcę się upewnić, że poprawnie interpretuję jego sugestie dotyczące sposobu ich modelowania. Dla modelu o stosunku o tym samym …
Zastanawiałem się tylko, czy regresja Poissona zawiera termin błędu? Czy regresja Poissona może mieć losowe skutki i błąd? Jestem zdezorientowany co do tego punktu. W regresji logistycznej nie występuje termin błędu, ponieważ zmienna wynikowa jest binarna. Czy to jedyny model glm, który nie ma terminu rezydualnego?
Czy ktoś może wyjaśnić matematykę związaną z klasyfikacją w CART? Chcę zrozumieć, jak przebiegają dwa główne etapy. Na przykład przeszkoliłem klasyfikator CART na zestawie danych i użyłem testowego zestawu danych, aby oznaczyć jego predykcyjne działanie, ale: Jak wybiera się początkowy korzeń drzewa? Dlaczego i jak powstaje każda gałąź? Mój zestaw …
Stworzyłem uogólniony model liniowy z pojedynczą zmienną odpowiedzi (ciągła / normalnie rozłożona) i 4 zmiennymi objaśniającymi (z których 3 to czynniki, a czwarta to liczba całkowita). Użyłem rozkładu błędów Gaussa z funkcją łącza tożsamości. Obecnie sprawdzam, czy model spełnia założenia uogólnionego modelu liniowego, którymi są: niezależność Y poprawna funkcja łącza …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.