Funkcja lm w R może wydrukować szacunkową kowariancję współczynników regresji. Co dają nam te informacje? Czy możemy teraz lepiej interpretować model lub diagnozować problemy, które mogą występować w modelu?
Mam codzienne dane dotyczące sprzedaży produktu o dużej sezonowości. Chcę uchwycić sezonowość w modelu regresji. Czytałem, że jeśli masz dane kwartalne lub miesięczne, w takim przypadku możesz utworzyć odpowiednio 3 i 11 zmiennych zastępczych - ale czy mogę sobie poradzić z danymi dziennymi? Mam trzy lata codziennych danych. Zmienne niezależne …
Chciałbym porównać modele wybrane z kalenicą, lasso i elastyczną siatką. Ryc. Poniżej pokazuje ścieżki współczynników przy użyciu wszystkich 3 metod: grzbietu (ryc. A, alfa = 0), lasso (ryc. B; alfa = 1) i elastycznej siatki (ryc. C; alfa = 0,5). Optymalne rozwiązanie zależy od wybranej wartości lambda, która jest wybierana …
Stopnie swobody w regresji wielokrotnej są równe , gdzie k jest liczbą zmiennych.N.- k - 1N.-k-1N-k-1kkk Czy obejmuje zmienną odpowiedzi (tj. )? Na przykład, w modelu , to czy (tj. 1 df każdy dla , i )?kkkYYYY= B0+ B1X1+ B2)X2)Y=b0+b1X1+b2)X2)Y = B_0 + B_1X_1 + B_2X_2k = 3k=3)k = 3YYYX1X1X_1X2)X2)X_2
Przepraszam, jeśli to nowe pytanie; Po raz pierwszy próbuję nauczyć się statystyki. Myślę, że mam podstawową procedurę, ale staram się ją wykonać z R. Próbuję więc ocenić znaczenie współczynników regresji w wielokrotnej regresji liniowej formy y^= Xβ^y^=Xβ^ \hat y = X \hat \beta Myślę, że statystyki t do testowania podajeH.0: …
Wyobraź sobie, że badacz bada zbiór danych i przeprowadza 1000 różnych regresji i znajduje między nimi jedną interesującą relację. Teraz wyobraź sobie, że inny badacz z tymi samymi danymi wykonuje tylko 1 regresję i okazuje się, że jest to ta sama, którą drugi badacz wziął 1000 regresji, aby ją znaleźć. …
Wielomiany ortogonalne w jednowymiarowym zestawie punktów są wielomianami, które wytwarzają wartości na tych punktach w taki sposób, że iloczyn skalarny i korelacja par są zerowe. R może wytwarzać ortogonalne wielomiany z funkcją poli . Ta sama funkcja ma wariant polimorficzny, który tworzy wielomiany ortogonalne na zestawie punktów na wielu odmianach. …
Widziałem formuły na Wikipedii. które odnoszą się do odległości i dźwigni Mahalanobisa: Odległość Mahalanobisa jest ściśle związana ze statystyką dźwigni, , ale ma inną skalę:hhhre2)= ( N- 1 ) ( h - 1N.) .re2)=(N.-1)(h-1N.).D^2 = (N - 1)(h - \tfrac{1}{N}). W powiązanym artykule Wikipedia opisuje w następujących terminach:hhh W tym …
Mam duży zbiorczy zestaw danych rynkowych dotyczących sprzedaży wina w USA i chciałbym oszacować popyt na niektóre wina wysokiej jakości. Te udziały w rynku zostały zasadniczo wyprowadzone z losowego modelu użytkowego w postaci Uja j t= X′j tβ- α pj t+ ξj t+ ϵja j t≡ δj t+ ϵj tUijt=Xjt′β−αpjt+ξjt+ϵijt≡δjt+ϵjtU_{ijt} …
Podczas korzystania z naturalnych (tj. Ograniczonych) splajnów sześciennych, tworzone funkcje podstawowe są wysoce współliniowe, a po zastosowaniu w regresji wydają się generować bardzo wysokie statystyki VIF (współczynnik inflacji wariancji), sygnalizując wielokoliniowość. Czy rozważając przypadek modelu do celów prognozowania, jest to problem? Wydaje się, że zawsze tak będzie ze względu na …
Czy można uzyskać dodatnią korelację między regresorem a odpowiedzią ( +0,43), a następnie uzyskać ujemny współczynnik w dopasowanym modelu regresji dla tego regresora? Nie mówię o zmianach w znaku regresora wśród niektórych modeli. Znak współczynnika zawsze pozostaje. Czy pozostałe zmienne dopasowanego modelu mogą wpływać na zmianę znaku?
Uwaga: to pytanie jest repost, ponieważ moje poprzednie pytanie musiało zostać usunięte ze względów prawnych. Porównując PROC MIXED z SAS z funkcją lmez nlmepakietu w R, natknąłem się na pewne dość mylące różnice. Mówiąc dokładniej, stopnie swobody w różnych testach różnią się między PROC MIXEDi lmezastanawiałem się, dlaczego. Zacznij od …
Obecnie pracuję nad budowaniem modelu predykcyjnego dla wyniku binarnego na zbiorze danych z ~ 300 zmiennymi i 800 obserwacjami. Dużo przeczytałem na tej stronie o problemach związanych z regresją krokową i dlaczego jej nie używać. Czytałem o regresji LASSO i jej możliwościach wyboru funkcji i udało mi się ją wdrożyć …
Próba obliczenia liczby odwiedzin na podstawie danych demograficznych i usług. Dane są bardzo wypaczone. Histogramy: wykresy qq (po lewej jest log): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityi servicesą zmiennymi czynnikowymi. Otrzymuję niską wartość p *** dla wszystkich zmiennych, ale dostaję także niski r-kwadrat wynoszący 0,05. Co powinienem zrobić? Czy …
Oto model utworzony z mtcarszestawu danych: > ols(mpg~wt+am+qsec, mtcars) Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes Obs 32 LR chi2 60.64 R2 0.850 sigma 2.4588 d.f. 3 R2 adj 0.834 d.f. 28 Pr(> chi2) 0.0000 g …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.