mgcvOpakowanie Rposiada dwie funkcje montowania interakcji produktów napinacz: te()i ti(). Rozumiem podstawowy podział pracy między nimi (dopasowanie interakcji nieliniowej vs. rozkładanie tej interakcji na główne efekty i interakcję). To, czego nie rozumiem, to dlaczego te(x1, x2)i ti(x1) + ti(x2) + ti(x1, x2)może powodować (nieznacznie) różne wyniki. MWE (dostosowany z ?ti): …
Przeprowadzam wielokrotną regresję liniową poniżej w R, aby przewidzieć zwrot z zarządzanego funduszu. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Tutaj tylko GRI i MBA są predyktorami binarnymi / dychotomicznymi; pozostałe predyktory są ciągłe. Używam tego kodu do generowania wykresów resztkowych dla zmiennych binarnych. plot(rawdata$GRI, reg$residuals) abline(lm(reg$residuals~rawdata$GRI, data=rawdata), col="red") # regression line (y~x) …
W moich danych obserwuję dziwne wzorce w resztkach: [EDYCJA] Oto wykresy częściowej regresji dla dwóch zmiennych: [EDIT2] Dodano wykres PP Wygląda na to, że dystrybucja jest w porządku (patrz poniżej), ale nie mam pojęcia, skąd ta prosta może pochodzić. Jakieś pomysły? [AKTUALIZACJA 31.07] Okazuje się, że miałeś całkowitą rację, miałem …
Dlaczego ktoś stosuje wiek i kwadrat do wieku jako zmienne towarzyszące w badaniu asocjacji genetycznej? Rozumiem użycie wieku, jeśli zostało ono zidentyfikowane jako znacząca zmienna towarzysząca, ale nie mam pojęcia, jak wykorzystać wiek kwadratowy.
Zdaję sobie sprawę z tego, że zmienne kategorialne o poziomach k powinny być kodowane zmiennymi k-1 w kodowaniu fikcyjnym (podobnie w przypadku wielowartościowych zmiennych jakościowych). Zastanawiałem się, w jakim stopniu problem polega na kodowaniu jednorazowym (tj. Zamiast tego przy użyciu zmiennych k) zamiast kodowaniu fikcyjnym dla różnych metod regresji, głównie …
Nie mam na myśli konkretnego przykładu ani zadania. Po prostu jestem nowy w używaniu splajnów b i chciałem lepiej zrozumieć tę funkcję w kontekście regresji. Załóżmy, że chcemy ocenić związek między zmienną odpowiedzi a niektórymi predyktorami . Predyktory obejmują niektóre zmienne numeryczne, a także niektóre jakościowe.yyyx1, x2), . . . …
Rozważ następujący model regresji wielokrotnej:Y=Xβ+Zδ+U.(1)(1)Y=Xβ+Zδ+U.Y=X\beta+Z\delta+U.\tag{1} Tutaj jest wektorem kolumny; Macierz a ; a wektor kolumny; a macierz; a wektor kolumnowy; i U , termin błędu, wektor kolumny n \ times1 .YYYn×1n×1n\times 1XXXn×(k+1)n×(k+1)n\times (k+1)ββ\beta(k+1)×1(k+1)×1(k+1)\times 1ZZZn×ln×ln\times lδδ\deltal×1l×1l\times 1UUUn×1n×1n\times1 PYTANIE Mój wykładowca, podręcznik Wprowadzenie do ekonometrii, wydanie 3. autorzy James H. Stock i …
Poniżej znajduje się nomogram utworzony z zestawu danych mtcars z pakietem rms dla formuły: mpg ~ wt + am + qsec Sam model wydaje się dobry z R2 wynoszącym 0,85 i P <0,00001 > mod Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) …
Korzystam z regresji puli OLS przy użyciu pakietu plm w R. Chociaż moje pytanie dotyczy bardziej podstawowych statystyk, więc najpierw postaram się je tutaj zamieścić;) Ponieważ moje wyniki regresji dają reszty heteroskedastyczne, chciałbym spróbować użyć solidnych standardowych błędów heteroskedastycznych. W rezultacie coeftest(mod, vcov.=vcovHC(mod, type="HC0"))otrzymuję tabelę zawierającą oszacowania, błędy standardowe, wartości …
Powiedzmy, że dopasowuję regresję wielokrotną zmiennych objaśniających. Test t pozwoli mi sprawdzić, czy którykolwiek z nich jest znaczący ( ). Mogę zrobić częściowy F-test, aby sprawdzić, czy jakiś podzbiór z nich jest istotna ( H 0 : β í = β j = . . . = Β k = …
Czytałem rozdział dotyczący regresji wielokrotnej analizy danych i grafiki przy użyciu R: podejście oparte na przykładach i byłem nieco zdezorientowany, gdy dowiedziałem się, że zaleca sprawdzanie liniowych zależności między zmiennymi objaśniającymi (za pomocą wykresu rozrzutu), a jeśli nie ma t dowolny, przekształcając je tak, oni mają stać się bardziej liniowo …
Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …
Mam pytanie o podejście różnic w różnicach z następującym równaniem standardowym: gdzie Treat jest zmienną fikcyjną dla grupy i postu traktowanego. y= a + b1leczyć + b2)post + b3)leczyć ⋅ post + uy=za+b1leczyć+b2)Poczta+b3)leczyć⋅Poczta+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u Teraz moje pytanie jest proste: dlaczego większość dokumentów …
W ustawieniu wielowymiarowej regresji wielokrotnej (regresor wektorowy i regresja i) cztery główne testy ogólnej hipotezy (Lambda Wilka, Pillai-Bartlett, Hotelling-Lawley i największa korzeń Roya) zależą od wartości własnych macierzy HE−1HE−1H E^{-1} , gdzie HHH i EEE są „objaśnionymi” i „całkowitymi” macierzami zmienności. I zauważył, że dane statystyczne Pillai i Hotellinga-Lawley mogą …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.