Odnosi się do dowolnego modelu, w którym zmienna losowa jest powiązana z jedną lub większą liczbą zmiennych losowych przez funkcję, która jest liniowa w skończonej liczbie parametrów.
Przeglądam regresję liniową. Podręcznik Greene'a stanowi: Teraz oczywiście będą inne założenia dotyczące modelu regresji liniowej, takie jak . To założenie w połączeniu z założeniem liniowości (które w rzeczywistości definiuje ), nakłada strukturę na model.E(ϵ|X)=0E(ϵ|X)=0E(\epsilon|X)=0ϵϵ\epsilon Jednak założenie liniowości sama nie stawia żadnej struktury w naszym modelu, ponieważ może być zupełnie dowolna. …
Widziałem ten zapis dla zwykłych najmniejszych kwadratów tutaj . minw∥Xw−y∥22minw‖Xw−y‖22) \min_w \left\| Xw - y \right\|^2_2 Nigdy nie widziałem podwójnych pasków i 2 na dole. Co oznaczają te symbole? Czy mają dla nich określoną terminologię?
Załóżmy, że mam wektor zmiennych zależnych i wektor zmiennej niezależnej. Kiedy jest wykreślane względem , widzę, że istnieje między nimi zależność liniowa (trend wzrostowy). Teraz, to oznacza również, że istnieje liniowa tendencja spadkowa między i .T N X T 1N.NNYYYN.NNXXXYYY YX1X1X\frac{1}{X}YYYXXX Teraz, jeśli uruchomię regresję: i uzyskam dopasowaną wartośćY = …
Czy ktoś wie, jak obliczyć (lub wyodrębnić) dźwignię i odległości Cooka dla merobiektu klasy (uzyskanego przez lme4pakiet)? Chciałbym je nakreślić w celu analizy pozostałości.
Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …
Mam następujący model liniowy: Aby rozwiązać problem heteroscedastyczności resztek, próbowałem zastosować transformację logu do zmiennej zależnej jako ale nadal widzę ten sam efekt rozłożenia na resztki. Wartości DV są stosunkowo małe, więc stałe dodanie +1 przed pobraniem dziennika prawdopodobnie nie jest w tym przypadku właściwe.log( Y+ 1 )log(Y+1)\log(Y + 1) …
Załóżmy, że interesuje mnie model regresji liniowej Yja=β0+β1x1+β2)x2)+β3)x1x2)Yi=β0+β1x1+β2x2+β3x1x2Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2, ponieważ chciałbym sprawdzić, czy interakcja między dwoma zmiennymi towarzyszącymi ma wpływ na Y. W notatkach dla profesorów (z którymi nie mam kontaktu) napisano: Przy uwzględnianiu warunków interakcji należy podać warunki drugiego stopnia. to znaczyYja=β0+β1x1+β2)x2)+β3)x1x2)+β4x2)1+β5x2)2)Yi=β0+β1x1+β2x2+β3x1x2+β4x12+β5x22Y_i …
Co sądzisz o używaniu regresji do wyświetlania poza zakresem danych? Jeśli jesteśmy pewni, że podąża za kształtem liniowym lub potęgowym, czy model nie byłby przydatny poza zakresem danych? Na przykład mam wolumen napędzany przez cenę. Uważamy, że powinniśmy być w stanie prognozować ceny poza zakresem danych. Twoje myśli? VOL PRICE …
W regresji liniowej doszedłem do cudownego wyniku, jeśli dopasujemy model E[Y]=β1X1+β2X2+c,E[Y]=β1X1+β2X2+c,E[Y] = \beta_1 X_1 + \beta_2 X_2 + c, to jeśli znormalizujemy i wyśrodkujemy dane , i ,YYYX1X1X_1X2X2X_2 R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R^2 = \mathrm{Cor}(Y,X_1) \beta_1 + \mathrm{Cor}(Y, X_2) \beta_2. Wydaje mi się, że jest to zmienna wersja dla regresji , co jest przyjemne.R2=Cor(Y,X)2R2=Cor(Y,X)2R^2 …
Mam próbkę 1449 punktów danych, które nie są skorelowane (r-kwadrat 0,006). Analizując dane, odkryłem, że dzieląc wartości zmiennych niezależnych na grupy dodatnie i ujemne, wydaje się, że istnieje znacząca różnica w średniej zmiennej zależnej dla każdej grupy. Dzieląc punkty na 10 przedziałów (decyli) przy użyciu niezależnych wartości zmiennych, wydaje się, …
To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R byłyby mniej …
tło Mam dane z badań terenowych, w których istnieją cztery poziomy leczenia i sześć powtórzeń w każdym z dwóch bloków. (4x6x2 = 48 obserwacji) Bloki są oddalone od siebie o około 1 milę, aw obrębie bloków znajduje się siatka o powierzchni 42, 2m x 4m i chodnik o szerokości 1m; …
W „Elementach uczenia statystycznego” wyrażenie dekompozycji wariancji odchylenia modelu liniowego podano jako gdzie jest rzeczywistą funkcją docelową, to wariancja błędu losowego w modeluErr(x0)=σ2ϵ+E[f(x0)−Ef^(x0)]2+||h(x0)||2σ2ϵ,Err(x0)=σϵ2+E[f(x0)−Ef^(x0)]2+||h(x0)||2σϵ2,Err(x_0)=\sigma_\epsilon^2+E[f(x_0)-E\hat f(x_0)]^2+||h(x_0)||^2\sigma_\epsilon^2,f(x0)f(x0)f(x_0)σ2ϵσϵ2 \sigma_\epsilon^2y=f(x)+ϵy=f(x)+ϵy=f(x)+\epsilon i f^(x)f^(x)\hat f(x) jest estymatorem liniowym f(x)f(x)f(x). Problem wariancji niepokoi mnie tutaj, ponieważ równanie implikuje, że wariancja byłaby zerowa, gdyby cele były bezszumowe, to znaczy …
We wstępnej ekonometrii Wooldridge'a jest cytat: Argument uzasadniający normalną dystrybucję błędów zwykle działa mniej więcej tak: ponieważ uuu jest sumą różnych wpływających na nie zaobserwowanych czynników yyy, możemy odwołać się do centralnego twierdzenia o granicy, aby dojść do wniosku uuu ma przybliżony rozkład normalny. Ten cytat dotyczy jednego z założeń …
Mój przyjaciel niedawno zapytał, co jest takiego zwyczajnego, o zwykłych najmniejszych kwadratach. Wydaje się, że nigdzie nie rozmawialiśmy. Obaj zgodziliśmy się, że OLS jest specjalnym przypadkiem modelu liniowego, ma wiele zastosowań, jest dobrze znany i jest szczególnym przypadkiem wielu innych modeli. Ale czy to naprawdę wszystko? Dlatego chciałbym wiedzieć: Skąd …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.