Pytania otagowane jako multicollinearity

Sytuacja, w której istnieje silna zależność liniowa między zmiennymi predykcyjnymi, tak że ich macierz korelacji staje się (prawie) pojedyncza. Ten „zły stan” utrudnia określenie unikalnej roli, jaką odgrywa każdy z predyktorów: pojawiają się problemy z oszacowaniem i zwiększają się standardowe błędy. Dwukrotnie bardzo wysokie skorelowane predyktory są jednym przykładem wielokoliniowości.

4
Jak interpretować krzywą przeżycia modelu zagrożenia Coxa?
Jak interpretujesz krzywą przeżycia z proporcjonalnego modelu hazardu Coxa? W tym przykładzie zabawki załóżmy, że mamy proporcjonalny model hazardu Coxa dla agezmiennej w kidneydanych i generujemy krzywą przeżycia. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Na przykład o czasie 200200200, które stwierdzenie jest prawdziwe? czy oba są w …

1
Czy do oszacowania można zastosować znormalizowane współczynniki w regresji liniowej ?
Próbuję zinterpretować wyniki artykułu, w którym zastosowali regresję wielokrotną, aby przewidzieć różne wyniki. Jednak (standardowe współczynniki B zdefiniowane jako gdzie jest zależne zmienna, a jest predyktorem) zgłoszone wydają się nie pasować do zgłoszonego :ββ\betaβx1=bx1⋅S D.x1S D.yβx1=Bx1⋅SDx1SDy\beta_{x_1} = B_{x_1} \cdot \frac{\mathrm{SD}_{x_1}}{\mathrm{SD}_y}yyyx1x1x_1R2)R2R^2 Pomimo wynoszących -0,83, -0,29, -0,16, -0,43, 0,25 i -0,29, zgłaszane …


1
Termin interakcji z wykorzystaniem analizy regresji hierarchicznej zmiennych centrowanych? Jakie zmienne powinniśmy wyśrodkować?
Przeprowadzam hierarchiczną analizę regresji i mam małe wątpliwości: Czy obliczamy termin interakcji za pomocą zmiennych centrowanych? Czy musimy wyśrodkować WSZYSTKIE zmienne ciągłe, które mamy w zbiorze danych, oprócz zmiennej zależnej? Kiedy musimy rejestrować niektóre zmienne (ponieważ ich wartość sd jest znacznie wyższa niż ich średnia), to czy centrujemy zmienną, która …

3
Przerzucanie znaków podczas dodawania jeszcze jednej zmiennej w regresji i o znacznie większej wielkości
Podstawowe ustawienia: Model regresji: y=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵy=constant+β1x1+β2x2+β3x3+β4x4+αC+ϵy = \text{constant} +\beta_1x_1+\beta_2x_2+\beta_3x_3+\beta_4x_4+\alpha C+\epsilon gdzie C jest wektorem zmiennych kontrolnych. Interesuję się ββ\beta i oczekuj β1β1\beta_1 i β2)β2\beta_2być negatywnym. W modelu występuje jednak problem wielokoliniowości, współczynnik korelacji podaje: corr (x1x1x_1,x2)) =x2)=x_2)= 0,9345, corr (x1x1x_1,x3)) =x3)=x_3)= 0,1765, corr (x2)x2x_2,x3)) =x3)=x_3)= 0,3019. Więc x1x1x_1 i x2)x2x_2są wysoce …

1
Regresja wielokrotna z brakującą zmienną predykcyjną
Załóżmy, że otrzymaliśmy zestaw danych w postaci i . Zadanie polega na przewidywaniu na podstawie wartości . Szacujemy dwie regresje, w których: ( y,x1,x2), ⋯ ,xn)(y,x1,x2,⋯,xn)(y,x_{1},x_{2},\cdots, x_{n})( y,x1,x2), ⋯ ,xn - 1)(y,x1,x2,⋯,xn−1)(y,x_{1},x_{2},\cdots, x_{n-1})yyyxxxyy=fa1(x1, ⋯ ,xn - 1,xn)=fa2)(x1, ⋯ ,xn - 1)(1)(2)(1)y=f1(x1,⋯,xn−1,xn)(2)y=f2(x1,⋯,xn−1) \begin{align} y &=f_{1}(x_{1},\cdots, x_{n-1}, x_{n}) \tag{1} \\ y &=f_{2}(x_{1},\cdots, …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.