Resztki modelu to wartości rzeczywiste minus wartości prognozowane. Wiele modeli statystycznych przyjmuje założenia dotyczące błędu, który jest szacowany na podstawie reszt.
Podczas przeprowadzania wielokrotnej regresji liniowej OLS zamiast wykreślania reszt względem dopasowanych wartości, wykreślam (wewnętrzne) studentizowane resztki względem dopasowanych wartości (podobnie jak współzmienne). Te pozostałości są zdefiniowane jako: e∗i=eis2(1−hii)−−−−−−−−−√ei∗=eis2(1−hii)\begin{equation} e^*_i = \frac{e_i}{\sqrt{s^2 (1-h_{ii})}} \end{equation} gdzie jest resztą, a h_ {ii} to diagonalne elementy macierzy kapelusza. Aby uzyskać te studentizowane resztki w …
Załóżmy, że mamy model .Yi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiYi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiY_i = \beta_0 + \beta_1X_{i1} + \beta_2X_{i2} + \dots + \beta_kX_{ik} + \epsilon_i Regresja ma wiele założeń, na przykład, że błędy powinny być normalnie rozłożone ze średnią zerową i stałą wariancją. Nauczono mnie sprawdzać te założenia przy użyciu normalnego wykresu QQ w celu przetestowania normalności reszt …
Natknąłem się na pojęcie inlier w metodzie LOF (Local Outlier Factor), znam pojęcie wartości odstających (cóż w zasadzie lier - instancje, które nie zachowują się jak reszta instancji). Co oznaczają „Inliers” w kontekście wykrywania anomalii? i jak to się ma do (innych niż) wartości odstających?
Czy „resztki studenckie” i „resztki standaryzowane” są takie same w modelach regresji? Zbudowałem model regresji liniowej w R i chciałem wykreślić wykres dopasowanych wartości reszt studenckich v / s, ale nie znalazłem zautomatyzowanego sposobu na zrobienie tego w R. Załóżmy, że mam model library(MASS) lm.fit <- lm(Boston$medv~(Boston$lstat)) następnie użycie plot(lm.fit)nie …
Po pierwsze: z tego, co zrozumiałem, resztki ładowania początkowego działają w następujący sposób: Dopasuj model do danych Oblicz resztki Ponownie próbkuj resztki i dodaj je do 1. Dopasuj model do nowego zestawu danych od 3. Powtarzaj nczasy, ale zawsze dodawaj ponownie próbkowane reszty do dopasowania od 1. Czy to jak …
Trudno mi to opisać, ale postaram się, aby mój problem był zrozumiały. Najpierw musisz wiedzieć, że do tej pory przeprowadziłem bardzo prostą regresję liniową. Zanim oszacowałem współczynnik, obserwowałem rozkład mojego . Jest ciężko lewy przekrzywiony. Po oszacowaniu modelu byłem całkiem pewny, że zaobserwowałem odchyloną w lewo resztkę na wykresie QQ, …
Stosując regresję OLS do ciągłej odpowiedzi, można zbudować równanie regresji wielokrotnej, uruchamiając sekwencyjnie regresje reszt na każdej współzmiennej. Moje pytanie brzmi: czy istnieje sposób, aby to zrobić za pomocą regresji logistycznej za pomocą reszt regresji logistycznej ? To znaczy, jeśli chcę oszacować przy użyciu standardowego uogólnionego modelu modelowania liniowego, czy …
Chciałbym sklasyfikować punkty danych jako wymagające bardziej złożonego modelu lub niepotrzebujące bardziej złożonego modelu. Moje obecne myślenie polega na dopasowaniu wszystkich danych do prostego modelu liniowego i obserwacji wielkości reszt, aby dokonać tej klasyfikacji. Następnie przeczytałem trochę na temat wkładu błędu i wariancji w błąd i zdałem sobie sprawę, że …
W metodzie najmniejszych kwadratów chcemy oszacować nieznane parametry w modelu: Yj=α+βxj+εj(j=1...n)Yj=α+βxj+εj(j=1...n)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) Gdy to zrobimy (dla niektórych obserwowanych wartości), otrzymamy dopasowaną linię regresji: Yj=α^+β^x+ej(j=1,...n)Yj=α^+β^x+ej(j=1,...n)Y_j = \hat{\alpha} + \hat{\beta}x +e_j \enspace (j =1,...n) Teraz oczywiście chcemy sprawdzić niektóre wykresy, aby upewnić się, że …
Gdy (tzn. pochodzi z modelu regresji liniowej), w tym przypadku resztki są skorelowane i nie są niezależne. Ale kiedy wykonujemy diagnostykę regresji i chcemy przetestować założenie , każdy podręcznik sugeruje użycie wykresów Q – Q i testów statystycznych dla reszt które zostały zaprojektowane do testowania, czy dla niektórych .Y= A …
Mam zestaw danych z dwiema kategorycznymi zmiennymi nominalnymi (obie z 5 kategoriami). Chciałbym wiedzieć, czy (i jak) jestem w stanie zidentyfikować potencjalne korelacje między kategoriami na podstawie tych dwóch zmiennych. Innymi słowy, czy na przykład wyniki kategorii w zmiennej 1 wykazują silną korelację z określoną kategorią zmiennej 2. Ponieważ mam …
Używam PROC GLM w SAS, aby dopasować równanie regresji o następującej formie Y=b0+b1X1+b2)X2)+b3)X3)+b4tY=b0+b1X1+b2)X2)+b3)X3)+b4t Y = b_0 + b_1X_1 + b_2X_2 + b_3X_3 + b_4t Wykres QQ powstałych czerwonych reszt wskazuje na odchylenie od normalności. Jakakolwiek transformacja nie jest przydatna w normalizacji reszt.YYY W tym momencie mogę bezpiecznie przejść do metod …
Według analizy regresji według przykładu , reszta jest różnicą między odpowiedzią a wartością przewidywaną, a następnie mówi się, że każda reszta ma inną wariancję, więc musimy rozważyć standaryzowane reszty. Ale wariancja dotyczy grupy wartości, w jaki sposób pojedyncza wartość może mieć wariancję?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.