Resztki modelu to wartości rzeczywiste minus wartości prognozowane. Wiele modeli statystycznych przyjmuje założenia dotyczące błędu, który jest szacowany na podstawie reszt.
Jest to mozaika wykres tabeli awaryjnego zestawu danych HairEyeColoropisanego tutaj . Jak interpretować kolory reprezentujące reszty? Jaka jest różnica między wysoką a dodatnią resztą Pearsona (pokazaną na niebiesko) w porównaniu z niską i ujemną resztą na czerwono?
Czy w modelu proporcjonalnego hazardu Coxa z wieloma zmiennymi, jeśli reszty Schoenfelda nie są płaskie dla jednej ze zmiennych, czy to unieważnia cały model, czy można po prostu zignorować zmienną o niskiej wydajności? Oznacza to, że interpretuj współczynniki dla innych zmiennych, ale nie interpretuj wynikowych współczynników dla zmiennej o niskiej …
Chciałbym wiedzieć, czy warto badać wykresy reszt w odniesieniu do zmiennej zależnej, gdy mam regresję jednowymiarową. Jeśli ma to sens, co oznacza silna, liniowa, rosnąca korelacja między resztami (na osi y) a oszacowanymi wartościami zmiennej zależnej (na osi x)?
Przeprowadzam wielokrotną regresję liniową poniżej w R, aby przewidzieć zwrot z zarządzanego funduszu. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Tutaj tylko GRI i MBA są predyktorami binarnymi / dychotomicznymi; pozostałe predyktory są ciągłe. Używam tego kodu do generowania wykresów resztkowych dla zmiennych binarnych. plot(rawdata$GRI, reg$residuals) abline(lm(reg$residuals~rawdata$GRI, data=rawdata), col="red") # regression line (y~x) …
W moich danych obserwuję dziwne wzorce w resztkach: [EDYCJA] Oto wykresy częściowej regresji dla dwóch zmiennych: [EDIT2] Dodano wykres PP Wygląda na to, że dystrybucja jest w porządku (patrz poniżej), ale nie mam pojęcia, skąd ta prosta może pochodzić. Jakieś pomysły? [AKTUALIZACJA 31.07] Okazuje się, że miałeś całkowitą rację, miałem …
Czy ktoś wie, jaki jest wzór na odległość Cooka? Oryginalna formuła odległości Cooka wykorzystuje resztki studenckie, ale dlaczego R używa std. Resztki Pearsona podczas obliczania wykresu odległości Cooka dla GLM. Wiem, że resztki studenckie nie są zdefiniowane dla GLM, ale jak wygląda wzór do obliczania odległości Cooka? Załóżmy następujący przykład: …
Zastosowałem test DW do mojego modelu regresji w R i otrzymałem statystykę testu DW wynoszącą 1,78 i wartość p 2,2e-16 = 0. Czy to oznacza, że nie ma autokorelacji między resztami, ponieważ stat jest bliski 2 z małą wartością p, czy to oznacza, że chociaż stat jest bliski 2, wartość …
Eksperymentowałem z zależnością między błędami a resztkami, używając kilku prostych symulacji w R. Jedną z rzeczy, które znalazłem, jest to, że niezależnie od wielkości próbki lub wariancji błędu zawsze otrzymuję dokładnie dla nachylenia, gdy dopasujesz model111 errors∼β0+β1×residualserrors∼β0+β1×residuals {\rm errors} \sim \beta_0 + \beta_1 \times {\rm residuals} Oto przeprowadzona przeze mnie …
Zanim zadałem to pytanie, przeszukałem naszą stronę i znalazłem wiele podobnych pytań (jak tutaj , tutaj i tutaj ). Ale wydaje mi się, że na te powiązane pytania nie udzielono odpowiedzi lub nie omówiono ich, dlatego chciałbym ponownie zadać to pytanie. Uważam, że powinna istnieć duża liczba odbiorców, którzy chcieliby, …
Mam pytanie dotyczące uogólnionych modeli liniowych (GLM). Moja zmienna zależna (DV) jest ciągła i nie jest normalna. Więc logowałem to przekształciłem (wciąż nie jest normalne, ale poprawiłem). Chcę powiązać DV z dwiema zmiennymi kategorialnymi i jedną ciągłą zmienną zmienną. W tym celu chcę przeprowadzić GLM (używam SPSS), ale nie jestem …
Czy ktoś wie, jak obliczyć (lub wyodrębnić) dźwignię i odległości Cooka dla merobiektu klasy (uzyskanego przez lme4pakiet)? Chciałbym je nakreślić w celu analizy pozostałości.
Po pierwsze, powinienem stwierdzić, że szukałem odpowiedzi na tej stronie. Albo nie znalazłem pytania, które odpowiedziałoby na moje pytanie, albo mój poziom wiedzy jest tak niski, że nie zdawałem sobie sprawy, że już przeczytałem odpowiedź. Studiuję do egzaminu AP Statistics. Muszę nauczyć się regresji liniowej, a jednym z tematów są …
Powodem, dla którego o to pytam, jest to, że wydaje się, że wewnętrznie uczone reszty wydają się mieć ten sam wzór, co surowe szacunkowe reszty. Byłoby wspaniale, gdyby ktoś mógł wyjaśnić.
Pytanie : Jak mogę skonstruować test w celu ustalenia, czy obserwowana częstotliwość „górskich” alleli (ryc. 1) jest znacznie niższa w środkowych i południowych górach niż przewidywana (ryc. 2) w modelu selekcji ekologicznej ( szczegóły poniżej ) Problem : Moją początkową myślą było zresetowanie reszt modelowych względem szerokości i długości geograficznej …
Czy istnieją jakieś szczególne założenia dotyczące błędów regresji logistycznej, takie jak stała wariancja terminów błędów i normalność reszt? Czy zazwyczaj usuwasz je również, gdy masz punkty o odległości Cooka większej niż 4 / n? Jeśli je usuniesz, jak możesz stwierdzić, czy model z usuniętymi punktami jest lepszy?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.