Statystyki i duże zbiory danych residuals

1

Jak interpretować kolory resztkowe na mozaice?

Jest to mozaika wykres tabeli awaryjnego zestawu danych HairEyeColoropisanego tutaj . Jak interpretować kolory reprezentujące reszty? Jaka jest różnica między wysoką a dodatnią resztą Pearsona (pokazaną na niebiesko) w porównaniu z niską i ujemną resztą na czerwono?

11 data-visualization chi-squared residuals contingency-tables

1

Resztki Schoenfelda

Czy w modelu proporcjonalnego hazardu Coxa z wieloma zmiennymi, jeśli reszty Schoenfelda nie są płaskie dla jednej ze zmiennych, czy to unieważnia cały model, czy można po prostu zignorować zmienną o niskiej wydajności? Oznacza to, że interpretuj współczynniki dla innych zmiennych, ale nie interpretuj wynikowych współczynników dla zmiennej o niskiej …

11 residuals cox-model schoenfeld-residuals

7

Czy warto badać wykresy reszt w odniesieniu do zmiennej zależnej?

Chciałbym wiedzieć, czy warto badać wykresy reszt w odniesieniu do zmiennej zależnej, gdy mam regresję jednowymiarową. Jeśli ma to sens, co oznacza silna, liniowa, rosnąca korelacja między resztami (na osi y) a oszacowanymi wartościami zmiennej zależnej (na osi x)?

11 regression residuals

2

Jak przeprowadzić analizę resztkową dla binarnych / dychotomicznych niezależnych predyktorów w regresji liniowej?

Przeprowadzam wielokrotną regresję liniową poniżej w R, aby przewidzieć zwrot z zarządzanego funduszu. reg <- lm(formula=RET~GRI+SAT+MBA+AGE+TEN, data=rawdata) Tutaj tylko GRI i MBA są predyktorami binarnymi / dychotomicznymi; pozostałe predyktory są ciągłe. Używam tego kodu do generowania wykresów resztkowych dla zmiennych binarnych. plot(rawdata$GRI, reg$residuals) abline(lm(reg$residuals~rawdata$GRI, data=rawdata), col="red") # regression line (y~x) …

11 r multiple-regression categorical-data heteroscedasticity residuals

4

Ukośne linie proste w wartościach resztkowych względem dopasowanych wartości dla regresji wielokrotnej

W moich danych obserwuję dziwne wzorce w resztkach: [EDYCJA] Oto wykresy częściowej regresji dla dwóch zmiennych: [EDIT2] Dodano wykres PP Wygląda na to, że dystrybucja jest w porządku (patrz poniżej), ale nie mam pojęcia, skąd ta prosta może pochodzić. Jakieś pomysły? [AKTUALIZACJA 31.07] Okazuje się, że miałeś całkowitą rację, miałem …

11 regression multiple-regression residuals diagnostic

1

Jakie resztki i odległość Cooka są używane w GLM?

Czy ktoś wie, jaki jest wzór na odległość Cooka? Oryginalna formuła odległości Cooka wykorzystuje resztki studenckie, ale dlaczego R używa std. Resztki Pearsona podczas obliczania wykresu odległości Cooka dla GLM. Wiem, że resztki studenckie nie są zdefiniowane dla GLM, ale jak wygląda wzór do obliczania odległości Cooka? Załóżmy następujący przykład: …

11 r regression generalized-linear-model residuals cooks-distance

5

Statystyka testu Durbina Watsona

Zastosowałem test DW do mojego modelu regresji w R i otrzymałem statystykę testu DW wynoszącą 1,78 i wartość p 2,2e-16 = 0. Czy to oznacza, że nie ma autokorelacji między resztami, ponieważ stat jest bliski 2 z małą wartością p, czy to oznacza, że chociaż stat jest bliski 2, wartość …

11 r regression hypothesis-testing autocorrelation residuals

2

Dlaczego nachylenie zawsze wynosi dokładnie 1 podczas regresji błędów reszt za pomocą OLS?

Eksperymentowałem z zależnością między błędami a resztkami, używając kilku prostych symulacji w R. Jedną z rzeczy, które znalazłem, jest to, że niezależnie od wielkości próbki lub wariancji błędu zawsze otrzymuję dokładnie dla nachylenia, gdy dopasujesz model111 errors∼β0+β1×residualserrors∼β0+β1×residuals {\rm errors} \sim \beta_0 + \beta_1 \times {\rm residuals} Oto przeprowadzona przeze mnie …

10 regression least-squares residuals

2

Diagnostyka resztkowa i jednorodność wariancji w liniowym modelu mieszanym

Zanim zadałem to pytanie, przeszukałem naszą stronę i znalazłem wiele podobnych pytań (jak tutaj , tutaj i tutaj ). Ale wydaje mi się, że na te powiązane pytania nie udzielono odpowiedzi lub nie omówiono ich, dlatego chciałbym ponownie zadać to pytanie. Uważam, że powinna istnieć duża liczba odbiorców, którzy chcieliby, …

10 mixed-model residuals heteroscedasticity diagnostic

1

Rejestrowałem zmienną zależną, czy mogę używać rozkładu normalnego GLM z funkcją linku LOG?

Mam pytanie dotyczące uogólnionych modeli liniowych (GLM). Moja zmienna zależna (DV) jest ciągła i nie jest normalna. Więc logowałem to przekształciłem (wciąż nie jest normalne, ale poprawiłem). Chcę powiązać DV z dwiema zmiennymi kategorialnymi i jedną ciągłą zmienną zmienną. W tym celu chcę przeprowadzić GLM (używam SPSS), ale nie jestem …

10 normal-distribution generalized-linear-model data-transformation residuals histogram

1

Jak wyodrębnić / obliczyć dźwignię i odległości Cooka dla liniowych modeli efektów mieszanych

Czy ktoś wie, jak obliczyć (lub wyodrębnić) dźwignię i odległości Cooka dla merobiektu klasy (uzyskanego przez lme4pakiet)? Chciałbym je nakreślić w celu analizy pozostałości.

10 r mixed-model linear-model residuals leverage

2

Wpływowa wartość rezydualna vs. wartość odstająca

Po pierwsze, powinienem stwierdzić, że szukałem odpowiedzi na tej stronie. Albo nie znalazłem pytania, które odpowiedziałoby na moje pytanie, albo mój poziom wiedzy jest tak niski, że nie zdawałem sobie sprawy, że już przeczytałem odpowiedź. Studiuję do egzaminu AP Statistics. Muszę nauczyć się regresji liniowej, a jednym z tematów są …

10 regression outliers residuals

2

Jakie zalety oferują „wewnętrznie uczone resztki” w porównaniu z surowymi szacowanymi resztkami pod względem diagnozowania potencjalnych wpływowych punktów danych?

Powodem, dla którego o to pytam, jest to, że wydaje się, że wewnętrznie uczone reszty wydają się mieć ten sam wzór, co surowe szacunkowe reszty. Byłoby wspaniale, gdyby ktoś mógł wyjaśnić.

10 residuals

1

Czy obserwowana częstotliwość alleli jest znacznie mniejsza niż przewidywana?

Pytanie : Jak mogę skonstruować test w celu ustalenia, czy obserwowana częstotliwość „górskich” alleli (ryc. 1) jest znacznie niższa w środkowych i południowych górach niż przewidywana (ryc. 2) w modelu selekcji ekologicznej ( szczegóły poniżej ) Problem : Moją początkową myślą było zresetowanie reszt modelowych względem szerokości i długości geograficznej …

10 hypothesis-testing statistical-significance residuals gam

3

Resztki regresji logistycznej i odległości Cooka

Czy istnieją jakieś szczególne założenia dotyczące błędów regresji logistycznej, takie jak stała wariancja terminów błędów i normalność reszt? Czy zazwyczaj usuwasz je również, gdy masz punkty o odległości Cooka większej niż 4 / n? Jeśli je usuniesz, jak możesz stwierdzić, czy model z usuniętymi punktami jest lepszy?

10 regression logistic residuals diagnostic cooks-distance

Pytania otagowane jako residuals