Statystyki i duże zbiory danych residuals

3

Co jeśli resztki są normalnie rozłożone, ale y nie jest?

Mam dziwne pytanie. Załóżmy, że masz małą próbkę, w której zmienna zależna, którą zamierzasz przeanalizować za pomocą prostego modelu liniowego, jest mocno pochylona. Zatem zakładasz, że nie jest normalnie dystrybuowany, ponieważ spowodowałoby to normalną dystrybucję . Ale podczas obliczania wykresu QQ-Normal istnieją dowody, że reszty są zwykle rozkładane. Zatem każdy …

110 regression residuals error normality-assumption

1

Interpretowanie plot.lm ()

Miałem pytanie dotyczące interpretacji wykresów generowanych przez wykres (lm) w R. Zastanawiałem się, czy moglibyście mi powiedzieć, jak interpretować wykresy położenia skali i wykresy rezydualne dźwigni? Wszelkie uwagi będą mile widziane. Zakłada podstawową wiedzę na temat statystyki, regresji i ekonometrii.

89 r regression data-visualization residuals outliers

4

Wykresy diagnostyczne dla regresji zliczania

Jakie wykresy diagnostyczne (i być może testy formalne) są najbardziej przydatne dla regresji, w których wynikiem jest zmienna licząca? Szczególnie interesują mnie modele Poissona i modele dwumianowe ujemne, a także ich odpowiedniki zerowe i przeszkodowe. Większość źródeł, które znalazłem, po prostu kreśli wartości resztkowe w stosunku do dopasowanych wartości bez …

88 generalized-linear-model residuals negative-binomial zero-inflation poisson-regression

3

Co oznaczają reszty w regresji logistycznej?

Odpowiadając na to pytanie, John Christie zasugerował, że dopasowanie modeli regresji logistycznej należy oceniać poprzez ocenę reszt. Znam sposób interpretowania reszt w OLS, są one w tej samej skali co DV i bardzo wyraźnie różnica między y przewidywana przez model y. Jednak w przypadku regresji logistycznej w przeszłości zwykle badałem …

62 r logistic generalized-linear-model residuals aic

3

Założenie ANOVA normalność / rozkład normalny reszt

Strona Wikipedii na temat ANOVA wymienia trzy założenia , a mianowicie: Niezależność przypadków - jest to założenie modelu upraszczającego analizę statystyczną. Normalność - rozkłady reszt są normalne. Równość (lub „jednorodność”) wariancji, zwana homoscedastycznością ... Punkt zainteresowania jest tutaj drugim założeniem. Kilka źródeł wylicza założenie inaczej. Niektórzy mówią o normalności surowych …

52 anova residuals assumptions normality-assumption

6

Czy reszty są „przewidywane minus rzeczywiste” lub „rzeczywiste minus prognozowane”

Widziałem „reszty” zdefiniowane na różne sposoby jako „przewidywane minus rzeczywiste wartości” lub „rzeczywiste minus przewidywane wartości”. W celach ilustracyjnych, aby pokazać, że obie formuły są szeroko stosowane, porównaj następujące wyszukiwania w Internecie: resztkowe „przewidywane minus rzeczywiste” pozostałe „rzeczywiste minus przewidywane” W praktyce prawie nigdy nie robi to różnicy, ponieważ znak …

46 residuals terminology error

2

Dlaczego Bayesjanin nie może patrzeć na pozostałości?

W artykule „Dyskusja: Czy ekolodzy powinni zostać Bayesianami?” Brian Dennis przedstawia zaskakująco zrównoważony i pozytywny pogląd na statystyki bayesowskie, kiedy wydaje się, że jego celem jest ostrzeganie ludzi przed tym. Jednak w jednym akapicie, bez żadnych cytatów ani uzasadnień, mówi: Widzisz, Bayesianie nie mogą patrzeć na swoje pozostałości. Naruszenie zasady …

46 bayesian residuals frequentist likelihood-principle

5

Regresja, gdy reszty OLS nie są zwykle rozkładane

Na tej stronie jest kilka wątków omawiających, jak ustalić, czy reszty OLS są asymptotycznie normalnie rozłożone. Inny sposób oceny normalności reszt za pomocą kodu R znajduje się w tej doskonałej odpowiedzi . To kolejna dyskusja na temat praktycznej różnicy między znormalizowanymi a zaobserwowanymi resztkami. Powiedzmy jednak, że reszty zdecydowanie nie …

43 regression least-squares residuals assumptions normality-assumption

2

Jak czytać wykresy odległości Cooka?

Czy ktoś wie, jak sprawdzić, czy punkty 7, 16 i 29 są punktami wpływowymi, czy nie? Czytałem gdzieś, że ponieważ odległość Cooka jest mniejsza niż 1, nie są. Czy mam rację?

40 r regression residuals diagnostic cooks-distance

3

Co to jest pozostały błąd standardowy?

Podczas uruchamiania modelu regresji wielokrotnej w R jednym z wyjść jest resztkowy błąd standardowy wynoszący 0,0589 przy 95161 stopniach swobody. Wiem, że 95.161 stopni swobody wynika z różnicy między liczbą obserwacji w mojej próbce a liczbą zmiennych w moim modelu. Jaki jest pozostały błąd standardowy?

35 regression standard-error residuals

3

R - Mylone z terminologią resztkową

Błąd średniej kwadratowej rezydualna suma kwadratów błąd resztkowy standardowy średni błąd kwadratu błąd testu Myślałem, że kiedyś rozumiałem te terminy, ale im więcej robię problemów statystycznych, tym bardziej się mylę, gdy się domyślam. Chciałbym trochę pewności i konkretnego przykładu Potrafię łatwo znaleźć równania w Internecie, ale mam problem z uzyskaniem …

34 r regression residuals

2

Interpretacja wykresu reszt i dopasowanych wartości w celu weryfikacji założeń modelu liniowego

Rozważ następującą liczbę z modeli liniowych Faraway z R (2005, s. 59). Pierwszy wykres wydaje się wskazywać, że reszty i dopasowane wartości są nieskorelowane, ponieważ powinny być w homoscedastycznym modelu liniowym z błędami o rozkładzie normalnym. Dlatego drugi i trzeci wykres, które wydają się wskazywać na zależność między wartościami resztkowymi …

34 regression residuals assumptions graphical-model

3

Normalność zmiennej zależnej = normalność reszt?

Wydaje się, że ta kwestia cały czas ma brzydką głowę i staram się ją dekapitować dla własnego zrozumienia statystyki (i rozsądku!). Założenia ogólnych modeli liniowych (test t, ANOVA, regresja itp.) Obejmują „założenie normalności”, ale stwierdziłem, że rzadko jest to jasno opisane. Często natrafiam na podręczniki / podręczniki statystyki / po …

34 normal-distribution residuals normality-assumption

3

Dlaczego istnieje różnica pomiędzy ręcznym obliczeniem regresji logistycznej 95% przedziału ufności a użyciem funkcji confint () w R?

Drodzy wszyscy - zauważyłem coś dziwnego, czego nie potrafię wyjaśnić, prawda? Podsumowując: ręczne podejście do obliczania przedziału ufności w modelu regresji logistycznej oraz funkcja R confint()dają różne wyniki. Przechodziłem przez regresję logistyczną stosowaną przez Hosmer & Lemeshow (2. edycja). W trzecim rozdziale znajduje się przykład obliczenia ilorazu szans i 95% …

34 r regression logistic confidence-interval profile-likelihood correlation mcmc error mixture measurement data-augmentation r logistic goodness-of-fit r time-series exponential descriptive-statistics average expected-value data-visualization anova teaching hypothesis-testing multivariate-analysis r r mixed-model clustering categorical-data unsupervised-learning r logistic anova binomial estimation variance expected-value r r anova mixed-model multiple-comparisons repeated-measures project-management r poisson-distribution control-chart project-management regression residuals r distributions data-visualization r unbiased-estimator kurtosis expected-value regression spss meta-analysis r censoring regression classification data-mining mixture

3

Interpretowanie resztkowych wykresów diagnostycznych dla modeli GLM?

Szukam wskazówek, jak interpretować wykresy resztkowe modeli GLM. Szczególnie modele Poissona, ujemne dwumianowe, dwumianowe. Czego możemy oczekiwać od tych wykresów, gdy modele są „poprawne”? (na przykład oczekujemy wzrostu wariancji wraz ze wzrostem przewidywanej wartości, na przykład w przypadku modelu Poissona) Wiem, że odpowiedzi zależą od modeli. Wszelkie odniesienia (lub ogólne …

33 generalized-linear-model diagnostic residuals

Pytania otagowane jako residuals