Resztki modelu to wartości rzeczywiste minus wartości prognozowane. Wiele modeli statystycznych przyjmuje założenia dotyczące błędu, który jest szacowany na podstawie reszt.
Patrząc na definicje Wikipedii: Mean Squared Error (MSE) Resztkowa suma kwadratów (RSS) Tak mi się wydaje MSE = 1N.RSS = 1N.∑ ( fja- yja)2)MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 gdzie N.NN jest numerem on próbek i fifif_i jest nasza ocena yiyiy_i . Jednak żaden z artykułów Wikipedii …
To wygląda na podobne pytanie i nie uzyskało wielu odpowiedzi. Pomijając testy, takie jak D Cooka, i patrząc na resztki jako grupę, interesuje mnie, w jaki sposób inni używają resztek podczas oceny dobroci dopasowania. Używam surowych pozostałości: na wykresie QQ do oceny normalności w wykresie rozrzutu porównaniu do reszt, w …
Kiedy korzystam z GAM, daje mi resztkowy DF (ostatni wiersz kodu). Co to znaczy? Wychodząc poza przykład GAM, ogólnie, czy liczba stopni swobody może być liczbą niecałkowitą?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 …
Nauczyłem się, że muszę testować normalność nie na surowych danych, ale na ich pozostałościach. Czy powinienem obliczyć pozostałości, a następnie wykonać test W Shapiro – Wilka? Czy reszty są obliczane jako: ?Xja- znaczyXja-oznaczaćX_i - \text{mean} Zobacz moje poprzednie pytanie dotyczące moich danych i projektu.
W wielokrotnej regresji liniowej rozumiem, że korelacje między resztą a predyktorami wynoszą zero, ale jaka jest oczekiwana korelacja między resztą a zmienną kryterium? Czy powinno być zerowe czy wysoce skorelowane? Jakie jest tego znaczenie?
Obecnie mam trudności ze znalezieniem odpowiedniego modelu dla danych trudnych do zliczenia (zmienna zależna). Próbowałem różnych modeli (modele efektów mieszanych są niezbędne dla mojego rodzaju danych), takich jak lmeri lme4(z transformacją logarytmiczną), a także uogólnionych liniowych modeli efektów mieszanych z różnymi rodzinami, takimi jak dwumian Gaussa lub ujemny. Nie jestem …
Jestem trochę zdezorientowany, jakie są założenia regresji liniowej. Do tej pory sprawdziłem, czy: wszystkie zmienne objaśniające korelowały liniowo ze zmienną odpowiedzi. (Tak było) między zmiennymi objaśniającymi była jakakolwiek kolinearność. (była niewielka kolinearność). odległości Cooka od punktów danych mojego modelu są mniejsze niż 1 (tak jest, wszystkie odległości są mniejsze niż …
Gelman i Hill (2006) piszą na s. 46, że: Założeniem regresji, które jest na ogół najmniej ważne, jest to, że błędy są zwykle rozkładane. W rzeczywistości, w celu oszacowania linii regresji (w porównaniu z przewidywaniem poszczególnych punktów danych), założenie normalności nie jest wcale ważne. Zatem, w przeciwieństwie do wielu podręczników …
Niedawno przystąpiłem do dopasowywania modeli mieszanych z regresją w ramach Bayesa, używając algorytmu MCMC (właściwie funkcja MCMCglmm w R). Wydaje mi się, że zrozumiałem, jak zdiagnozować zbieżność procesu szacowania (ślad, wykres Geweke'a, autokorelacja, rozkład tylny ...). Jedną z rzeczy, która uderza mnie w ramy Bayesa, jest to, że wiele wysiłku …
Zgodnie z tekstem, którego używam, wzór na wariancję reszty podaje:ithithi^{th} σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) I trudno w wierzyć od końcowa jest różnica pomiędzy obserwowanych wartości i wartość zmontowanym; jeśliby obliczyć wariancję różnicy, przynajmniej oczekiwałbym pewnych „plusów” w wynikowym wyrażeniu. Każda pomoc w zrozumieniu pochodnej będzie mile widziana.ithithi^{th}ithithi^{th}ithithi^{th}
Architekturę wąskiego gardła definiujemy jako typ znaleziony w dokumencie ResNet, w którym [dwie warstwy konwekcyjne 3x3] są zastępowane przez [jedna konwekcja 1x1, jedna konwekcja 3x3 i kolejna warstwa konwekcyjna 1x1]. Rozumiem, że warstwy konwekcji 1x1 są używane jako forma redukcji wymiarów (i przywracania), co wyjaśniono w innym poście . Nie …
Wikipedia i winieta pakietu warstwowego R dostarczają dobrych informacji na temat założeń wspierających standardowe błędy współczynnika OLS oraz matematycznego tła estymatorów warstwowych. Nadal nie jestem pewien, w jaki sposób rozwiązany jest problem heteroscedastyczności resztek, prawdopodobnie dlatego, że nie do końca rozumiem standardowe oszacowanie wariancji współczynników OLS. Jaka intuicja kryje się …
W kontekście regresji OLS rozumiem, że wykres resztkowy (w porównaniu z dopasowanymi wartościami) jest konwencjonalnie oglądany w celu przetestowania stałej wariancji i oceny specyfikacji modelu. Dlaczego reszty są wykreślane względem pasowań, a nie wartości ? Czym różnią się informacje od tych dwóch wykresów?YYY Pracuję nad modelem, który wytworzył następujące wykresy …
Podczas gdy te dwa wszechobecne terminy są często używane jako synonimy, czasem wydaje się, że istnieje rozróżnienie. Czy rzeczywiście jest różnica, czy są one dokładnie synonimami?
Mam GLMM z rozkładem dwumianowym i funkcją linku logit i mam wrażenie, że ważny aspekt danych nie jest dobrze reprezentowany w modelu. Aby to sprawdzić, chciałbym wiedzieć, czy dane są dobrze opisane przez funkcję liniową w skali logit. Dlatego chciałbym wiedzieć, czy reszty są dobrze wychowane. Nie mogę jednak dowiedzieć …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.