Jak mogę sprawdzić, czy moje dane, np. Wynagrodzenie, pochodzą z ciągłego wykładniczego rozkładu w R? Oto histogram mojej próbki: . Każda pomoc będzie mile widziana!
Rozumiem, że nawet przy przestrzeganiu odpowiednich procedur walidacji krzyżowej i wyboru modelu, nadmierne dopasowanie nastąpi, jeśli ktoś będzie szukał wystarczająco modelu , chyba że nałoży ograniczenia na złożoność modelu, okres. Co więcej, często ludzie próbują nauczyć się kar za złożoność modelu na podstawie danych, które podważają ochronę, którą mogą zapewnić. …
W Modelowaniu statystycznym: The Two Cultures pisze Leo Breiman Obecnie stosowaną praktyką jest sprawdzanie dopasowania modelu danych za pomocą testów dopasowania i analizy resztkowej. W pewnym momencie, kilka lat temu, stworzyłem symulowany problem regresji w siedmiu wymiarach z kontrolowaną nieliniowością. Standardowe testy dobroci dopasowania nie odrzucały liniowości, dopóki nieliniowość nie …
Mam pewne dane, do których próbuję dopasować linię trendu. Wierzę, że dane są zgodne z prawem mocy, dlatego narysowałem dane na osiach log-log, szukając linii prostej. Spowodowało to (prawie) linię prostą, dlatego w programie Excel dodałem linię trendu dla prawa mocy. Będąc nowością statystyczną, moje pytanie brzmi: w jaki sposób …
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
Oszacowałem solidny model liniowy Rz wagami MM, korzystając z rlm()pakietu MASS. „R” nie podaje wartości dla modelu, ale chciałbym ją mieć, jeśli jest to znacząca ilość. Interesuje mnie również to, czy jest jakieś znaczenie posiadanie wartości która waży całkowitą i resztkową wariancję w taki sam sposób, w jaki obserwacje były …
Potrzebuję porady dotyczącej dwóch głównych dylematów w moich badaniach, które są studium przypadku 3 dużych farmaceutyków i innowacji. Liczba patentów rocznie jest zmienną zależną. Moje pytania są Jakie są najważniejsze kryteria dobrego modelu? Co jest ważniejsze / mniej ważne? Czy to, że większość lub wszystkie zmienne będą znaczące? Czy to …
Mam dwa zestawy danych reprezentujących parametry gwiazd: obserwowany i modelowany. Za pomocą tych zestawów tworzę tak zwany schemat dwukolorowy (TCD). Próbkę można zobaczyć tutaj: Być obserwowane dane i B dane wydobyte z modelu (nieważne czarne linie, kropki reprezentują dane) Mam tylko jedno A schemat, ale może produkować tyle różnych B …
Pomijając oczywistą kwestię niskiej mocy chi-kwadrat w tego rodzaju okolicznościach, wyobraź sobie, że wykonujesz test dobroci chi-kwadrat dla pewnej gęstości z nieokreślonymi parametrami, poprzez binowanie danych. Dla konkretności, powiedzmy rozkład wykładniczy z nieznaną średnią i wielkość próby powiedzmy 100. Aby uzyskać rozsądną liczbę spodziewanych obserwacji na przedział, należałoby wziąć pod …
Zastanawiałem się, czy istnieje związek między a testem F.R2R2R^2 Zwykle i mierzy siłę związek liniowy w regresji.R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} Test F tylko potwierdza hipotezę. Czy istnieje związek pomiędzy R2R2R^2 i F-test?
Powiedzmy, że mam jakieś dane, a następnie dopasowuję dane do modelu (regresja nieliniowa). Następnie obliczam R-kwadrat ( ).R2R2R^2 Kiedy R-kwadrat jest ujemny, co to oznacza? Czy to znaczy, że mój model jest zły? Wiem, że zakres może wynosić [-1,1]. Kiedy wynosi 0, co to oznacza?R2R2R^2R2R2R^2
Pytanie początkującego o resztki Pearsona w kontekście testu chi-kwadrat na dobroć dopasowania: Oprócz statystyki testowej chisq.testfunkcja R zgłasza resztkową wartość Pearsona: (obs - exp) / sqrt(exp) Rozumiem, dlaczego przyglądanie się różnicy między wartościami obserwowanymi i oczekiwanymi nie jest tak pouczające, ponieważ mniejsza próbka spowoduje mniejszą różnicę. Chciałbym jednak dowiedzieć się …
Kilka miesięcy temu opublikowałem pytanie dotyczące testów homoscedastyczności w R na SO, a Ian Fellows odpowiedział na to (sparafrazuję jego odpowiedź bardzo luźno): Testy homoscedastyczności nie są dobrym narzędziem do testowania dopasowania modelu. Przy małych próbkach nie masz wystarczającej mocy, aby wykryć odstępstwa od homoscedastyczności, podczas gdy przy dużych próbkach …
Przeprowadzam test dobroci dopasowania chi-kwadrat (GOF) z trzema kategoriami i szczególnie chcę przetestować zero, że proporcje populacji w każdej kategorii są równe (tj. Proporcja wynosi 1/3 w każdej grupie): OBSERWOWANE DANE Grupa 1 Grupa 2 Grupa 3 Ogółem 686928 1012 2626 Zatem dla tego testu GOF oczekiwane liczby wynoszą 2626 …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.