Statystyki i duże zbiory danych goodness-of-fit

3

Jak sprawdzić, czy moje dane pasują do rozkładu wykładniczego?

Jak mogę sprawdzić, czy moje dane, np. Wynagrodzenie, pochodzą z ciągłego wykładniczego rozkładu w R? Oto histogram mojej próbki: . Każda pomoc będzie mile widziana!

22 r distributions goodness-of-fit exponential

6

Odpowiednie testy normalności dla małych próbek

Do tej pory używałem statystyki Shapiro-Wilka do testowania założeń normalności w małych próbkach. Czy możesz polecić inną technikę?

22 hypothesis-testing goodness-of-fit normality-assumption small-sample

5

Przekroczenie: Brak srebrnej kuli?

Rozumiem, że nawet przy przestrzeganiu odpowiednich procedur walidacji krzyżowej i wyboru modelu, nadmierne dopasowanie nastąpi, jeśli ktoś będzie szukał wystarczająco modelu , chyba że nałoży ograniczenia na złożoność modelu, okres. Co więcej, często ludzie próbują nauczyć się kar za złożoność modelu na podstawie danych, które podważają ochronę, którą mogą zapewnić. …

21 machine-learning cross-validation goodness-of-fit scikit-learn caret

2

Trudność testowania liniowości w regresji

W Modelowaniu statystycznym: The Two Cultures pisze Leo Breiman Obecnie stosowaną praktyką jest sprawdzanie dopasowania modelu danych za pomocą testów dopasowania i analizy resztkowej. W pewnym momencie, kilka lat temu, stworzyłem symulowany problem regresji w siedmiu wymiarach z kontrolowaną nieliniowością. Standardowe testy dobroci dopasowania nie odrzucały liniowości, dopóki nieliniowość nie …

21 regression goodness-of-fit

2

Jak zmierzyć / argumentować, czy dopasowanie linii trendu do prawa energetycznego jest dobre?

Mam pewne dane, do których próbuję dopasować linię trendu. Wierzę, że dane są zgodne z prawem mocy, dlatego narysowałem dane na osiach log-log, szukając linii prostej. Spowodowało to (prawie) linię prostą, dlatego w programie Excel dodałem linię trendu dla prawa mocy. Będąc nowością statystyczną, moje pytanie brzmi: w jaki sposób …

21 goodness-of-fit power-law

4

Jakie są prawidłowe wartości precyzji i przywołania w przypadkach krawędzi?

Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

2

Czy ważona w solidnym modelu liniowym ma znaczenie dla analizy dobroci dopasowania?

Oszacowałem solidny model liniowy Rz wagami MM, korzystając z rlm()pakietu MASS. „R” nie podaje wartości dla modelu, ale chciałbym ją mieć, jeśli jest to znacząca ilość. Interesuje mnie również to, czy jest jakieś znaczenie posiadanie wartości która waży całkowitą i resztkową wariancję w taki sam sposób, w jaki obserwacje były …

19 r goodness-of-fit r-squared robust rlm

1

Dobroć dopasowania i który model wybrać regresję liniową lub Poissona

Potrzebuję porady dotyczącej dwóch głównych dylematów w moich badaniach, które są studium przypadku 3 dużych farmaceutyków i innowacji. Liczba patentów rocznie jest zmienną zależną. Moje pytania są Jakie są najważniejsze kryteria dobrego modelu? Co jest ważniejsze / mniej ważne? Czy to, że większość lub wszystkie zmienne będą znaczące? Czy to …

19 regression generalized-linear-model linear-model goodness-of-fit poisson-regression

1

Dobroć dopasowania do histogramów 2D

Mam dwa zestawy danych reprezentujących parametry gwiazd: obserwowany i modelowany. Za pomocą tych zestawów tworzę tak zwany schemat dwukolorowy (TCD). Próbkę można zobaczyć tutaj: Być obserwowane dane i B dane wydobyte z modelu (nieważne czarne linie, kropki reprezentują dane) Mam tylko jedno A schemat, ale może produkować tyle różnych B …

19 goodness-of-fit histogram

2

Wpływ granic bin na podstawie danych na test dobroci dopasowania chi-kwadrat?

Pomijając oczywistą kwestię niskiej mocy chi-kwadrat w tego rodzaju okolicznościach, wyobraź sobie, że wykonujesz test dobroci chi-kwadrat dla pewnej gęstości z nieokreślonymi parametrami, poprzez binowanie danych. Dla konkretności, powiedzmy rozkład wykładniczy z nieznaną średnią i wielkość próby powiedzmy 100. Aby uzyskać rozsądną liczbę spodziewanych obserwacji na przedział, należałoby wziąć pod …

18 chi-squared goodness-of-fit binning

4

Jaki jest związek między

Zastanawiałem się, czy istnieje związek między a testem F.R2R2R^2 Zwykle i mierzy siłę związek liniowy w regresji.R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} Test F tylko potwierdza hipotezę. Czy istnieje związek pomiędzy R2R2R^2 i F-test?

17 regression hypothesis-testing least-squares goodness-of-fit

3

Co oznacza ujemne R-kwadrat?

Powiedzmy, że mam jakieś dane, a następnie dopasowuję dane do modelu (regresja nieliniowa). Następnie obliczam R-kwadrat ( ).R2R2R^2 Kiedy R-kwadrat jest ujemny, co to oznacza? Czy to znaczy, że mój model jest zły? Wiem, że zakres może wynosić [-1,1]. Kiedy wynosi 0, co to oznacza?R2R2R^2R2R2R^2

17 regression goodness-of-fit r-squared curve-fitting

2

Resztki Pearsona

Pytanie początkującego o resztki Pearsona w kontekście testu chi-kwadrat na dobroć dopasowania: Oprócz statystyki testowej chisq.testfunkcja R zgłasza resztkową wartość Pearsona: (obs - exp) / sqrt(exp) Rozumiem, dlaczego przyglądanie się różnicy między wartościami obserwowanymi i oczekiwanymi nie jest tak pouczające, ponieważ mniejsza próbka spowoduje mniejszą różnicę. Chciałbym jednak dowiedzieć się …

16 chi-squared goodness-of-fit residuals

5

Sprawdzanie założeń ANOVA

Kilka miesięcy temu opublikowałem pytanie dotyczące testów homoscedastyczności w R na SO, a Ian Fellows odpowiedział na to (sparafrazuję jego odpowiedź bardzo luźno): Testy homoscedastyczności nie są dobrym narzędziem do testowania dopasowania modelu. Przy małych próbkach nie masz wystarczającej mocy, aby wykryć odstępstwa od homoscedastyczności, podczas gdy przy dużych próbkach …

16 hypothesis-testing anova nonparametric goodness-of-fit heteroscedasticity

2

Test post-hoc dla testu dopasowania chi-kwadrat

Przeprowadzam test dobroci dopasowania chi-kwadrat (GOF) z trzema kategoriami i szczególnie chcę przetestować zero, że proporcje populacji w każdej kategorii są równe (tj. Proporcja wynosi 1/3 w każdej grupie): OBSERWOWANE DANE Grupa 1 Grupa 2 Grupa 3 Ogółem 686928 1012 2626 Zatem dla tego testu GOF oczekiwane liczby wynoszą 2626 …

16 hypothesis-testing chi-squared goodness-of-fit post-hoc

Pytania otagowane jako goodness-of-fit