Statystyki i duże zbiory danych hypothesis-testing

2

Dlaczego źle jest zatrzymać test A / B przed osiągnięciem optymalnej wielkości próbki?

Jestem odpowiedzialny za prezentowanie wyników testów A / B (przeprowadzanych na różnych stronach internetowych) w mojej firmie. Test przeprowadzamy przez miesiąc, a następnie sprawdzamy wartości p w regularnych odstępach czasu, aż osiągniemy istotność (lub porzucimy, jeśli istotność nie zostanie osiągnięta po długim czasie testowania), coś, co teraz dowiaduję się, jest …

13 hypothesis-testing statistical-significance bias ab-test optimal-stopping

8

Testowanie algorytmów generowania losowych zmiennych

Jakie metody są używane do testowania algorytmów generowania zmiennych losowych?

12 algorithms hypothesis-testing random-variable random-generation

3

Dlaczego kilka (jeśli nie wszystkie) testy hipotez parametrycznych zakładają losowe próbkowanie?

Testy takie jak Z, t i kilka innych zakładają, że dane są oparte na losowym próbkowaniu. Dlaczego? Załóżmy, że prowadzę badania eksperymentalne, w których bardziej zależy mi na wewnętrznej ważności niż na zewnętrznej. Tak więc, jeśli moja próbka może być nieco stronnicza, to dobrze, ponieważ zgodziłem się nie wywnioskować hipotezy …

12 hypothesis-testing sampling parametric randomness

5

Ustalanie wielkości próbki przed rozpoczęciem eksperymentu lub przeprowadzenie eksperymentu w nieskończoność?

Studiowałem statystyki wiele lat temu i zapomniałem o tym wszystkim, więc mogą wydawać się ogólnymi pytaniami koncepcyjnymi niż cokolwiek konkretnego, ale oto mój problem. Pracuję dla witryny e-commerce jako Projektant UX. Mamy platformę testową A / B, która została zbudowana lata temu i zaczynam w to wątpić. Dane, na podstawie …

12 hypothesis-testing sample-size sequential-analysis

2

Jak rygorystycznie uzasadnić wybrane fałszywie dodatnie / fałszywie ujemne poziomy błędu i leżący u ich podstaw stosunek kosztów?

Kontekst Grupa naukowców i statystów ( Benjamin i in., 2017 ) niedawno zasugerowała, że typowy współczynnik fałszywie dodatnich ( = 0,05) stosowany jako próg dla określenia „istotności statystycznej” musi zostać dostosowany do bardziej konserwatywnego progu ( = .005). Konkurencyjna grupa naukowców i statystyk ( Lakens i in., 2018 ) odpowiedziała, …

12 hypothesis-testing p-value power type-i-and-ii-errors

2

Czy konkursy Kaggle są po prostu wygrane przez przypadek?

Zawody Kaggle określają końcowe rankingi na podstawie ustalonego zestawu testów. Wyciągnięty zestaw testowy jest próbką; może nie być reprezentatywny dla modelowanej populacji. Ponieważ każde zgłoszenie jest jak hipoteza, algorytm, który wygrał konkurencję, może po prostu przypadkiem dopasować zestaw testowy lepiej niż inne. Innymi słowy, gdyby wybrano inny zestaw testów i …

12 machine-learning probability hypothesis-testing sample kaggle

1

Użyj do testu hipotez, że ponieważ szybszy współczynnik konwergencji?

Załóżmy, że mam są iid i chcę zrobić test hipotezy, że wynosi 0. Załóżmy, że mam duże n i mogę użyć twierdzenia o limicie centralnym. Mógłbym również wykonać test, że wynosi 0, co powinno być równoważne testowaniu, że wynosi 0. Ponadto zbieżny do kwadratu chi, gdzie zbiega się do normy. …

12 hypothesis-testing convergence delta-method

2

Wykorzystanie lm do badania proporcji 2 próbek

Od jakiegoś czasu używam modeli liniowych do wykonywania 2-próbnych testów proporcji, ale zdałem sobie sprawę, że to może nie być całkowicie poprawne. Wygląda na to, że zastosowanie uogólnionego modelu liniowego z dwumianową rodziną + łącze tożsamości daje dokładnie niepowiązane wyniki testu proporcji 2 próbek. Jednak użycie modelu liniowego (lub glm …

12 r hypothesis-testing generalized-linear-model proportion

1

Test dobroci dopasowania w regresji logistycznej; które „dopasowanie” chcemy przetestować?

Mam na myśli pytanie i odpowiedzi: Jak porównać (prawdopodobieństwo) zdolność predykcyjną modeli opracowanych na podstawie regresji logistycznej? autor: @Clark Chong oraz odpowiedzi / komentarze @Frank Harrell. oraz na pytanie Stopnie swobody w teście Hosmer-Lemeshowχ2χ2\chi^2 i w komentarzach. Przeczytałem artykuł DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, „Porównanie testów …

12 hypothesis-testing logistic predictive-models regression-strategies hosmer-lemeshow-test

1

Jaka jest różnica między „testowaniem hipotez” a „wyborem modelu”?

W literaturze oba terminy są często używane synonimicznie lub przeplatają się. Teraz próbuję znaleźć wyraźne rozróżnienie między tymi dwoma terminami. Z mojego punktu widzenia hipoteza jest zwykle wyrażana za pomocą modelu. Więc nawet jeśli przetestujemy hipotezę zerową vs. alternatywną, z mojej perspektywy dokonujemy wyboru modelu. Czy ktoś może mi intuicyjnie …

12 hypothesis-testing model-selection regression-strategies

5

Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?

Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

2

Dlaczego ta dystrybucja jest jednolita?

Badamy bayesowskie testy statystyczne i natrafiliśmy na dziwne (przynajmniej dla mnie) zjawisko. Rozważ następujący przypadek: interesuje nas pomiar, która populacja, A lub B, ma wyższy współczynnik konwersji. Dla kontroli poczytalności ustawiamy , to znaczy prawdopodobieństwo konwersji jest równe w obu grupach. Generujemy sztuczne dane przy użyciu modelu dwumianowego, np.pA=pBpA=pBp_A = …

12 hypothesis-testing bayesian binomial python beta-distribution

1

Jak wykonać test ładowania początkowego, aby porównać średnie z dwóch próbek?

Mam dwie mocno wypaczone próbki i próbuję użyć ładowania początkowego w celu porównania ich średnich za pomocą statystyki t. Jaka jest poprawna procedura, aby to zrobić? Proces, którego używam Niepokoi mnie właściwość zastosowania standardowego błędu oryginalnych / zaobserwowanych danych w ostatnim etapie, gdy wiem, że nie jest to normalnie rozpowszechniane. …

12 hypothesis-testing t-test bootstrap

1

Jeśli rozkład statystyki testowej jest bimodalny, to czy wartość p coś znaczy?

Wartość p określa się jako prawdopodobieństwo uzyskania statystyki testowej co najmniej tak ekstremalnej, jak to, co obserwuje się, przy założeniu, że hipoteza zerowa jest prawdziwa. Innymi słowy, P(X≥t|H0)P(X≥t|H0)P( X \ge t | H_0 ) Ale co, jeśli statystyka testowa ma rozkład bimodalny? czy wartość p oznacza coś w tym kontekście? …

12 hypothesis-testing statistical-significance p-value descriptive-statistics bimodal

1

Dlaczego test F w Gaussowskich modelach liniowych jest najbardziej wydajny?

W przypadku Gaussowskiego modelu liniowego gdzie zakłada się, że leży w pewnej przestrzeni wektorowej a ma standardowy rozkład normalny na , statystyka testu dla , gdzie jest przestrzeń wektorową, to zwiększa się do jedną z funkcji odchyleń statystyki: Skąd możemy wiedzieć, że ta statystyka zapewnia najsilniejszy test dla H_0Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu …

12 hypothesis-testing normal-distribution linear-model power likelihood-ratio

Pytania otagowane jako hypothesis-testing