Pytania otagowane jako hypothesis-testing

Testowanie hipotez ocenia, czy dane są niespójne z daną hipotezą, a nie są efektem przypadkowych fluktuacji.

2
Dlaczego źle jest zatrzymać test A / B przed osiągnięciem optymalnej wielkości próbki?
Jestem odpowiedzialny za prezentowanie wyników testów A / B (przeprowadzanych na różnych stronach internetowych) w mojej firmie. Test przeprowadzamy przez miesiąc, a następnie sprawdzamy wartości p w regularnych odstępach czasu, aż osiągniemy istotność (lub porzucimy, jeśli istotność nie zostanie osiągnięta po długim czasie testowania), coś, co teraz dowiaduję się, jest …


3
Dlaczego kilka (jeśli nie wszystkie) testy hipotez parametrycznych zakładają losowe próbkowanie?
Testy takie jak Z, t i kilka innych zakładają, że dane są oparte na losowym próbkowaniu. Dlaczego? Załóżmy, że prowadzę badania eksperymentalne, w których bardziej zależy mi na wewnętrznej ważności niż na zewnętrznej. Tak więc, jeśli moja próbka może być nieco stronnicza, to dobrze, ponieważ zgodziłem się nie wywnioskować hipotezy …

5
Ustalanie wielkości próbki przed rozpoczęciem eksperymentu lub przeprowadzenie eksperymentu w nieskończoność?
Studiowałem statystyki wiele lat temu i zapomniałem o tym wszystkim, więc mogą wydawać się ogólnymi pytaniami koncepcyjnymi niż cokolwiek konkretnego, ale oto mój problem. Pracuję dla witryny e-commerce jako Projektant UX. Mamy platformę testową A / B, która została zbudowana lata temu i zaczynam w to wątpić. Dane, na podstawie …

2
Jak rygorystycznie uzasadnić wybrane fałszywie dodatnie / fałszywie ujemne poziomy błędu i leżący u ich podstaw stosunek kosztów?
Kontekst Grupa naukowców i statystów ( Benjamin i in., 2017 ) niedawno zasugerowała, że ​​typowy współczynnik fałszywie dodatnich ( = 0,05) stosowany jako próg dla określenia „istotności statystycznej” musi zostać dostosowany do bardziej konserwatywnego progu ( = .005). Konkurencyjna grupa naukowców i statystyk ( Lakens i in., 2018 ) odpowiedziała, …

2
Czy konkursy Kaggle są po prostu wygrane przez przypadek?
Zawody Kaggle określają końcowe rankingi na podstawie ustalonego zestawu testów. Wyciągnięty zestaw testowy jest próbką; może nie być reprezentatywny dla modelowanej populacji. Ponieważ każde zgłoszenie jest jak hipoteza, algorytm, który wygrał konkurencję, może po prostu przypadkiem dopasować zestaw testowy lepiej niż inne. Innymi słowy, gdyby wybrano inny zestaw testów i …



1
Test dobroci dopasowania w regresji logistycznej; które „dopasowanie” chcemy przetestować?
Mam na myśli pytanie i odpowiedzi: Jak porównać (prawdopodobieństwo) zdolność predykcyjną modeli opracowanych na podstawie regresji logistycznej? autor: @Clark Chong oraz odpowiedzi / komentarze @Frank Harrell. oraz na pytanie Stopnie swobody w teście Hosmer-Lemeshowχ2χ2\chi^2 i w komentarzach. Przeczytałem artykuł DW Hosmer, T. Hosmer, S. Le Cessie, S. Lemeshow, „Porównanie testów …

1
Jaka jest różnica między „testowaniem hipotez” a „wyborem modelu”?
W literaturze oba terminy są często używane synonimicznie lub przeplatają się. Teraz próbuję znaleźć wyraźne rozróżnienie między tymi dwoma terminami. Z mojego punktu widzenia hipoteza jest zwykle wyrażana za pomocą modelu. Więc nawet jeśli przetestujemy hipotezę zerową vs. alternatywną, z mojej perspektywy dokonujemy wyboru modelu. Czy ktoś może mi intuicyjnie …

5
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?
Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Dlaczego ta dystrybucja jest jednolita?
Badamy bayesowskie testy statystyczne i natrafiliśmy na dziwne (przynajmniej dla mnie) zjawisko. Rozważ następujący przypadek: interesuje nas pomiar, która populacja, A lub B, ma wyższy współczynnik konwersji. Dla kontroli poczytalności ustawiamy , to znaczy prawdopodobieństwo konwersji jest równe w obu grupach. Generujemy sztuczne dane przy użyciu modelu dwumianowego, np.pA=pBpA=pBp_A = …

1
Jak wykonać test ładowania początkowego, aby porównać średnie z dwóch próbek?
Mam dwie mocno wypaczone próbki i próbuję użyć ładowania początkowego w celu porównania ich średnich za pomocą statystyki t. Jaka jest poprawna procedura, aby to zrobić? Proces, którego używam Niepokoi mnie właściwość zastosowania standardowego błędu oryginalnych / zaobserwowanych danych w ostatnim etapie, gdy wiem, że nie jest to normalnie rozpowszechniane. …

1
Jeśli rozkład statystyki testowej jest bimodalny, to czy wartość p coś znaczy?
Wartość p określa się jako prawdopodobieństwo uzyskania statystyki testowej co najmniej tak ekstremalnej, jak to, co obserwuje się, przy założeniu, że hipoteza zerowa jest prawdziwa. Innymi słowy, P(X≥t|H0)P(X≥t|H0)P( X \ge t | H_0 ) Ale co, jeśli statystyka testowa ma rozkład bimodalny? czy wartość p oznacza coś w tym kontekście? …

1
Dlaczego test F w Gaussowskich modelach liniowych jest najbardziej wydajny?
W przypadku Gaussowskiego modelu liniowego gdzie zakłada się, że leży w pewnej przestrzeni wektorowej a ma standardowy rozkład normalny na , statystyka testu dla , gdzie jest przestrzeń wektorową, to zwiększa się do jedną z funkcji odchyleń statystyki: Skąd możemy wiedzieć, że ta statystyka zapewnia najsilniejszy test dla H_0Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.