Statystyki i duże zbiory danych small-sample

7

Jak wybrać test t lub test nieparametryczny, np. Wilcoxon w małych próbkach

Niektóre hipotezy można przetestować za pomocą testu t- Studenta (być może przy użyciu poprawki Welcha dla nierównych wariancji w przypadku dwóch próbek) lub za pomocą testu nieparametrycznego, takiego jak test rangowany ze znakiem Wilcoxona, test U Wilcoxona-Manna-Whitneya, lub test sparowanego znaku. Jak możemy podjąć podstawową decyzję o tym, który test …

96 hypothesis-testing t-test nonparametric small-sample wilcoxon-mann-whitney

4

Czy bootstrap może być postrzegany jako „lekarstwo” na małą próbkę?

To pytanie zostało wywołane przez coś, co przeczytałem w tym podręczniku do statystyki dla absolwentów, a także (niezależnie) usłyszałem podczas tej prezentacji na seminarium statystycznym. W obu przypadkach stwierdzenie było zgodne z „ponieważ wielkość próbki jest dość mała, postanowiliśmy przeprowadzić oszacowanie za pomocą bootstrap zamiast (lub wraz z) tą metodą …

71 bootstrap small-sample

5

Co możemy powiedzieć o populacji w próbie 1?

Zastanawiam się, co możemy powiedzieć, jeśli w ogóle, o średniej populacji, kiedy wszystko, co mam, to jeden pomiar, (wielkość próby 1). Oczywiście chcielibyśmy mieć więcej pomiarów, ale nie możemy ich uzyskać.y 1μμ\muy1y1y_1 Wydaje mi się, że skoro średnia próbki, , jest trywialnie równa , to . Jednak przy wielkości próby …

43 mean sample-size small-sample unbiased-estimator

5

Ostrzeżenie w R - Przybliżenie chi-kwadrat może być niepoprawne

Mam dane pokazujące wyniki egzaminu wstępnego do strażaka. Testuję hipotezę, że wyniki egzaminów i pochodzenie etniczne nie są od siebie niezależne. Aby to przetestować, przeprowadziłem test chi-kwadrat Pearsona w R. Wyniki pokazują, czego się spodziewałem, ale dało ostrzeżenie, że „ In chisq.test(a) : Chi-squared approximation may be incorrect.” > a …

40 r categorical-data chi-squared small-sample error-message

6

Najlepsza metoda na krótkie serie czasowe

Mam pytanie związane z modelowaniem krótkich szeregów czasowych. Nie jest kwestią, czy je wymodelować , ale jak. Jaką metodę poleciłbyś do modelowania (bardzo) krótkich szeregów czasowych (powiedzmy o długości )? Przez „najlepszy” rozumiem tu najbardziej niezawodny, czyli najmniej podatny na błędy ze względu na ograniczoną liczbę obserwacji. W przypadku krótkich …

35 time-series forecasting small-sample

4

Jak wykonać test t-Studenta mający tylko wielkość próby, średnią próbki i średnią populacji?

Studenta -test wymaga próbka odchylenie standardowe . Jak jednak obliczyć dla gdy znana jest tylko wielkość próbki i średnia próbki?s stttssssss Na przykład, jeśli wielkość próbki wynosi a średnia próbki to , wówczas spróbuję utworzyć listę identycznych próbek o wartości każda. Oczekiwane odchylenie standardowe próbki wynosi . Spowoduje to utworzenie …

28 t-test standard-deviation small-sample

2

Jak poradzić sobie z analizą danych eksploracyjnych i pogłębianiem danych w badaniach na małych próbach?

Analiza danych eksploracyjnych (EDA) często prowadzi do eksploracji innych „ścieżek”, które niekoniecznie należą do początkowego zestawu hipotez. Taką sytuację mam w przypadku badań z ograniczoną wielkością próby i dużą ilością danych zebranych za pomocą różnych kwestionariuszy (dane społeczno-demograficzne, skale neuropsychologiczne lub medyczne - np. Funkcjonowanie psychiczne lub fizyczne, poziom depresji …

25 multiple-comparisons epidemiology small-sample eda

2

Stabilność tematu w modelach tematycznych

Pracuję nad projektem, w którym chcę wyodrębnić trochę informacji o zawartości serii esejów otwartych. W tym konkretnym projekcie 148 osób napisało eseje o hipotetycznej organizacji studenckiej w ramach większego eksperymentu. Chociaż w mojej dziedzinie (psychologia społeczna) typowym sposobem analizy tych danych byłoby ręczne kodowanie esejów, chciałbym to zrobić ilościowo, ponieważ …

23 machine-learning model-selection small-sample topic-models dirichlet-process

6

Odpowiednie testy normalności dla małych próbek

Do tej pory używałem statystyki Shapiro-Wilka do testowania założeń normalności w małych próbkach. Czy możesz polecić inną technikę?

22 hypothesis-testing goodness-of-fit normality-assumption small-sample

2

Czy mała próbka może spowodować błąd typu 1?

Nauczyłem się, że mała wielkość próbki może prowadzić do niewystarczającej mocy i błędu typu 2. Mam jednak wrażenie, że małe próbki mogą być generalnie niewiarygodne i mogą przez przypadek doprowadzić do dowolnego wyniku. Czy to prawda?

21 hypothesis-testing small-sample

4

Jakie są prawidłowe wartości precyzji i przywołania w przypadkach krawędzi?

Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

1

Użycie bootstrapu pod H0 do wykonania testu dla różnicy dwóch środków: zastąpienia w grupach lub w próbce zbiorczej

Załóżmy, że mam dane z dwoma niezależnymi grupami: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length …

18 r hypothesis-testing bootstrap small-sample permutation-test

6

Czy mogę ufać znaczącemu wynikowi testu t, jeśli próbka jest mała?

Jeśli mój jednostronny wynik testu t jest znaczący, ale wielkość próbki jest niewielka (np. Poniżej 20 lub więcej), czy nadal mogę ufać temu wynikowi? Jeśli nie, w jaki sposób mam postępować i / lub interpretować ten wynik?

17 statistical-significance t-test interpretation sample-size small-sample

8

Minimalna wielkość próbki dla niesparowanego testu t

Czy istnieje „reguła” określająca minimalną wielkość próbki wymaganą do prawidłowego przeprowadzenia testu t? Na przykład należy dokonać porównania między średnimi 2 populacji. Istnieje 7 punktów danych z jednej populacji i tylko 2 punkty danych z drugiej. Niestety eksperyment jest bardzo kosztowny i czasochłonny, a uzyskanie większej ilości danych nie jest …

16 t-test sample-size small-sample wilcoxon-mann-whitney

2

Średnia (wyniki) vs wynik (konkatenacja) w walidacji krzyżowej

TLDR: Mój zestaw danych to dość małe (120) próbki. Czy podczas 10-krotnej weryfikacji krzyżowej powinienem: Zbierać wyniki z każdego testu, połączyć je w wektor, a następnie obliczyć błąd na tym pełnym wektorze prognoz (120 próbek)? Czy powinienem zamiast tego obliczyć błąd na wyjściach, które otrzymuję przy każdej fałdzie (z 12 …

15 classification cross-validation small-sample

Pytania otagowane jako small-sample