Odnosi się do komplikacji lub problemów statystycznych wynikających z niewielu danych. Jeśli Twoje pytanie dotyczy małej próbki w stosunku do liczby zmiennych, użyj zamiast tego tagu [underdetermined].
Niektóre hipotezy można przetestować za pomocą testu t- Studenta (być może przy użyciu poprawki Welcha dla nierównych wariancji w przypadku dwóch próbek) lub za pomocą testu nieparametrycznego, takiego jak test rangowany ze znakiem Wilcoxona, test U Wilcoxona-Manna-Whitneya, lub test sparowanego znaku. Jak możemy podjąć podstawową decyzję o tym, który test …
To pytanie zostało wywołane przez coś, co przeczytałem w tym podręczniku do statystyki dla absolwentów, a także (niezależnie) usłyszałem podczas tej prezentacji na seminarium statystycznym. W obu przypadkach stwierdzenie było zgodne z „ponieważ wielkość próbki jest dość mała, postanowiliśmy przeprowadzić oszacowanie za pomocą bootstrap zamiast (lub wraz z) tą metodą …
Zastanawiam się, co możemy powiedzieć, jeśli w ogóle, o średniej populacji, kiedy wszystko, co mam, to jeden pomiar, (wielkość próby 1). Oczywiście chcielibyśmy mieć więcej pomiarów, ale nie możemy ich uzyskać.y 1μμ\muy1y1y_1 Wydaje mi się, że skoro średnia próbki, , jest trywialnie równa , to . Jednak przy wielkości próby …
Mam dane pokazujące wyniki egzaminu wstępnego do strażaka. Testuję hipotezę, że wyniki egzaminów i pochodzenie etniczne nie są od siebie niezależne. Aby to przetestować, przeprowadziłem test chi-kwadrat Pearsona w R. Wyniki pokazują, czego się spodziewałem, ale dało ostrzeżenie, że „ In chisq.test(a) : Chi-squared approximation may be incorrect.” > a …
Mam pytanie związane z modelowaniem krótkich szeregów czasowych. Nie jest kwestią, czy je wymodelować , ale jak. Jaką metodę poleciłbyś do modelowania (bardzo) krótkich szeregów czasowych (powiedzmy o długości )? Przez „najlepszy” rozumiem tu najbardziej niezawodny, czyli najmniej podatny na błędy ze względu na ograniczoną liczbę obserwacji. W przypadku krótkich …
Studenta -test wymaga próbka odchylenie standardowe . Jak jednak obliczyć dla gdy znana jest tylko wielkość próbki i średnia próbki?s stttssssss Na przykład, jeśli wielkość próbki wynosi a średnia próbki to , wówczas spróbuję utworzyć listę identycznych próbek o wartości każda. Oczekiwane odchylenie standardowe próbki wynosi . Spowoduje to utworzenie …
Analiza danych eksploracyjnych (EDA) często prowadzi do eksploracji innych „ścieżek”, które niekoniecznie należą do początkowego zestawu hipotez. Taką sytuację mam w przypadku badań z ograniczoną wielkością próby i dużą ilością danych zebranych za pomocą różnych kwestionariuszy (dane społeczno-demograficzne, skale neuropsychologiczne lub medyczne - np. Funkcjonowanie psychiczne lub fizyczne, poziom depresji …
Pracuję nad projektem, w którym chcę wyodrębnić trochę informacji o zawartości serii esejów otwartych. W tym konkretnym projekcie 148 osób napisało eseje o hipotetycznej organizacji studenckiej w ramach większego eksperymentu. Chociaż w mojej dziedzinie (psychologia społeczna) typowym sposobem analizy tych danych byłoby ręczne kodowanie esejów, chciałbym to zrobić ilościowo, ponieważ …
Nauczyłem się, że mała wielkość próbki może prowadzić do niewystarczającej mocy i błędu typu 2. Mam jednak wrażenie, że małe próbki mogą być generalnie niewiarygodne i mogą przez przypadek doprowadzić do dowolnego wyniku. Czy to prawda?
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
Jeśli mój jednostronny wynik testu t jest znaczący, ale wielkość próbki jest niewielka (np. Poniżej 20 lub więcej), czy nadal mogę ufać temu wynikowi? Jeśli nie, w jaki sposób mam postępować i / lub interpretować ten wynik?
Czy istnieje „reguła” określająca minimalną wielkość próbki wymaganą do prawidłowego przeprowadzenia testu t? Na przykład należy dokonać porównania między średnimi 2 populacji. Istnieje 7 punktów danych z jednej populacji i tylko 2 punkty danych z drugiej. Niestety eksperyment jest bardzo kosztowny i czasochłonny, a uzyskanie większej ilości danych nie jest …
TLDR: Mój zestaw danych to dość małe (120) próbki. Czy podczas 10-krotnej weryfikacji krzyżowej powinienem: Zbierać wyniki z każdego testu, połączyć je w wektor, a następnie obliczyć błąd na tym pełnym wektorze prognoz (120 próbek)? Czy powinienem zamiast tego obliczyć błąd na wyjściach, które otrzymuję przy każdej fałdzie (z 12 …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.