Statystyki i duże zbiory danych small-sample

3

Bootstrap: problem nadmiernego dopasowania

Załóżmy, że wykonuje się tak zwany nieparametryczny bootstrap, pobierając próbki BBB o wielkości nnn każda z oryginalnych nnn obserwacji z zastąpieniem. Uważam, że ta procedura jest równoważna z oszacowaniem skumulowanej funkcji rozkładu przez empiryczny plik cdf: http://en.wikipedia.org/wiki/Empirical_distribution_function a następnie uzyskanie próbek bootstrap poprzez symulację obserwacji z szacowanych czasów cdf z …

14 bootstrap sample-size sample small-sample finite-population

7

Czy warto modelować krótkie serie czasowe?

Oto kontekst. Interesuje mnie określenie, w jaki sposób dwie zmienne środowiskowe (temperatura, poziomy składników odżywczych) wpływają na średnią wartość zmiennej odpowiedzi w okresie 11 lat. W ciągu każdego roku dostępne są dane z ponad 100 000 lokalizacji. Celem jest ustalenie, czy w ciągu 11 lat średnia wartość zmiennych odpowiedzi zareagowała …

14 time-series regression sample-size small-sample

4

Wykresy małych próbek

Mam mały zestaw danych 14 osobnych razy, aby wykonać zadanie. Mam jednak trudności ze znalezieniem odpowiedniego wykresu, którego można by użyć do wykreślenia danych. Gdyby próbka była większa, użyłbym wykresu pudełkowego lub histogramu, ale nie jestem pewien, czy stosowne byłoby użycie w tym przypadku, gdy próbka jest tak mała. Aktualizacja: …

13 data-visualization descriptive-statistics small-sample

1

Sekwencja Haltona vs sekwencja Sobola?

Z odpowiedzi z poprzedniego pytania skierowano mnie w stronę sekwencji Haltona, aby stworzyć zestaw wektorów, które pokrywają równomiernie jednolitą przestrzeń próbki. Ale strona wikipedia wspomina, że przede wszystkim wyższe liczby pierwsze są często silnie skorelowane na początku serii. Wydaje się, że dzieje się tak w przypadku każdej pary wysokich liczb …

13 sampling small-sample quasi-monte-carlo

2

Czy Random Forest nadaje się do bardzo małych zestawów danych?

Mam zestaw danych obejmujący 24 wiersze danych miesięcznych. Funkcje obejmują PKB, przyloty na lotnisko, miesiąc i kilka innych. Zmienna zależna to liczba odwiedzających popularny cel turystyczny. Czy Losowy Las byłby odpowiedni na taki problem? Dane są niepubliczne, więc nie mogę opublikować próbki.

13 random-forest small-sample

1

ANOVA: testowanie założenia normalności dla wielu grup z niewielką liczbą próbek na grupę

Załóżmy następującą sytuację: mamy dużą liczbę (np. 20) z małą wielkością grupy (np. n = 3). Zauważyłem, że jeśli wygeneruję wartości z rozkładu jednorodnego, reszty będą wyglądać w przybliżeniu normalnie, mimo że rozkład błędu jest jednolity. Poniższy kod R demonstruje to zachowanie: n.group = 200 n.per.group = 3 x <- …

12 anova normal-distribution small-sample

1

testy vs testy?

Próbuję dowiedzieć się dokładnie, jaka jest różnica między -tests i -tests.ztttzzz O ile wiem, do obu klas testów używa się tej samej statystyki testu, coś w rodzaju b^- Cseˆ( b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} gdzie to przykładowa statystyka, C to jakaś stała odniesienia (lokalizacji) (która zależy od szczegółowych danych testu), a \ …

12 hypothesis-testing t-test small-sample

2

Czy randomizacja jest wiarygodna w przypadku małych próbek?

Jerome Cornfield napisał: Jednym z najwspanialszych owoców rewolucji fisheryjskiej była idea randomizacji, a statystycy, którzy zgadzają się co do kilku innych rzeczy, przynajmniej się na to zgodzili. Ale pomimo tego porozumienia i pomimo powszechnego stosowania losowych procedur przydziału w badaniach klinicznych i innych formach eksperymentów, jego logiczny status, tj. Dokładna …

11 small-sample random-allocation

3

Ograniczenia metod zespoleń opartych na drzewach w małych n, dużych p problemach?

Metody zestawów oparte na drzewach, takie jak Losowy Las, i kolejne pochodne (np. Las warunkowy), wszystkie wydają się być przydatne w tak zwanych problemach „małych n , dużych p ”, do identyfikacji względnej zmiennej ważności. Rzeczywiście wydaje się, że tak jest, ale moje pytanie brzmi, jak daleko można posunąć tę …

10 random-forest small-sample ensemble

1

Regresja z bardzo małą wielkością próby

Chcę przeprowadzić regresję z 4 do 5 zmiennymi objaśniającymi, ale mam tylko 15 obserwacji. Nie będąc w stanie założyć, że te zmienne są normalnie rozmieszczone, czy istnieje nieparametryczna lub inna poprawna metoda regresji?

9 regression small-sample

Pytania otagowane jako small-sample