Odnosi się do komplikacji lub problemów statystycznych wynikających z niewielu danych. Jeśli Twoje pytanie dotyczy małej próbki w stosunku do liczby zmiennych, użyj zamiast tego tagu [underdetermined].
Załóżmy, że wykonuje się tak zwany nieparametryczny bootstrap, pobierając próbki BBB o wielkości nnn każda z oryginalnych nnn obserwacji z zastąpieniem. Uważam, że ta procedura jest równoważna z oszacowaniem skumulowanej funkcji rozkładu przez empiryczny plik cdf: http://en.wikipedia.org/wiki/Empirical_distribution_function a następnie uzyskanie próbek bootstrap poprzez symulację obserwacji z szacowanych czasów cdf z …
Oto kontekst. Interesuje mnie określenie, w jaki sposób dwie zmienne środowiskowe (temperatura, poziomy składników odżywczych) wpływają na średnią wartość zmiennej odpowiedzi w okresie 11 lat. W ciągu każdego roku dostępne są dane z ponad 100 000 lokalizacji. Celem jest ustalenie, czy w ciągu 11 lat średnia wartość zmiennych odpowiedzi zareagowała …
Mam mały zestaw danych 14 osobnych razy, aby wykonać zadanie. Mam jednak trudności ze znalezieniem odpowiedniego wykresu, którego można by użyć do wykreślenia danych. Gdyby próbka była większa, użyłbym wykresu pudełkowego lub histogramu, ale nie jestem pewien, czy stosowne byłoby użycie w tym przypadku, gdy próbka jest tak mała. Aktualizacja: …
Z odpowiedzi z poprzedniego pytania skierowano mnie w stronę sekwencji Haltona, aby stworzyć zestaw wektorów, które pokrywają równomiernie jednolitą przestrzeń próbki. Ale strona wikipedia wspomina, że przede wszystkim wyższe liczby pierwsze są często silnie skorelowane na początku serii. Wydaje się, że dzieje się tak w przypadku każdej pary wysokich liczb …
Mam zestaw danych obejmujący 24 wiersze danych miesięcznych. Funkcje obejmują PKB, przyloty na lotnisko, miesiąc i kilka innych. Zmienna zależna to liczba odwiedzających popularny cel turystyczny. Czy Losowy Las byłby odpowiedni na taki problem? Dane są niepubliczne, więc nie mogę opublikować próbki.
Załóżmy następującą sytuację: mamy dużą liczbę (np. 20) z małą wielkością grupy (np. n = 3). Zauważyłem, że jeśli wygeneruję wartości z rozkładu jednorodnego, reszty będą wyglądać w przybliżeniu normalnie, mimo że rozkład błędu jest jednolity. Poniższy kod R demonstruje to zachowanie: n.group = 200 n.per.group = 3 x <- …
Próbuję dowiedzieć się dokładnie, jaka jest różnica między -tests i -tests.ztttzzz O ile wiem, do obu klas testów używa się tej samej statystyki testu, coś w rodzaju b^- Cseˆ( b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} gdzie to przykładowa statystyka, C to jakaś stała odniesienia (lokalizacji) (która zależy od szczegółowych danych testu), a \ …
Jerome Cornfield napisał: Jednym z najwspanialszych owoców rewolucji fisheryjskiej była idea randomizacji, a statystycy, którzy zgadzają się co do kilku innych rzeczy, przynajmniej się na to zgodzili. Ale pomimo tego porozumienia i pomimo powszechnego stosowania losowych procedur przydziału w badaniach klinicznych i innych formach eksperymentów, jego logiczny status, tj. Dokładna …
Metody zestawów oparte na drzewach, takie jak Losowy Las, i kolejne pochodne (np. Las warunkowy), wszystkie wydają się być przydatne w tak zwanych problemach „małych n , dużych p ”, do identyfikacji względnej zmiennej ważności. Rzeczywiście wydaje się, że tak jest, ale moje pytanie brzmi, jak daleko można posunąć tę …
Chcę przeprowadzić regresję z 4 do 5 zmiennymi objaśniającymi, ale mam tylko 15 obserwacji. Nie będąc w stanie założyć, że te zmienne są normalnie rozmieszczone, czy istnieje nieparametryczna lub inna poprawna metoda regresji?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.