Mój problem: randomizowane badanie równoległe w grupie z bardzo skośnym rozkładem pierwotnego wyniku. Nie chcę zakładać normalności i używać opartych na normach 95% CI (tj. Używając 1,96 X SE). Bez problemu wyrażam miarę tendencji centralnej jako mediany, ale moje pytanie brzmi: jak skonstruować 95% CI różnicy w medianach między dwiema …
Pochodząc z pola widzenia komputerowego, często stosowałem metodę RANSAC (Random Sample Consensus) do dopasowywania modeli do danych z wieloma wartościami odstającymi. Jednak nigdy nie widziałem, aby używali go statystycy i zawsze miałem wrażenie, że nie była uważana za metodę „statystycznie solidną”. Dlaczego to jest takie? Ma charakter losowy, co utrudnia …
W całym założeniu nasza statystyka jest funkcją niektórych danych która jest pobierana z funkcji dystrybucyjnej ; funkcja rozkładu empirycznego naszej próbki to . Więc to statystyka postrzegana jako zmienna losowa, a to wersja statystyki ładowania początkowego. Używamy jako odległości KSθ(⋅)θ(⋅)\theta(\cdot)X1,…XnX1,…XnX_1, \ldots X_nF θ ( F ) θ ( M ) …
To pytanie jest nieco niechlujne, ale w celu uzupełnienia tego uwzględnię kolorowe wykresy! Najpierw tło, a następnie pytanie. tło Załóżmy, że masz wymiarowy rozkład wielomianowy z jednakowymi probailitami w kategoriach . Niech będzie znormalizowanymi ( ) z tego rozkładu, to znaczy:nnnnnnπ=(π1,…,πn)π=(π1,…,πn)\pi = (\pi_1, \ldots, \pi_n)ccc (c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c_1, \ldots, c_n) \sim \text{Multinomial}(1/n, …
Jaka jest najbardziej odpowiednia metoda próbkowania do oceny wydajności klasyfikatora na określonym zbiorze danych i porównania go z innymi klasyfikatorami? Cross-validation wydaje się być standardową praktyką, ale przeczytałem, że metody takie jak bootstrap .632 są lepszym wyborem. W następstwie: czy wybór metryki wydajności wpływa na odpowiedź (jeśli użyję AUC zamiast …
Patrzyłem na pakiet rozruchowy w R i chociaż znalazłem kilka dobrych starterów, jak go używać, to jeszcze nie znalazłem niczego, co dokładnie opisuje to, co dzieje się „za kulisami”. Na przykład w tym przykładzie przewodnik pokazuje, jak używać standardowych współczynników regresji jako punktu wyjścia do regresji bootstrapu, ale nie wyjaśnia, …
Mam problem ze zrozumieniem, czym jest proces ładowania bayesowskiego i czym różni się on od normalnego ładowania początkowego. A gdyby ktoś mógł zaoferować intuicyjny / konceptualny przegląd i porównanie obu, byłoby świetnie. Weźmy przykład. Powiedzmy, że mamy zestaw danych X, który jest [1,2,5,7,3]. Jeśli próbujemy z zamianą wiele razy, aby …
model liniowy do moich danych: yja= β0+ β1xja+ ϵja,ϵja∼ N.( 0 , σ2)) .yi=β0+β1xi+ϵi,ϵi∼N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Chciałbym oszacować przedział ufności (CI) współczynników ( , ) za pomocą metody bootstrap. Istnieją dwa sposoby zastosowania metody ładowania początkowego: β 1β0β0\beta_{0}β1β1\beta_{1} Próbka sparowanego predyktora odpowiedzi: Losowo ponownie pary i zastosuj regresję …
Przeprowadziliśmy test podziału nowej funkcji produktu i chcemy sprawdzić, czy wzrost przychodów jest znaczący. Nasze obserwacje zdecydowanie nie są normalnie rozpowszechniane (większość naszych użytkowników nie wydaje, a wśród tych, którzy to robią, jest mocno wypaczona w kierunku wielu małych wydawców i kilku bardzo dużych wydawców). Zdecydowaliśmy się na użycie ładowania …
(w razie potrzeby zignoruj kod R, ponieważ moje główne pytanie jest niezależne od języka) Jeśli chcę spojrzeć na zmienność prostej statystyki (np. Średnia), wiem, że mogę to zrobić za pomocą teorii: x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same as... sd(x) / sqrt(length(x)) lub z bootstrap …
Jak obliczyć przedział ufności średniej w próbce o rozkładzie innym niż normalny? Rozumiem, że metody bootstrap są tutaj powszechnie stosowane, ale jestem otwarty na inne opcje. Podczas gdy szukam opcji nieparametrycznej, jeśli ktoś może mnie przekonać, że rozwiązanie parametryczne jest prawidłowe, byłoby dobrze. Rozmiar próbki wynosi> 400. Gdyby ktoś mógł …
Powiedzmy, że mam próbkę i próbkę bootstrap z tej próbki dla stastitic (np. Średnia). Jak wszyscy wiemy, że ta próbka bootstrap szacuje się podział próbkowania estymatora statystyki.χχ\chi Czy średnia dla tej próby ładowania początkowego jest lepszym oszacowaniem statystyki populacji niż statystyka oryginalnej próbki ? Na jakich warunkach tak by było?
Studiując przedział ufności oparty na bootstrap, raz przeczytałem następujące oświadczenie: Jeśli rozkład bootstrapu jest przekrzywiony w prawo, przedział ufności oparty na bootstrapie zawiera korektę przesunięcia punktów końcowych jeszcze bardziej w prawo; może się to wydawać sprzeczne z intuicją, ale jest to prawidłowe działanie. Próbuję zrozumieć logikę leżącą u podstaw powyższego …
Obecnie czytam „Wszystkie statystyki” Larry'ego Wassermana i zastanawia mnie coś, co napisał w rozdziale o szacowaniu funkcji statystycznych modeli nieparametrycznych. On napisał „Czasami możemy znaleźć szacowany błąd standardowy funkcji statystycznej, wykonując pewne obliczenia. Jednak w innych przypadkach nie jest oczywiste, jak oszacować błąd standardowy”. Chciałbym zaznaczyć, że w następnym rozdziale …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.