Techniki wygładzania jądra, takie jak estymacja gęstości jądra (KDE) i regresja jądra Nadaraya-Watsona, funkcje estymacji przez lokalną interpolację z punktów danych. Nie należy mylić z [trikiem z jądrem], dla jądra używanego np. W maszynach SVM.
Istnieje kilka różnych zastosowań: Szacowanie gęstości jądra sztuczka jądra wygładzanie jądra Wyjaśnij, co znaczy „jądro” w nich, zwykłym angielskim, własnymi słowami.
plot(density(rexp(100)) Oczywiście cała gęstość na lewo od zera reprezentuje błąd. Chciałbym podsumować niektóre dane dla statystycznych i chcę uniknąć pytań o to, dlaczego dane nieujemne mają gęstość na lewo od zera. Wykresy służą do sprawdzania losowości; Chcę pokazać rozkład zmiennych według grup leczenia i kontroli. Rozkłady są często wykładnicze. Histogramy …
W przypadku jednowymiarowych estymatorów gęstości jądra (KDE) używam reguły Silvermana do obliczania hhh : 0,9 min ( s d, JaQ R / 1.34 ) × n- 0,20,9min(sre,jaQR/1.34)×n-0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Jakie są standardowe reguły dla wielowymiarowego KDE (przy założeniu normalnego jądra).
Próbuję lepiej zrozumieć szacowanie gęstości jądra. Korzystanie z definicji z Wikipedii: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fah^( x ) = 1n∑ni = 1K.h( x - xja)= 1n h∑ni = 1K.( x - xjah)fah^(x)=1n∑ja=1nK.h(x-xja)=1nh∑ja=1nK.(x-xjah) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big) Weźmy być funkcją prostokątną, co daje , jeżeli wynosi …
Oszacowanie gęstości okna Parzen jest opisane jako p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) gdzie jest liczbą elementów w wektorze, jest wektorem, jest gęstością prawdopodobieństwa , jest wymiarem okna Parzen, a jest funkcją okna.nnnxxxp(x)p(x)p(x)xxxhhhϕϕ\phi Moje pytania to: Jaka jest podstawowa różnica między funkcją okna Parzen a innymi funkcjami gęstości, …
Po przeprowadzeniu analizy głównego składnika (PCA) chcę rzutować nowy wektor na przestrzeń PCA (tzn. Znaleźć jego współrzędne w układzie współrzędnych PCA). Mam obliczony PCA w języku R użyciu prcomp. Teraz powinienem być w stanie pomnożyć mój wektor przez macierz obrotu PCA. Czy główne elementy tej macierzy powinny być ułożone w …
Czytałem (na przykład tutaj ), że jądro Epanechnikowa jest optymalne, przynajmniej w sensie teoretycznym, podczas szacowania gęstości jądra. Jeśli to prawda, to dlaczego Gaussian pojawia się tak często jako domyślne jądro lub w wielu przypadkach jedyne jądro w bibliotekach szacowania gęstości?
To pytanie wynika z dyskusji w innym miejscu . Zmienne jądra są często używane w regresji lokalnej. Na przykład, less jest szeroko stosowany i działa dobrze jako wygładzacz regresji, i jest oparty na jądrze o zmiennej szerokości, która dostosowuje się do rzadkości danych. Z drugiej strony zwykle uważa się, że …
Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …
Próbuję użyć funkcji „ gęstości ” w R do oszacowania gęstości jądra. Mam pewne trudności z interpretacją wyników i porównywaniem różnych zestawów danych, ponieważ wydaje się, że obszar pod krzywą niekoniecznie jest 1. Dla każdej funkcji gęstości prawdopodobieństwa (pdf) musimy mieć obszar ∫ ∞ - ∞ ϕ ( x ) …
Szukam metody do obliczenia obszaru nakładania się dwóch oszacowań gęstości jądra w R, jako miary podobieństwa między dwiema próbkami. Aby to wyjaśnić, w poniższym przykładzie musiałbym określić ilościowo obszar pokrywającego się regionu fioletowo: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, 0, 3))) ggplot(d, aes(value, fill=variable)) + geom_density(alpha=.4, …
Mam próbkę 100 punktów, które są ciągłe i jednowymiarowe. Oszacowałem jego nieparametryczną gęstość za pomocą metod jądra. Jak narysować losowe próbki z tego szacunkowego rozkładu?
Muszę oszacować funkcję gęstości na podstawie zestawu obserwacji za pomocą estymatora gęstości jądra. Na podstawie tego samego zestawu obserwacji muszę również oszacować pierwszą i drugą pochodną gęstości za pomocą pochodnych estymatora gęstości jądra. Przepustowość z pewnością będzie miała wielki wpływ na końcowy wynik. Po pierwsze wiem, że istnieje kilka funkcji …
Czy ktoś mógłby wyjaśnić prostym językiem angielskim, jaka jest różnica między podstawowymi zasadami Scotta i Silvermana dotyczącymi wyboru przepustowości? W szczególności, kiedy jedno jest lepsze od drugiego? Czy jest to związane z dystrybucją podstawową? Liczba przykładów? PS Mam na myśli kod w SciPy .
Po przejrzeniu nieco zwięzłej matematyki, myślę, że mam niewielką intuicję w szacowaniu gęstości jądra. Ale jestem również świadomy, że szacowanie gęstości wielu zmiennych dla więcej niż trzech zmiennych może nie być dobrym pomysłem, jeśli chodzi o właściwości statystyczne jego estymatorów. Więc w jakich sytuacjach powinienem oszacować, powiedzmy, gęstość dwuwymiarową przy …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.