Próbuję lepiej zrozumieć szacowanie gęstości jądra.
Korzystanie z definicji z Wikipedii: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition
Weźmy być funkcją prostokątną, co daje , jeżeli wynosi między a i inaczej, a (wielkość okna) jest 1.1 x - 0,5 0,5 0 godz
Rozumiem, że gęstość jest splotem dwóch funkcji, ale nie jestem pewien, czy wiem, jak zdefiniować te dwie funkcje. Jeden z nich powinien (prawdopodobnie) być funkcją danych, która dla każdego punktu w R mówi nam, ile punktów danych mamy w tej lokalizacji (głównie ). Inną funkcją powinna być prawdopodobnie modyfikacja funkcji jądra w połączeniu z rozmiarem okna. Ale nie jestem pewien, jak to zdefiniować.
Jakieś sugestie?
Poniżej znajduje się przykładowy kod R, który (podejrzewam) replikuje ustawienia, które zdefiniowałem powyżej (z mieszaniną dwóch Gaussów i ), na których mam nadzieję zobaczyć „dowód”, że funkcje, które należy zawrzeć, są takie, jak podejrzewamy .
# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)