„Szacowanie gęstości jądra” jest splotem czego?

Próbuję lepiej zrozumieć szacowanie gęstości jądra.

Korzystanie z definicji z Wikipedii: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition

$\hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big)$

Weźmy być funkcją prostokątną, co daje , jeżeli wynosi między a i inaczej, a (wielkość okna) jest 1. $K()$ $1$ $x$ $-0.5$ $0.5$ $0$ $h$

Rozumiem, że gęstość jest splotem dwóch funkcji, ale nie jestem pewien, czy wiem, jak zdefiniować te dwie funkcje. Jeden z nich powinien (prawdopodobnie) być funkcją danych, która dla każdego punktu w R mówi nam, ile punktów danych mamy w tej lokalizacji (głównie $0$ ). Inną funkcją powinna być prawdopodobnie modyfikacja funkcji jądra w połączeniu z rozmiarem okna. Ale nie jestem pewien, jak to zdefiniować.

Jakieś sugestie?

Poniżej znajduje się przykładowy kod R, który (podejrzewam) replikuje ustawienia, które zdefiniowałem powyżej (z mieszaniną dwóch Gaussów i $n=100$ ), na których mam nadzieję zobaczyć „dowód”, że funkcje, które należy zawrzeć, są takie, jak podejrzewamy .

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

wprowadź opis zdjęcia tutaj

r kernel-smoothing convolution

— Tal Galili
źródło

Dywan na dole daje trochę szorstkiej intuicji. Wyobraź sobie, że każda wartość

jest skokiem z powiązaną wagą

. Teraz posmaruj każdy kolec przy użyciu kształtu i szerokości jądra, aby kolec został przekształcony w taki sam kształt i szerokość, przy wysokości takiej, że obszar poniżej wynosi

. Dodaj wyniki, a uzyskasz oszacowanie gęstości jądra.

x_{i}

$x_i$

i = 1

$i = 1$

n

$n$

1 / n

$1/n$

1 / n

$1/n$

— Nick Cox

Cześć Nick, dziękuję za komentarz. Tak daleko w intuicji, którą już mam, to formalne przekształcenie jej w formę splotu, którą byłem ciekawy zobaczyć :) (chętnie przejdę teraz odpowiedź Whubera!)

— Tal Galili

Odpowiadająca dowolnej partii danych $X = (x_1, x_2, \ldots, x_n)$ jest jej „funkcją gęstości empirycznej”

{fa}_{X} (x) = \frac{1}{n} \sum_{ja = 1}^{n} δ (x - x_{ja}) .

$f_X(x) = \frac{1}{n}\sum_{i=1}^{n} \delta(x-x_i).$

Tutaj $\delta$ jest „funkcją uogólnioną”. Mimo tej nazwy nie jest to wcale funkcja: jest to nowy obiekt matematyczny, którego można używać tylko w całkach. Jego właściwością definiującą jest to, że dla dowolnej funkcji $g$ kompaktowego wsparcia, które jest ciągłe w sąsiedztwie $0$ ,

\int_{R} δ (x) sol (x) re x = sol (0) .

$\int_{\mathbb{R}}\delta(x) g(x) dx = g(0).$

(Nazwy dla $\delta$ obejmują miarę „atomową” lub „punktową” i „ funkcję delta Diraca .” W poniższym obliczeniu pojęcie to zostało rozszerzone o funkcje $g$ które są ciągłe tylko z jednej strony.)

Uzasadnieniem tej charakterystyki $f_X$ jest spostrzeżenie, że

\begin{aligned} \int_{- \infty}^{x} f_{X} (y) d y & = \int_{- \infty}^{x} \frac{1}{n} \sum_{i = 1}^{n} δ (y - x_{i}) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} \int_{- \infty}^{x} δ (y - x_{i}) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} \int_{R} I (y \leq x) δ (y - x_{i}) d y \\ = \frac{1}{n} \sum_{i = 1}^{n} I (x_{i} \leq x) \\ = F_{X} (x) \end{aligned}

$\eqalign{ \int_{-\infty}^{x} f_X(y) dy &= \int_{-\infty}^{x} \frac{1}{n}\sum_{i=1}^{n} \delta(y-x_i)dy \\ &= \frac{1}{n}\sum_{i=1}^{n} \int_{-\infty}^{x} \delta(y-x_i)dy \\ &= \frac{1}{n}\sum_{i=1}^{n} \int_{\mathbb{R}} I(y\le x) \delta(y-x_i)dy \\ &= \frac{1}{n}\sum_{i=1}^{n} I(x_i \le x) \\ &= F_X(x) }$

$F_X$ $I$ $1$ $0$ $\mathbb{R}$ $I$ $X$

$f_X(x)$ $k$

\begin{aligned} ({fa}_{X} * k) (x) & = \int_{R} {fa}_{X} (x - y) k (y) re y \\ = \int_{R} \frac{1}{n} \sum_{ja = 1}^{n} δ (x - y - x_{ja}) k (y) re y \\ = \frac{1}{n} \sum_{ja = 1}^{n} \int_{R} δ (x - y - x_{ja}) k (y) re y \\ = \frac{1}{n} \sum_{ja = 1}^{n} k (x_{ja} - x) . \end{aligned}

$\eqalign{ (f_X * k)(x) &= \int_{\mathbb{R}} f_X(x - y) k(y) dy \\ &=\int_{\mathbb{R}} \frac{1}{n}\sum_{i=1}^{n} \delta(x-y-x_i) k(y) dy \\ &= \frac{1}{n}\sum_{i=1}^{n}\int_{\mathbb{R}} \delta(x-y-x_i) k(y) dy \\ &=\frac{1}{n}\sum_{i=1}^{n} k(x_i-x). }$

$k(x) = K_h(-x)$ $K_h(x)$

— Whuber
źródło

W dwu wymiarów wyjaśnione jest (w bardziej potocznej) i zilustrowane na stronie GIS w gis.stackexchange.com/questions/14374/... .

— whuber

Drogi Whuberze, właśnie przeszedłem i z radością przeczytałem twoją odpowiedź! Bardzo dziękuję za wyjaśnienie i szczegóły, twoje odpowiedzi (ta i inne w ogóle) są naprawdę inspirujące. Pozdrawiam, Tal

— Tal Galili

δ

$\delta$

g,

$g,$

x_{i}

$x_i$

g (x_{i}) .

$g(x_i).$

@whuber Dziękuję. Zdanie Uogólniona funkcja δ wcale nie jest funkcją: jest to nowy obiekt matematyczny, którego można używać tylko w całkach. uczyniło to jaśniejszym. w punkcie jak zawsze. ;)

— Jan Vainer

@Jan Dziękuję za pomoc: włączyłem ten pomysł do tej odpowiedzi.

— whuber