Wydaje się, że są tutaj dwa różne pytania, które spróbuję podzielić:
1) w jaki sposób KS, wygładzanie jądra różni się od KDE, szacowanie gęstości jądra? Powiedzmy, że mam estymator / wygładzacz / interpolator
est( xi, fi -> gridj, estj )
a także zdarza się, że poznajemy „rzeczywistą” gęstość f () na xi. Następnie uruchomienie
est( x, densityf )
musi dać oszacowanie gęstościf (): KDE. Być może KS i KDE są oceniane inaczej - różne kryteria gładkości, różne normy - ale nie widzę zasadniczej różnicy. Czego mi brakuje ?
2) W jaki sposób wymiar wpływa na oszacowanie lub wygładzenie, intuicyjnie ? Oto zabawkowy przykład, aby pomóc intuicji. Rozważ pudełko N = 10000 punktów w jednolitej siatce oraz okno, linię, kwadrat lub sześcian o W = 64 punktów w nim:
1d 2d 3d 4d
---------------------------------------------------------------
data 10000 100x100 22x22x22 10x10x10x10
side 10000 100 22 10
window 64 8x8 4x4x4 2.8^4
side ratio .64 % 8 % 19 % 28 %
dist to win 5000 47 13 7
W tym przypadku „stosunek boków” jest bokiem okna / bokiem okna, a „odległość do wygranej” jest przybliżonym oszacowaniem średniej odległości losowego punktu w pudełku do losowo umieszczonego okna.
Czy to w ogóle ma sens? (Zdjęcie lub aplet naprawdę by pomogły: ktoś?)
Chodzi o to, że okno o stałym rozmiarze w pudełku o stałym rozmiarze ma bardzo różną bliskość do reszty pudełka, w 1d 2d 3d 4d. To jest dla jednolitej siatki; może silna zależność od wymiaru przenosi się na inne rozkłady, a może nie. W każdym razie wygląda to na silny ogólny efekt, aspekt przekleństwa wymiarowości.