Adaptacyjne estymatory gęstości jądra?


12

Czy ktoś może poinformować o swoich doświadczeniach z adaptacyjnym estymatorem gęstości jądra?
(Istnieje wiele synonimów: adaptacyjny | zmienny | zmienna szerokość, KDE | histogram | interpolator ...)

Zmienne oszacowanie gęstości jądra mówi: „zmieniamy szerokość jądra w różnych regionach przestrzeni próbki. Istnieją dwie metody ...” w rzeczywistości więcej: sąsiedzi w pewnym promieniu, najbliżsi sąsiedzi KNN (K zwykle ustalony), drzewa Kd, multigrid ...
Oczywiście żadna pojedyncza metoda nie może zrobić wszystkiego, ale metody adaptacyjne wyglądają atrakcyjnie.
Zobacz na przykład ładny obraz adaptacyjnej siatki 2d w metodzie elementów skończonych .

Chciałbym usłyszeć, co zadziałało / co nie działało w przypadku rzeczywistych danych, zwłaszcza> = 100 tys. Rozproszonych punktów danych w 2D lub 3D.

Dodano 2 listopada: oto wykres „gęstej” gęstości (kawałek x ^ 2 * y ^ 2), oszacowanie najbliższego sąsiada i gaussowskie KDE ze współczynnikiem Scotta. Chociaż jeden (1) przykład niczego nie dowodzi, pokazuje, że NN może dość dobrze pasować do ostrych wzgórz (i przy użyciu drzew KD jest szybki w 2d, 3d ...) alternatywny tekst


Czy możesz podać nieco więcej kontekstu, co rozumiesz przez „to, co działa” lub konkretne cele twojego projektu. Użyłem ich do wizualizacji procesów punktów przestrzennych, ale wątpię, aby o to chodziło, zadając to pytanie.
Andy W

Odpowiedzi:


7

Artykuł * DG Terrell; DW Scott (1992). „Zmienne oszacowanie gęstości jądra”. Annals of Statistics 20: 1236–1265. * Cytowany na końcu artykułu z Wikipedii, który sam cytujesz wyraźnie stwierdza, że ​​o ile przestrzeń obserwacji nie jest bardzo rzadka, metoda zmiennej jądra nie jest zalecana na podstawie globalnego błędu średniej kwadratowej (oba lokalne i globalne) dla rozproszonych zmiennych losowych Gaussa: (poprzez argumenty teoretyczne) przytaczają liczby ( to wielkość próbki) i (poprzez wyniki ładowania początkowego) (n p 4 pn450np4p to liczba wymiarów) jako ustawienia, w których metoda jądra zmiennego staje się konkurencyjna w stosunku do tych o stałej szerokości (sądząc z pytania, że ​​nie ma tych ustawień).

Intuicyjność tych wyników polega na tym, że jeśli nie jesteś w bardzo rzadkich ustawieniach, to lokalna gęstość po prostu nie zmienia się wystarczająco, aby wzrost obciążenia był większy niż utrata wydajności (a zatem AMISE jądra o zmiennej szerokości wzrasta w stosunku do AMISE o stałej szerokości). Ponadto, biorąc pod uwagę duży rozmiar próbki (i małe wymiary), jądro o stałej szerokości będzie już bardzo lokalne, zmniejszając wszelkie potencjalne korzyści w zakresie odchylenia.


Dzięki Kwak. „... dla rozkładowych zmiennych losowych Gaussa”; czy wiesz o nowszej pracy dla dystrybucji „zlepionej”?
denis

@Denis:> 'Clumpy' =? Skoncentrowany =? Z węższymi ogonami niż gaussowski?
user603

Nie jestem ekspertem, ale jak „zestaw danych clumpiness” w papierze Lang et al, „Insights on szybko gęstości jądra algorytmów estymacji”, 2004, 8p.
Denis

@Denis:> powiedziałbym, że to sprawia, że ​​problem jest najgorszy (tj. Jądro NN powinno działać lepiej na mniej zbitych danych). Mam intuicyjne wyjaśnienie, ale tutaj nie będzie pasować, a ponadto możesz zadać to pytanie na płycie głównej jako osobne pytanie (link do tego), aby uzyskać dodatkowe opinie.
user603,


-1

Loess / lowess jest w zasadzie zmienną metodą KDE, a szerokość jądra jest ustawiana przez podejście najbliższego sąsiada. Przekonałem się, że działa całkiem dobrze, z pewnością znacznie lepiej niż jakikolwiek model o stałej szerokości, gdy gęstość punktów danych różni się znacznie.

Jedną z rzeczy, o których należy pamiętać w KDE i danych wielowymiarowych, jest przekleństwo wymiarowości. Gdy inne rzeczy są równe, w ustalonym promieniu jest mniej punktów w przypadku p ~ 10 niż w przypadku p ~ 2. To może nie stanowić problemu, jeśli masz tylko dane 3d, ale warto o tym pamiętać.


3
Loess jest zmienną metodą REGRESSION jądra. Pytanie o zmienną gęstość jądra.
Rob Hyndman,

Ups, masz rację. Źle odczytałem pytanie.
Hong Ooi

@Rob, wybacz moje naiwne pytania: jeśli zmienianie szerokości jądra jest (czasem) dobre dla lokalnej regresji / wygładzania jądra, dlaczego jest złe dla szacowania gęstości? Czy oszacowanie gęstości nie jest przypadkiem oszacowania f () dla f () == gęstość ()?
denis

@Hong Ooi, ile punktów użyłeś w Ndim? Dzięki
denis

@Denis. Świetne pytanie. Czy możesz dodać je jako właściwe pytanie na stronie, a my zobaczymy, jakie odpowiedzi mogą znaleźć ludzie.
Rob Hyndman,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.