Oszacowanie gęstości jądra w rozkładach asymetrycznych

Niech będą obserwacjami zaczerpniętymi z nieznanego (ale z pewnością asymetrycznego) rozkładu prawdopodobieństwa. $\{x_1,\ldots,x_N\}$

Ja jak znaleźć rozkład prawdopodobieństwa stosując podejście Próbowałem jednak użyć jądra Gaussa, ale działało to źle, ponieważ jest symetryczne. Widziałem więc, że niektóre prace dotyczące jąder Gamma i Beta zostały wydane, chociaż nie rozumiałem, jak z nimi pracować.

\hat{fa} (x) = \frac{1}{N. h} \sum_{ja = 1}^{N.} K. (\frac{x - x_{ja}}{h})

$\hat{f}(x) = \frac{1}{Nh}\sum_{i=1}^{N} K\bigl(\frac{x-x_i}{h}\bigr)$

Moje pytanie brzmi: jak poradzić sobie z tym asymetrycznym przypadkiem, zakładając, że obsługa rozkładu podstawowego nie znajduje się w przedziale ? $[0,1]$

— Eleanore
źródło

W przypadku gęstości bliskich lognormalowi (które często spotykam w niektórych konkretnych aplikacjach), po prostu przekształcam (biorąc logi), a następnie wykonuję KDE, a następnie przekształcam KDE z powrotem (musisz pamiętać jakobian podczas transformacji oszacowanie z powrotem). W tym przypadku działa całkiem dobrze.

— Glen_b

@Glen_b czy masz jakieś odniesienia lub materiały, w których opisano tę metodę? (Obliczanie KDE na podstawie transformacji oryginalnej zmiennej, a następnie przekształcanie KDE z powrotem)

— boscovich

Nie wiem o tym - jestem pewien, że istnieją, ponieważ jest to dość trywialny pomysł, który można łatwo wdrożyć. Tego właśnie spodziewałbym się, że statystyki mogą być w stanie wyprowadzić. W praktyce działa bardzo dobrze.

— Glen_b

@glen_b dzięki. Więc jeśli miałbym użyć go w raporcie / publikacji technicznej, czy uważasz, że nie byłoby w porządku podawać żadnych referencji?

— boscovich

@guy Z pewnością można mieć problemy, szczególnie w przypadku niektórych transformacji i niektórych rodzajów danych. Sytuacje, z których korzystałem, wydają się być dość zbliżone do logarytmicznych, a tam zmiana przepustowości, którą widzisz jako problem, jest dokładnie tym, czego potrzebujesz; radzi sobie znacznie lepiej niż KDE na surowych danych. Z opisu PO brzmiało to dość podobnie, ale nie sugerowałem, że to panaceum .

— Glen_b

Odpowiedzi:

Po pierwsze, KDE z jądrem symetrycznym może również działać bardzo dobrze, gdy dane są asymetryczne. W przeciwnym razie byłoby to całkowicie bezużyteczne w praktyce.

Po drugie, czy zastanawiałeś się nad przeskalowaniem swoich danych, aby naprawić asymetrię, jeśli uważasz, że to powoduje problem? Na przykład dobrym pomysłem może być pójście do niego $\log(x)$ , ponieważ wiadomo, że pomaga to w wielu problemach.

— Ma ZAKOŃCZENIE - Anony-Mus
źródło

Jeśli przeskalujesz do log(x), czy musisz również wziąć pod uwagę jakobian?

— DilithiumMatrix

Hmm Możesz chcieć szerokości jądra, która zmienia się w zależności od lokalizacji.

Gdybym patrzył na problem w eCDF, mógłbym spróbować zrobić liczbowe nachylenie CDF związane z rozmiarem jądra.

Myślę, że jeśli zamierzasz wykonać transformację współrzędnych, musisz mieć całkiem niezłe pojęcie o punktach początkowym i końcowym. Jeśli znasz dobrze rozkład docelowy, nie potrzebujesz przybliżenia jądra.

— EngrStudent
źródło

Bardzo łatwo mogłem wiedzieć, że moje RV są nieujemne, ale nadal chcę KDE.

— facet