Transformacja zmieniająca pochylenie bez wpływu na kurtozę?


11

Jestem ciekawy, czy istnieje transformacja, która zmienia pochylenie zmiennej losowej bez wpływu na kurtozę. Byłoby to analogiczne do tego, jak afiniczna transformacja RV wpływa na średnią i wariancję, ale nie na pochylenie i kurtozę (częściowo dlatego, że pochylenie i kurtoza są zdefiniowane jako niezmienne dla zmian skali). Czy to znany problem?


Czy wymagasz, aby odchylenie standardowe pozostało również stałe przy tej transformacji?
russellpierce

nie, spodziewam się, że tak nie będzie, ale nadmiar kurtozy powinien pozostać niezmienny. Spodziewałbym się jednak, że transformacja będzie monotoniczna, a najlepiej deterministyczna.
shabbychef

1
Yikes - biada osobie, która chce udowodnić, że funkcja niedeterministyczna jest monotoniczna.
russellpierce

Odpowiedzi:


6

Moja odpowiedź to początek totalnego włamania, ale nie znam żadnego ustalonego sposobu robienia tego, o co prosisz.

Moim pierwszym krokiem byłoby uporządkowanie zestawu danych, aby znaleźć proporcjonalną pozycję w zestawie danych, a następnie przekształcenie go w rozkład normalny. Metodę tę zastosowano w Reynolds i Hewitt, 1996. Zobacz przykładowy kod R poniżej w PROCMiracle.

Gdy rozkład jest normalny, problem został odwrócony - kwestia dostosowania kurtozy, ale nie przekrzywienia. Wyszukiwarka google zasugerowała, że ​​można zastosować procedury John & Draper, 1980, aby dostosować kurtozę, ale nie przekrzywienie - ale nie mogłem powtórzyć tego wyniku.

Moje próby opracowania prymitywnej funkcji rozprzestrzeniania / zwężania, która przyjmuje wartość wejściową (znormalizowaną) i dodaje lub odejmuje wartość od niej proporcjonalną do położenia zmiennej w normalnej skali, powoduje monotoniczną korektę, ale w praktyce ma tendencję do tworzenia rozkład bimodalny, chociaż taki, który ma pożądane wartości skośności i kurtozy.

Zdaję sobie sprawę, że nie jest to pełna odpowiedź, ale pomyślałem, że może to stanowić krok we właściwym kierunku.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

Robiłem coś takiego: ranga, a następnie użyj transformacji g-i-h, aby uzyskać naprawioną kurtozę i przekrzywienie. Jednak ta technika zakłada, że ​​faktycznie znam populację kurtozy, którą mogę oszacować, ale interesuje mnie filozoficznie, czy istnieje transformacja, która zachowuje kurtozę bez mojej wiedzy, co to jest ...
shabbychef

@shabbychef: No cóż, przepraszam, że nie dodałem nic nowego. Dodałeś jednak coś nowego, wcześniej nie słyszałem o formule g-i-h. Czy masz cytat, który go udostępnia? Natknąłem się na jedną kartkę z wypisanym ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ), ale pojęcie to jest dla mnie trochę obce (w szczególności to, że e ^ Z ^ g lub coś innego )? Próbowałem w ten sposób ... ale wyniki wydawały się dziwne ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
russellpierce

1
@drnexus: Nie chciałem odchylać wyników, wspominając o mojej technice. Dowiedziałem się o rozkładach g-i-h oraz g-i-k od Haynesa i in. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 oraz Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

Inna możliwa interesująca technika, jaka nasuwa się na myśl, choć nie do końca odpowiada na to pytanie, polega na przekształceniu próbki w ustaloną próbkę L-skosu i próbki L-kurtozy (a także stałą średnią i skalę L). Te cztery ograniczenia są liniowe w statystykach zamówień. Utrzymanie transformacji monotonicznej na próbce obserwacji wymagałoby następnie innych równań . Można to uznać za kwadratowy problem optymalizacji: zminimalizujnn12norma między statystyką zamówienia próbki a wersją przekształconą, z zastrzeżeniem podanych ograniczeń. Jest to jednak trochę zwariowane podejście. W pierwotnym pytaniu szukałem czegoś bardziej podstawowego i fundamentalnego. Ja również domyślnie szukałem techniki, która mogłaby być zastosowana do indywidualnych obserwacji, niezależnie od posiadania całej kohorty próbek.


0

Wolałbym modelować ten zestaw danych przy użyciu rozkładu leptokurtycznego zamiast transformacji danych. Lubię dystrybucję sinh-arcsinh od Jonesa i Pewseya (2009), Biometrika.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.