Słyszę, że zwykle 3 największe wartości własne są najważniejsze, a te bliskie zeru to hałas
Możesz to sprawdzić. Zobacz artykuł w tym poście, aby uzyskać więcej szczegółów. Ponownie, jeśli masz do czynienia z szeregami razy finansowych, możesz najpierw skorygować o leptokurtyczność (tj. Rozważ serię zwrotów skorygowanych pod względem skali, a nie surowych).
Widziałem kilka prac badawczych badających, jak naturalnie występujące rozkłady wartości własnych różnią się od tych obliczonych na podstawie macierzy korelacji losowej (ponownie, odróżniając szum od sygnału).
Edward:> Zazwyczaj robi się to w drugą stronę: spójrz na wielowymiarowy rozkład wartości własnych (macierzy korelacji) pochodzących z żądanej aplikacji. Po zidentyfikowaniu wiarygodnego kandydata do dystrybucji wartości własnych, wygenerowanie na ich podstawie powinno być dość łatwe.
Najlepsza procedura określania rozkładu wielowymiarowego wartości własnych zależy od liczby zasobów, które chcesz rozważyć jednocześnie (tj. Jakie są wymiary macierzy korelacji). Jest ładna sztuczka, jeśli ( jest liczbą zasobów).pp ≤ 10p
Edytuj (komentarze Shabbychef)
czteroetapowa procedura:
- Załóżmy, że masz próbki podrzędne danych wielowymiarowych. Potrzebujesz estymatora macierzy wariancji-kowariancji dla każdej podpróbki (możesz użyć klasycznego estymatora lub solidnej alternatywy, takiej jak szybki MCD , który jest dobrze zaimplementowany w Matlabie, SAS, S, R, ...). Jak zwykle, jeśli masz do czynienia z szeregami czasowymi dotyczącymi finansów, powinieneś wziąć pod uwagę szereg zwrotów skorygowanych według skali, a nie zwrotów surowych.˜ C j jj = 1 , . . . , Jdo~jotjot
- Dla każdej podpróbki , oblicz , ..., , wartości własne z .˜ Λ j = log ( ˜ λ j 1 ) log ( ˜ λ j p ) ˜ C jjotΛ~jot= log( λ~jot1)log( λ~jotp)do~jot
- Oblicz , wypukły kadłub macierzy , którego j-ty wpis to (znowu, jest to dobrze zaimplementowane w Matlab, R, ...) .J × p ˜ Λ jdoV.( Λ~)jot× pΛ~jot
- Narysuj losowo punkty z wnętrza (odbywa się to poprzez wagi do każdej krawędzi gdzie , gdzie jest czerpaniem z rozkładu wykładniczego jednostki (więcej szczegółów tutaj ).w i C V ( ˜ Λ ) w i = γ idoV.( Λ~)wjadoV.( Λ~) γiwja= γja∑pi = 1γjaγja
Ograniczeniem jest to, że szybkie obliczenia wypukłego kadłuba serii punktów stają się wyjątkowo wolne, gdy liczba wymiarów jest większa niż 10.jot≥ 2