Asymptotyczny rozkład wielomianu


10

Szukam ograniczającego rozkładu wielomianowego w porównaniu do wyników d. IE, dystrybucja następujących

limnn12Xn

Gdzie Xn jest losową zmienną o wartości wektorowej o gęstości fn(x) dla x taką, że ixi=n , xiZ,xi0 i 0 dla wszystkich innych x , gdzie

fn(x)=n!i=1dpixixi!

Znalazłem jedną formę w Twierdzeniu Larry'ego Wassermana „All of Statistics” 14.6, strona 237, ale dla ograniczenia rozkładu daje Normal z pojedynczą macierzą kowariancji, więc nie jestem pewien, jak to znormalizować. Mógłbyś rzutować losowy wektor na przestrzeń wymiarową (d-1), aby uzyskać pełną rangę macierzy kowariancji, ale jakiej projekcji użyć?

Aktualizacja 11/5

Ray Koopman ma ładne podsumowanie problemu pojedynczego Gaussa. Zasadniczo pojedyncza macierz kowariancji reprezentuje idealną korelację między zmiennymi, której nie można przedstawić za pomocą Gaussa. Można jednak uzyskać rozkład Gaussa dla gęstości warunkowej, uwarunkowany faktem, że wartość wektora losowego jest poprawna (składowe sumują się do n powyższym przypadku).

Różnica dla warunkowego Gaussa polega na tym, że odwrotność jest zastępowana pseudo-odwrotnością, a czynnik normalizacyjny używa „iloczynu niezerowych wartości własnych” zamiast „iloczynu wszystkich wartości własnych”. Ian Frisce podaje link do niektórych szczegółów.

Istnieje również sposób wyrażenia współczynnika normalizacji warunkowego Gaussa bez odwoływania się do wartości własnych, oto pochodna


Co dokładnie masz na myśli przez ograniczenie dystrybucji w tym przypadku?
Robby McKilliam

tzn. ten, który otrzymałeś z Central Limit Theorem, pozwól mi zaktualizować szczegóły
Jarosław Bułatow

1
To, o czym mówisz, to asymptotyczny rozkład estymatora maksymalnego prawdopodobieństwa wielomianu. Pierwszym równaniem powinno być n ^ {- 1}, a nie n ^ {- 1/2}.
Simon Byrne,

1
W powyższej notacji, dla d = 2, X_n jest liczbą głów po n rzutach monety, więc X_n / sqrt (n) zbliża się do Normalnego, a nie X_n / n, nie?
Yaroslav Bulatov

1
Tak, masz rację. Po prostu się myliłem.
Simon Byrne,

Odpowiedzi:


6

Kowariancja jest nadal nieujemna określona (podobnie jak prawidłowy wielowymiarowy rozkład normalny ), ale nie jest dodatnia określona: oznacza to, że (przynajmniej) jeden element losowego wektora jest liniową kombinacją pozostałych.

W rezultacie każde losowanie z tego rozkładu zawsze będzie leżeć w podprzestrzeni . W konsekwencji oznacza to, że nie można zdefiniować funkcji gęstości (ponieważ rozkład koncentruje się na podprzestrzeni: pomyśl o tym, w jaki sposób jednowymiarowa norma skoncentruje się na średniej, jeśli wariancja wynosi zero).Rd

Jednak, jak sugeruje Robby McKilliam, w tym przypadku możesz upuścić ostatni element losowego wektora. Macierz kowariancji tego zredukowanego wektora będzie pierwotną macierzą, z opuszczoną ostatnią kolumną i rzędem, która będzie teraz dodatnia i będzie miała gęstość (ta sztuczka zadziała w innych przypadkach, ale musisz uważać, który element upuszczasz i może być konieczne upuszczenie więcej niż jednego).


To, co jest nieco niezadowalające, to swoboda wyboru. Aby uzyskać prawidłową gęstość, muszę poprosić o rozkład wartości A x, gdzie A jest macierzą rangi d-1 (d) x (d-1). Czy błąd aproksymacji CLT dla skończonej n będzie równoważny dla wszystkich wyborów A? To nie jest dla mnie jasne
Jarosław Bułatow

1
Tak, błąd powinien być zawsze taki sam. Należy pamiętać, że ostatni element wektora jest funkcjonalnie zależny od innych elementów (d-1) (zarówno w przypadku próbki skończonej, jak i przypadków asymptotycznych).
Simon Byrne,

Nie chodzi o to, że „ostatni” element jest zależny, problem Yaroslava polega na tym, że nie podoba mu się pomysł wyboru, który element należy usunąć. Zgadzam się z odpowiedzią, której udzieliłeś, ale uważam również, że wymaga to nieco więcej przemyślenia i uwagi.
Robby McKilliam

@Yaroslav: Być może dobrze byłoby mieć pojęcie o tym, jaką aplikację masz tutaj na myśli, ponieważ na tym etapie istnieje potencjalnie wiele odpowiedzi na twoje pytanie.
Robby McKilliam

1
Robby - aplikacja, którą miałem na myśli, jest tutaj mathoverflow.net/questions/37582/... Zasadniczo całki Gaussa sugerowane przez CLT dają bardzo dobre przybliżenie sum dwumianowych współczynników (dla małych n, nawet lepszych niż bezpośrednie integrowanie reprezentacji gamma!), więc widziałem, czy mogę zrobić coś podobnego, aby uzyskać przybliżone sumy współczynników wielomianowych, których potrzebuję, aby uzyskać niesymptotyczne granice błędów dla różnych instalatorów (jak, maksymalne prawdopodobieństwo)
Jarosław Bułatow

2

Nie ma tutaj nieodłącznego problemu z pojedynczą kowariancją. Twój asymptotyczny rozkład jest osobliwą normą. Zobacz http://fedc.wiwi.hu-berlin.de/xplore/tutorials/mvahtmlnode34.html, który podaje gęstość pojedynczej normy.


Technicznie problem polega na tym, że pojedyncza macierz kowariancji oznacza, że ​​pewien podzbiór zmiennych jest doskonale skorelowany, więc gęstość prawdopodobieństwa powinna wynosić dokładnie 0 w niektórych obszarach, ale nie jest to możliwe w przypadku Gaussa. Jednym z rozwiązań jest zamiast tego przyjrzenie się gęstości warunkowej, uwarunkowanej faktem, że zmienna losowa leży w możliwym do wykonania regionie. Wygląda na to, co robią w łączu. Nigdy nie słyszałem terminu „G-inverse”, domyślam się, że to pseudo-inwersja Penrose-Moore?
Yaroslav Bulatov

Chociaż prawdą jest, że konwencjonalny Gaussian d-wymiarowy ma wsparcie dla wszystkich , pojedynczy Gaussian nie. G-odwrotność jest uogólniona odwrotnością i tak, uważam, że definicja Penrose-Moore działa tutaj. Myślę, że istnieje CLT dla pojedynczych kowariancji, stwierdzający zgodnie z oczekiwaniami, zbieżność w dystrybucji do pojedynczego CLT, chociaż nie mogę teraz znaleźć referencji. d
Ian Fiske

1

Wydaje mi się, że macierz kowariancji Wassermana jest liczbą pojedynczą, aby zobaczyć, pomnożyć ją przez wektor jedyników, tj. długości .[ 1 , 1 , 1 , , 1 ] d[1,1,1,,1]d

Wikipedia i tak podaje tę samą macierz kowariancji. Jeśli ograniczymy się tylko do rozkładu dwumianowego, wówczas standardowe centralne twierdzenie o limicie mówi nam, że rozkład dwumianowy (po odpowiednim skalowaniu) zbliża się do normalnego, gdy staje się duże (zobacz ponownie wikipedię ). Stosując podobne pomysły, powinieneś być w stanie wykazać, że odpowiednio wyskalowany mulinomial będzie zbieżny w rozkładzie do wielowymiarowej normalnej, tj. Każdy rozkład brzeżny jest tylko dwumianowy i zbiega się do rozkładu normalnego, a wariancja między nimi jest znana.n

Jestem więc bardzo pewien, że przekonasz się, że rozkład zbieżny z wielowymiarową normalną z zerową średnią i kowariancją gdzie jest kowariancją macierz omawianego wielomianu jest wektorem prawdopodobieństw . C.

Xnnpn
Cp[p1,,pd]
Cn
Cp[p1,,pd]

1
ale macierz kowariancji omawianego wielomianu jest pojedyncza, sam to pokazałeś ...
Jarosław Bułatow

Och, widzę twój problem! Jeden z elementów, powiedzmy, że jest całkowicie zależny od innych. Prawdopodobnie, jeśli odetniesz ostatni wiersz i kolumnę , dostaniesz, że są normalnie rozmieszczone, ale będę musiał o tym pomyśleć. Z pewnością gdzieś już to rozwiązano! C [ p 1 , p 2 , , p d - 1 ]dC[p1,p2,,pd1]
Robby McKilliam,

Jedną z sugestii, które znalazłem, jest użycie Gaussa, ale zamiast pseudo-odwrotności zamiast pseudo-odwrotnej i „iloczynu niezerowych wartości własnych”. Dla d = 2 wydaje się, że daje to prawidłową formę gęstości, ale współczynnik normalizacji jest wyłączony
Jarosław Bułatow

1

Czy to nie jest tak, żewszystkie , gdzie jest macierzą kowariancji wielomianu z -tego wiersza i kolumny usuwa? Ponieważ tak jest, nie rozumiem, co rozumiesz przez „wolność wyboru”, ponieważ każdy „wybór” jest równoważny.ja , j S - ja i|Si|=|Sj|i,jSii


Te macierze nie są równe, oto macierz kowariancji yaroslavvb.com/upload/multinomial-covariance-matrix.png
Jarosław

Tak, to jest rzeczywiście macierz kowariancji. Chodziło mi o usunięcie i-tej kolumny i wiersza w wyniku tego samego terminu normalizacji dla Gaussa. Może brakuje mi czegoś oczywistego?
jvdillon

Ach ... nie zauważyłem znaku determinującego. Hm ... wydają się one równe w niektórych przykładach, których próbowałem, czy jest na to prosty dowód? Wartości własne nie są jednak równe. Motywacją pytania było ustalenie, czy centralne twierdzenie graniczne daje taki sam błąd aproksymacji dla skończonej niezależnie od tego, który dystans wielomianowy. składnik, który upuszczaszn
Jarosław Bułatow

Prawdopodobnie najprostszym sposobem, aby przekonać się, że i wtyczki, że dla w . p i Spi=1jipjpiS
jvdillon

BTW, podoba mi się twoje zastosowanie tego pomysłu - stąd moje zainteresowanie odpowiedzią.
jvdillon
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.