Oto prosty przykład zabawki ilustrujący wpływ wymiaru na problem dyskryminacji, np. Problem, z którym się zmagasz, gdy chcesz powiedzieć, czy coś jest obserwowane lub czy zaobserwowano tylko efekt losowy (ten problem jest klasyczny w nauce).
Heurystyczny. Kluczową kwestią jest tutaj to, że norma euklidesowa przywiązuje taką samą wagę do każdego kierunku. Stanowi to brak wcześniejszego, a jak z pewnością wiesz w dużym wymiarze, nie ma darmowego lunchu (tj. Jeśli nie masz wcześniejszego pojęcia, czego szukasz, to nie ma powodu, dla którego hałas nie wyglądałby tak jak jesteś szukanie, to jest tautologia ...).
Powiedziałbym, że w przypadku każdego problemu istnieje limit informacji niezbędnych do znalezienia czegoś innego niż hałas. Limit ten jest w jakiś sposób związany z „rozmiarem” obszaru, który próbujesz zbadać w odniesieniu do poziomu „szumu” (tj. Poziomu treści nieinformacyjnych).
W dużym wymiarze, jeśli masz wcześniejszy sygnał, że twój sygnał jest rzadki, możesz usunąć (tj. Ukarać) rzadki wektor za pomocą metryki, która wypełnia przestrzeń rzadkim wektorem lub za pomocą techniki progowej.
Framework Załóżmy, że jest wektorem gaussowskim o średnim i przekątnej kowariancji ( jest znany) i że chcesz przetestować prostą hipotezęν σ I d σξνσIdσ
θ ∈ R n θ
H0:ν=0,VsHθ:ν=θ
(dla danego ) niekoniecznie jest z góry znany.
θ∈Rnθ
Testuj statystyki energią . Intuicja, którą z pewnością masz, polega na tym, że dobrym pomysłem jest ocena normy / energii twojej obserwacji aby zbudować statystykę testową. W rzeczywistości można zbudować znormalizowaną, wyśrodkowaną (pod ) wersję energii . To sprawia, że region krytyczny na poziomie formy dla dobrze wybranego ξH0TnTn=∑iξ 2 i -σ2En=1n∑ni=1ξ2iξH0Tn α{Tn≥v1-α}v1-αTn=∑iξ2i−σ22nσ4√α{Tn≥v1−α}v1−α
Moc testu i wymiar. W takim przypadku jest to proste ćwiczenie prawdopodobieństwa, aby pokazać następującą formułę mocy testu:
ZnE[Z]=0Var(Z)=1
Pθ(T≤v1−α)=P⎛⎝⎜Z≤v1−α1+2∥θ∥22/(nσ2)−−−−−−−−−−−−−√−∥θ∥222nσ4+2σ2∥θ∥22/(nσ2)−−−−−−−−−−−−−−−−−−√⎞⎠⎟
z suma iid zmiennych losowych z i .ZnE[Z]=0Var(Z)=1
Oznacza to, że moc twojego testu jest zwiększana przez energię twojego sygnału i zmniejszana o . Praktycznie oznacza to, że gdy zwiększa się rozmiar Twojego problemu, jeśli nie zwiększa siłę sygnału w tym samym czasie, a następnie dodajesz uninformative informacje do obserwacji (lub jesteś zmniejszenie odsetka użytecznych informacji w informacji masz): to jest jak dodawanie hałasu i zmniejsza moc testu (tzn. jest bardziej prawdopodobne, że powiesz, że nic nie jest obserwowane, podczas gdy w rzeczywistości coś jest). n n∥θ∥22nn
W kierunku testu ze statystyką progową. Jeśli nie masz dużo energii w swoim sygnale, ale znasz liniową transformację, która może pomóc ci skoncentrować tę energię w małej części twojego sygnału, możesz zbudować statystykę testową, która będzie oceniać energię tylko dla małej część twojego sygnału. Jeśli wiesz z góry, gdzie jest ono skoncentrowane (na przykład wiesz, że w twoim sygnale nie może być wysokich częstotliwości), możesz uzyskać moc w poprzednim teście, gdzie zastąpione małą liczbą, a prawie to samo ... Jeśli nie wiesz tego z góry, musisz to oszacować, co prowadzi do dobrze znanych testów progowych.‖ θ ‖ 2 2n∥θ∥22
Zauważ, że ten argument jest dokładnie u podstaw wielu dokumentów, takich jak
- A Antoniadis, F Abramowicz, T Sapatinas i B. Vidakovic. Metody falkowe do testowania w analizie funkcjonalnej modeli wariancyjnych. International Journal on Wavelets i jego zastosowania, 93: 1007–1021, 2004.
- MV Burnashef i Begmatov. Problem wykrycia sygnału prowadzący do stabilnej dystrybucji. Teoria prawdopodobieństwa i jej zastosowania, 35 (3): 556–560, 1990.
- Y. Baraud. Niesymptotyczna minimalna szybkość testowania w wykrywaniu sygnału. Bernoulli, 8: 577–606, 2002.
- J Fan. Test istotności oparty na progowaniu falkowym i obcinaniu neymana. JASA, 91: 674–688, 1996.
- J. Fan i SK Lin. Test znaczenia, gdy dane są krzywymi. JASA, 93: 1007–1021, 1998.
- V. Spokoiny. Adaptacyjne testowanie hipotez za pomocą falek. Annals of Statistics, 24 (6): 2477–2498, grudzień 1996.