Dlaczego RP nie jest projekcją w ramach tej definicji?
Michael Mahoney pisze w notatkach z wykładu, że to zależy od tego, jak zbudowana jest RP , niezależnie od tego, czy RP jest rzutem w tradycyjnym algebraicznym sensie liniowym. Robi to w trzecim i czwartym punkcie:
Po trzecie, gdyby losowe wektory były dokładnie ortogonalne (tak jak były w oryginalnych konstrukcjach JL), to mielibyśmy, że rzut JL był rzutem ortogonalnym
...
ale chociaż jest to fałsz dla Gaussów, zmiennych losowych i większości innych konstrukcji, można udowodnić, że wektory powstałe w przybliżeniu mają długość jednostkową i w przybliżeniu prostopadłą{±}
...
to jest „wystarczająco dobre”.
Można więc zasadniczo wykonać losową projekcję o innej konstrukcji, która jest ograniczona do macierzy ortogonalnych (chociaż nie jest to potrzebne). Zobacz na przykład oryginalne dzieło:
Johnson, William B. i Joram Lindenstrauss. „Rozszerzenia mapowań Lipschitza w przestrzeń Hilberta”. Współczesna matematyka 26.189-206 (1984): 1.
... jeśli ktoś wybiera losowo postój rzucie prostokątnym nakln2
...
Aby to dokładniej pozwolimy się występ na pierwszym współrzędnych i pozwolić znormalizować Haar środka w , prostopadłym grupy w . Następnie zmienna losowa zdefiniowana przez określa pojęcie „ rzutu losowego r ”.Qkln2σO(n)ln2f:(O(n),σ)→L(ln2)
f(u)=U⋆QU
k
Wpis w Wikipedii opisuje losową projekcję w ten sposób (to samo wspomniano w notatkach z wykładów na stronach 10 i 11)
https://en.wikipedia.org/wiki/Random_projection#Gaussian_random_projection
Pierwszy rząd to losowy wektor jednostkowy wybrany jednolicie spośród . Drugi rząd to losowy wektor jednostek z przestrzeni ortogonalnej do pierwszego rzędu, trzeci rząd to losowy wektor jednostek z przestrzeni ortogonalnej do pierwszych dwóch rzędów i tak dalej.Sd−1
Ale na ogół nie uzyskuje się tej ortogonalności, gdy weźmie się wszystkie wpisy macierzy w macierzowych zmiennych losowych i niezależnych o rozkładzie normalnym (jak Whuber wspomniał w swoim komentarzu z bardzo prostą konsekwencją) „jeśli kolumny byłyby zawsze ortogonalne, ich wpisy mogłyby nie być niezależnym ”).
Macierz i iloczyn w przypadku kolumn ortonormalnych można postrzegać jako rzut, ponieważ dotyczy macierzy rzutowania . To trochę tak samo, jak widzenie zwykłej regresji metodą najmniejszych kwadratów jako projekcji. Iloczyn nie jest rzutem, ale daje współrzędną w innym wektorze bazowym. „Prawdziwa” projekcja to , a macierz projekcji to .RP=RTRb=RTxx′=Rb=RTRxRTR
Macierz projekcji musi być operatorem tożsamości w podprzestrzeni która jest zakresem projekcji (patrz właściwości wspomniane na stronie wikipedii). Lub inaczej powiedział, że musi mieć wartości własne 1 i 0, tak, że podprzestrzeń, dla której jest to matryca tożsamości, jest rozpiętością wektorów własnych powiązanych z wartościami własnymi 1. Przy losowych wpisach macierzy nie uzyskasz tej właściwości. To drugi punkt notatek z wykładuP=RTRU
... na wiele sposobów „wygląda jak” macierz ortogonalna ... jest równomiernie rozmieszczoną podprzestrzenią ... ale wartości własne nie są w .range(PTP){0,1}
należy zauważyć, że w tym cytacie macierz odnosi się do macierzy w pytaniu, a nie do macierzy projekcji implikowanej przez macierzPRP=RTRR
Tak więc losowe odwzorowanie przez różne konstrukcje, takie jak użycie losowych wpisów w macierzy, nie jest dokładnie równe rzutowi ortogonalnemu. Ale jest obliczeniowo prostszy i według Michaela Mahoneya jest „wystarczająco dobry”.