Ponieważ jest dość ogólne, a zmiana podobieństwa kosinusowego zależy od konkretnych i i ich związku z , nie jest możliwe ustalenie konkretnego wzoru. Istnieją jednak praktycznie obliczalne granice, o ile podobieństwo cosinusa może się zmienić . Można je znaleźć, zwiększając kąt między a biorąc pod uwagę, że podobieństwo cosinus między i jest określoną wartością, powiedzmy (gdzie jest kątem między i ). Odpowiedź mówi nam, ile kątMABMMAMBABcos(2ϕ)2ϕAB2ϕmoże ewentualnie być zginane przez transformacji .M
Obliczenia grożą bałaganem. Niektóre sprytne wybory zapisu, a także pewne wstępne uproszczenia, zmniejszają wysiłek. Okazuje się, że rozwiązanie w dwóch wymiarach ujawnia wszystko, co musimy wiedzieć. Jest to problem możliwy do rozwiązania, zależny tylko od jednej rzeczywistej zmiennej , którą można łatwo rozwiązać za pomocą technik rachunku różniczkowego. Prosty argument geometryczny rozszerza to rozwiązanie na dowolną liczbę wymiarów .θn
Wstęp do matematyki
Z definicji cosinus kąta między dowolnymi dwoma wektorami i uzyskuje się przez znormalizowanie ich do długości jednostkowej i pobranie ich iloczynu. A zatem,AB
A′B(A′A)(B′B)−−−−−−−−−−√=cos(2ϕ)
i, pisząc , cosinus kąta między obrazami i pod transformacją wynosiΣ=M′MABM
(MA)′(MB)((MA)′(MA))((MB)′(MB))−−−−−−−−−−−−−−−−−−−−−−−√=A′ΣB(A′ΣA)(B′ΣB)−−−−−−−−−−−−√.(1)
Zauważ, że tylko znaczenie w analizie, aΣ nie samoMożemy zatem wykorzystać Singular Value rozpadu (SVD) z uproszczenie problemu. Przypomnijmy, że wyraża to jako iloczyn (od prawej do lewej) macierzy ortogonalnej , macierzy diagonalnej i innej macierzy ortogonalnej :MMMV′DU
M=UDV′.
Innymi słowy, nie jest podstawą uprzywilejowanych wektorów (kolumny ), w którym działa przez przeskalowanie co osobno przez przekątnej wejściowej od (które będzie wywoływać ), a następnie stosując obrót (lub anty-obrót) do wyniku. Ten końcowy obrót nie zmieni żadnych długości ani kątów, a zatem nie powinien wpływać na . Możesz to zobaczyć formalnie z obliczeniamie1,…,enVMeiithDdiUΣ
Σ=M′M=(UDV′)′(UDV′)=VD(U′U)DV′=VD2V′.
W związku z tym, aby zbadać możemy dowolnie zastąpić dowolną inną macierzą, która daje te same wartości w . Po zamówieniu taki sposób, aby wielkość zmniejszyła się (i zakładając, że nie jest identycznie zerowe), dobrym wyborem jestΣM(1)eidiMM
M=1d1DV′.
Ukośne elementy to(1/d1)D
1=d1/d1≥λ2=d2/d1≥λ3=d3/d1≥⋯≥λn=dn/d1≥0.
W szczególności wpływ (czy to w postaci oryginalnej, czy zmienionej) na wszystkie kąty jest całkowicie zdeterminowany przez to, żeM
Mei=λiei.
Analiza przypadku specjalnego
Niech . Ponieważ zmiana długości wektorów nie zmienia kąta między nimi, możemy założyć, że i są wektorami jednostkowymi. W płaszczyźnie wszystkie takie wektory mogą być oznaczone kątem, który tworzą z , co pozwala nam pisaćn=2ABe1
A=cos(θ−ϕ)e1+sin(θ−ϕ)e2.
W związku z tym
B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.
(Zobacz rysunek poniżej.)
Zastosowanie jest proste: naprawia pierwsze współrzędne i i mnoży ich drugie współrzędne przez . Dlatego kąt od do wynosiMABλ2MAMB
f(θ)=arctan(λ2tan(θ+ϕ))−arctan(λ2tan(θ−ϕ)).
Ponieważ jest funkcją ciągłą, ta różnica kątów jest funkcją ciągłą . W rzeczywistości jest różniczkowalny. To pozwala nam znaleźć skrajne kąty poprzez sprawdzenie zer pochodnej . Ta pochodna jest łatwa do obliczenia: jest to stosunek funkcji trygonometrycznych. Zera mogą występować tylko między zerami jego licznika, więc nie zawracajmy sobie głowy obliczeniem mianownika. OtrzymujemyMθf′(θ)
f′(θ)=λ2(1−λ2)(λ2+1)sin(2θ)sin(2ϕ)∗.
Szczególne przypadki , i są łatwe do zrozumienia: odpowiadają sytuacjom, w których ma niższą rangę (a więc zgniata wszystkie wektory do linii); gdzie jest wielokrotnością macierzy tożsamości; i gdzie i są równoległe (stąd kąt między nimi nie może się zmienić, niezależnie od ). Przypadek jest wykluczony przez warunek .λ2=0λ2=1ϕ=0MMABθλ2=−1λ2≥0
Oprócz tych szczególnych przypadków, zera występują tylko wtedy, gdy : to znaczy, lub . Oznacza to, że linia wyznaczona przez przecina kąt . Wiemy teraz, że skrajne wartości kąta między i muszą znajdować się wśród wartości , więc obliczmy je:sin(2θ)=0θ=0θ=π/2e1ABMAMBf(θ)
f(0)f(π/2)=arctan(λ2tan(ϕ))−arctan(λ2tan(−ϕ))=2arctan(λ2tan(ϕ));=arctan(λ2tan(π/2+ϕ))−arctan(λ2tan(π/2−ϕ))=2arctan(λ2cot(−ϕ)).
Odpowiednie cosinusy to
cos(f(0))=1−λ22tan(ϕ)21+λ22tan(ϕ)2(2)
i
cos(f(π/2))=1−λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2−λ22tan(ϕ)2+λ22.(3)
Często wystarczy zrozumieć, jak zniekształca kąty proste. W tym przypadku , co prowadzi do , które możesz podłączyć do poprzednich formuł.M2ϕ=π/2tan(ϕ)=cot(ϕ)=1
Zauważ, że im mniejsze , tym bardziej ekstremalne stają się te kąty i tym większe jest zniekształcenie.λ2
Ta rycina pokazuje cztery konfiguracje wektorów i oddzielonych kątem . Okrąg jednostki i jego eliptyczny obraz pod są cieniowane dla odniesienia (z działaniem równomiernie przeskalowanym, aby ). Nagłówki cyfra wskazuje wartość , środek i . Najbliższe takie i mogą się pojawić po transformacji przez to konfiguracja taka jak ta po lewej zAB2ϕ=π/3MMλ1=1θABABMθ=0. Najbardziej oddalone od siebie mogą być konfiguracje takie jak ta po prawej stronie z . Pokazane są dwie możliwości pośrednie.θ=π/2
Rozwiązanie dla wszystkich wymiarów
Widzieliśmy, jak działa , rozszerzając każdy wymiar o współczynnik . Spowoduje to zniekształcenie sfery jednostkowej w elipsoidę. W określić swoje główne osie. Do są odległości od pochodzenia, wzdłuż tych osi, do elipsoidy. W konsekwencji najmniejsza, , jest najkrótszą odległością (od dowolnego kierunku) od początku do elipsoidy, a największa, , jest najdalszą (od dowolnego kierunku) odległości od początku do elipsoidy.Miλi{A|A′A=1}eiλiλnλ1
W większych wymiarach , i znajdują się w dwuwymiarowej podprzestrzeni. odwzorowuje koło jednostki w tej podprzestrzeni na przecięcie elipsoidy z płaszczyzną zawierającą i . To skrzyżowanie, będące liniowym zniekształceniem koła, jest elipsą. Oczywiście największa odległość do tej elipsy wynosi nie więcej niż a najkrótsza odległość nie jest mniejsza niż .n>2ABMMAMBλ1=1λn
Jak zauważyliśmy na końcu poprzedniego rozdziału, najbardziej ekstremalną możliwością jest umieszczenie i w płaszczyźnie zawierającej dwa dla których stosunek odpowiednich jest tak mały, jak to możliwe. Stanie się to na płaszczyźnie . Mamy już rozwiązanie dla tej sprawy.ABeiλie1,en
Wnioski
Ekstremalne podobieństwa cosinusów osiągalne przez zastosowanie do dwóch wektorów mających podobieństwo cosinusów podano w i . Osiąga się to poprzez umieszczenie i pod równymi kątami w kierunku, w którym maksymalnie wydłuża dowolny wektor (taki jak kierunek ) i rozdzielając je w kierunku, w którym minimalnie wydłuża dowolny wektor ( takie jak kierunek ).Mcos(2ϕ)(2)(3)ABΣ=M′Me1Σen
Te skrajne mogą być obliczane w odniesieniu do metody SVD .M