Uważam, że zamieszanie może wynikać z czegoś nieco prostszego, ale daje mi dobrą okazję do przeglądu niektórych powiązanych kwestii.
β^jaΒ str
β^ja=?⟨ Y , zja⟩∥ zja∥2),
β^p
Kolejny schemat ortogonalizacji (forma ortogonalizacji Gram – Schmidta) (prawie) tworzy parę macierzy i takie, że
gdzieG X = Z GZsolZ n × p G = ( g i j ) p × p Z G
X = Z G,
Z jest pz kolumnami ortonormalnymi, a jest górny trójkątny. Mówię „prawie”, ponieważ algorytm określa tylko do norm kolumn, które na ogół nie będą jednością, ale można sprawić, by miały normę jednostkową poprzez normalizację kolumn i dokonanie odpowiedniego prostego dostosowania współrzędnych matryca .
n × pG =( gI j)p × pZsol
Zakładając oczywiście, że ma rangę , unikalnym rozwiązaniem najmniejszych kwadratów jest wektor który rozwiązuje układ
s ≤ n β X t X β = X T YX ∈ Rn× pp ≤ nβ^
XT.X β^= XT.y.
Zastępstwo Z T Z = I G T G β = G , T Z T YX = Z G i używając (z konstrukcji), otrzymujemy
co jest równoważne
ZT.Z = IG β = Z , T r
solT.G β^= GT.ZT.y,
G β^= ZT.y.
Teraz skoncentruj się na ostatnim rzędzie układu liniowego. Jedynym niezerowym elementem w ostatnim wierszu jest . Otrzymujemy więc
g s s g s P β p = ⟨ y , oo s ⟩solsolp pg p p = ‖ z p ‖ z i
solp pβ^p= ⟨ Y , zp⟩.
Nietrudno dostrzec (zweryfikować to jako sprawdzenie zrozumienia!), Żei to daje rozwiązanie. (
Lektor z : użyłem już znormalizowanego, aby mieć normę jednostkową, podczas gdy w książce tego
nie mają . To wyjaśnia fakt, że książka ma kwadratową normę w mianowniku, podczas gdy ja mam tylko normę.)
solp p= ∥ zp∥zja
Aby znaleźć wszystkie współczynniki regresji, należy wykonać prosty krok do zastąpienia w celu rozwiązania dla indywidualnego . Na przykład dla wiersza(P-1)gp-1,p-1 β s-1+gp-1,str β p=⟨oop-1,Y⟩β^ja( p - 1 ) ,
a więc
Można kontynuować tę procedurę, pracując „wstecz” od ostatniego wiersza systemu do pierwszego, odejmując ważone sumy współczynników regresji już obliczonych, a następnie dzieląc przez wiodący termin aby uzyskać .Β s - 1 = g - 1 p - 1 , p - 1 ⟨ oo p - 1 , Y ⟩
solp - 1 , p - 1β^p - 1+ gp - 1 , pβ^p= ⟨ Zp - 1, R ⟩,
β^p - 1= g- 1p - 1 , p - 1⟨ oop - 1, R ⟩- g- 1p - 1 , p - 1solp - 1 , pβ^p.
solja jaβ^ja
Chodzi o to, że w sekcji ESL możemy zmienić kolejność kolumn aby uzyskać nową macierz przy czym ta oryginalna kolumna jest teraz ostatnią. Jeśli następnie zastosujemy procedurę Gram – Schmidta na nowej macierzy, otrzymamy nową ortogonalizację, dzięki czemu rozwiązanie dla pierwotnego współczynnika znajdziemy w prostym powyższym rozwiązaniu. To daje nam interpretację współczynnika regresji . Jest to regresja jednowymiarowa na wektorze resztkowym uzyskana przez „regresję” pozostałych kolumn macierzy projektowej z .XX( r )rβ^rβ^ryxr
Ogólne rozkłady QR
Procedura Gram-Schmidt ale Sposób wytwarzania QR rozkład . Rzeczywiście istnieje wiele powodów, aby preferować inne podejścia algorytmiczne niż procedurę Gram – Schmidta.X
Odbicia domu i rotacje Givens zapewniają bardziej stabilne numerycznie podejście do tego problemu. Należy zauważyć, że powyższy rozwój nie zmienia się w ogólnym przypadku rozkładu QR. Mianowicie, niech
być dowolnego rozkładu QR . Następnie, stosując dokładnie takie same rozumowania i manipulacje algebraiczne, jak powyżej, mamy rozwiązanie najmniejszych kwadratów spełnia
co upraszcza
Ponieważ jest trójkątem górnym, działa ta sama technika zastępowania. Najpierw rozwiązujemy dla
X = Q R.,
Xβ^RT.R β^= RT.QT.y,
R β^= QT.y.
Rβ^pa następnie przejdź do tyłu od dołu do góry. Wybór dla
których QR rozkładu algorytm użyć ogólnie zawiasy kontrolowanie niestabilności numerycznej i z tej perspektywy, Gram-Schmidt generalnie nie jest konkurencyjna podejście.
Pojęcie dekompozycji jako macierzy ortogonalnej razy coś innego można również uogólnić nieco dalej, aby uzyskać bardzo ogólną formę dopasowanego wektora , ale obawiam się, że ta odpowiedź stała się już zbyt długa .Xy^