Algorytm PCA można sformułować w kategoriach macierzy korelacji (załóżmy, że dane zostały już znormalizowane i rozważamy jedynie rzut na pierwszy komputer). Funkcję celu można zapisać jako:
To jest w porządku i używamy mnożników Lagrangian, aby go rozwiązać, tj. Przepisując go jako:
co jest równoważne z
i stąd ( patrz tutaj na Mathworld ) wydaje się być równa
Ale to mówi, aby zmaksymalizować odległość między punktem i linią, a z tego, co tu przeczytałem , jest to niepoprawne - powinno to być , a nie . Gdzie jest mój błąd?
Czy ktoś może mi pokazać związek między maksymalizowaniem wariancji w rzutowanej przestrzeni a minimalizowaniem odległości między punktem a linią?