Wiem, że w sytuacji regresji, jeśli masz zestaw wysoce skorelowanych zmiennych, jest to zwykle „złe” ze względu na niestabilność szacowanych współczynników (wariancja zmierza w kierunku nieskończoności, gdy wyznacznik zmierza w kierunku zera).
Moje pytanie brzmi, czy ta „zła” utrzymuje się w sytuacji PCA. Czy współczynniki / obciążenia / ciężary / wektory własne dla dowolnego komputera stają się niestabilne / arbitralne / niejednorodne, gdy macierz kowariancji staje się pojedyncza? Szczególnie interesuje mnie przypadek, w którym zachowany jest tylko pierwszy główny element, a wszystkie pozostałe są odrzucane jako „hałas”, „coś innego” lub „nieważne”.
Nie sądzę, że tak, ponieważ pozostanie tylko kilka podstawowych składników, które mają zero lub bliskie zeru wariancji.
Łatwo zauważyć, że nie jest tak w prostym przypadku ekstremalnym z 2 zmiennymi - załóżmy, że są one doskonale skorelowane. Wtedy pierwszy PC będzie dokładną zależnością liniową, a drugi PC będzie prostopadły do pierwszego PC, przy wszystkich wartościach PC równych zero dla wszystkich obserwacji (tj. Wariancji zerowej). Zastanawiam się, czy to bardziej ogólne.