Jeśli mam zestaw danych z obserwacjami i zmiennymi (wymiarami), a na ogół jest mały ( ), a może być w zakresie od małego ( ) do być może znacznie większego ( ).
Pamiętam, że dowiedziałem się, że powinno być znacznie większe niż , aby uruchomić analizę głównych składowych (PCA) lub analizę czynnikową (FA), ale wydaje się, że tak nie jest w moich danych. Pamiętaj, że do moich celów rzadko jestem zainteresowany żadnymi głównymi komponentami wcześniejszymi niż PC2.
Pytania:
- Jakie są podstawowe zasady dotyczące minimalnego rozmiaru próbki, gdy PCA jest w porządku, a kiedy nie?
- Czy używanie pierwszych kilku komputerów jest kiedykolwiek w porządku, nawet jeśli lub ?
- Czy są na to jakieś odniesienia?
Nie ma znaczenia, czy Twoim głównym celem jest użycie PC1 i ewentualnie PC2:
- po prostu graficznie lub
- jako zmienna syntetyczna zastosowana następnie w regresji?