Kontekst: Zapytałem setki uczestników ankiety, jak bardzo są zainteresowani wybranymi obszarami (według pięciopunktowej skali Likerta, gdzie 1 wskazuje „nie zainteresowany”, a 5 wskazuje „zainteresowany”).
Potem spróbowałem PCA. Poniższy obraz przedstawia dwa pierwsze główne elementy. Kolory są używane dla płci, a strzałki PCA są oryginalnymi zmiennymi (tj. Zainteresowaniami).
Zauważyłem to:
- Kropki (respondenci) są dość dobrze oddzielone przez drugi składnik.
- Brak punktów strzałek.
- Niektóre strzały są znacznie krótsze niż inne.
- Zmienne zwykle tworzą klastry, ale nie obserwacje.
- Wydaje się, że strzałki skierowane w dół (do mężczyzn) są głównie zainteresowaniami mężczyzn, a strzałki skierowane w górę są głównie interesami kobiet.
- Niektóre strzałki nie wskazują ani w dół, ani w górę.
Pytania: Jak poprawnie interpretować relacje między kropkami (respondenci), kolorami (płcie) i strzałkami (zmienne)? Jakie inne wnioski na temat respondentów i ich zainteresowań można wydobyć z tego wątku?
Dane można znaleźć tutaj .