Szukam korelacji między odpowiedziami na różne pytania w ankiecie („umm, zobaczmy, czy odpowiedzi na pytanie 11 korelują z odpowiedziami na pytanie 78”). Wszystkie odpowiedzi są kategoryczne (większość z nich „od bardzo nieszczęśliwych” do „bardzo szczęśliwych”), ale kilka z nich ma inny zestaw odpowiedzi. Większość z nich można uznać za porządkowe, więc rozważmy ten przypadek tutaj.
Ponieważ nie mam dostępu do komercyjnego programu statystycznego, muszę używać R.
Próbowałem Rattle (darmowy pakiet do eksploracji danych dla R, bardzo fajny), ale niestety nie obsługuje danych kategorycznych. Jednym z hacków, których mógłbym użyć, jest zaimportowanie w R zakodowanej wersji ankiety, która ma liczby (1..5) zamiast „bardzo nieszczęśliwego” ... „szczęśliwego” i niech Rattle uwierzy, że są to dane liczbowe.
Myślałem o zrobieniu wykresu rozrzutu i mieć wielkość kropki proporcjonalną do liczby liczb dla każdej pary. Po pewnym googlowaniu znalazłem http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/, ale wydaje mi się to bardzo skomplikowane (dla mnie).
Nie jestem statystykiem (ale programistą), ale przeczytałem trochę w tej sprawie i, jeśli dobrze rozumiem, rho Spearmana byłoby tutaj odpowiednie.
Krótka wersja pytania dla tych, którym się spieszy: czy istnieje sposób na szybkie wykreślenie rho Spearmana w R ? Fabuła jest lepsza niż matryca liczb, ponieważ łatwiej jest spojrzeć na nią, a także może być zawarta w materiałach.
Z góry dziękuję.
PS Zastanawiałem się przez chwilę, czy opublikować to na głównej stronie SO czy tutaj. Po przeszukaniu obu stron pod kątem korelacji R, czułem, że ta strona lepiej nadaje się do tego pytania.