Zakładam, że twój kwestionariusz należy traktować jako jedną jednowymiarową skalę (w przeciwnym razie alfa Cronbacha nie ma większego sensu). Aby to sprawdzić, warto przeprowadzić eksploracyjną analizę czynnikową. Pozwoli ci również zobaczyć, jak przedmioty odnoszą się do wagi (tj. Poprzez ich ładunki).
Podstawowe kroki sprawdzania poprawności elementów i wagi powinny obejmować:
- pełny raport na temat podstawowych statystyk pozycji (zasięg, kwartyle, tendencja centralna, efekty pułapu i podłogi, jeśli występują);
- sprawdzanie wewnętrznej spójności, jak w przypadku alfa (najlepiej, daj 95% przedziały ufności, ponieważ jest ona zależna od próbki);
- opisz swoją sumaryczną miarę (np. wynik całkowity lub średni, inaczej wynik skali) ze zwykłymi statystykami (histogram + gęstość, kwantyle itp.);
- sprawdź odpowiedzi podsumowujące względem konkretnych zmiennych towarzyszących, które powinny być powiązane z konstrukcją, którą oceniasz - określa się to jako ważność znanej grupy;
- jeśli to możliwe, sprawdź odpowiedzi podsumowujące w porównaniu ze znanymi instrumentami, które mogą mierzyć ten sam konstrukt ( ważność równoczesna lub zbieżna).
Jeśli twoja skala nie jest jednowymiarowa, należy wykonać te kroki dla każdej podskali, a także możesz rozłożyć macierz korelacji swoich czynników, aby ocenić strukturę czynników drugiego rzędu (lub zastosować modelowanie równań strukturalnych lub analizę czynnikową potwierdzającą lub cokolwiek chcesz). Można także ocenić trafność zbieżną i dyskryminacyjną, stosując skalowanie wielu cech lub modelowanie wielu metod (oparte na korelacjach międzymiastowych w obrębie i między skalami) lub, ponownie, SEM.
Powiedziałbym wtedy, że teoria odpowiedzi na przedmioty nie pomogłaby aż tak bardzo, chyba że jesteś zainteresowany skróceniem kwestionariusza, odfiltrowaniem niektórych elementów, które pokazują funkcjonowanie elementów różnicowych , lub skorzystaniem z testu w jakimś rodzaju komputerowego testu adaptacyjnego .
W każdym razie model Rasch jest przeznaczony do elementów binarnych. W przypadku zamówionych artykułów z polimomią najczęściej stosowanymi modelami są:
- model stopniowanej odpowiedzi
- model częściowego kredytu
- model skali ratingowej.
Tylko dwie ostatnie pochodzą z rodziny Rasch i zasadniczo używają sąsiedniej formuły szans, z ideą, że badany musi „przekroczyć” kilka progów, aby zatwierdzić daną kategorię odpowiedzi. Różnica między tymi dwoma modelami polega na tym, że PCM nie narzuca, że progi są równomiernie rozmieszczone na skali theta ( zdolność lub lokalizacja obiektu na cechy utajonej). Model stopniowanej odpowiedzi opiera się na formule skumulowanych szans. Pamiętaj, że wszystkie te modele zakładają, że skala jest jednowymiarowa; tzn. istnieje tylko jedna ukryta cecha. Istnieją dodatkowe założenia, takie jak np. Lokalna niezależność (tj. Korelacje między odpowiedziami są wyjaśnione przez zmienność w skali umiejętności).
W każdym razie, można znaleźć bardzo kompletną dokumentację i użyteczne wskazówki do zastosowania metod psychometrycznych w badania w objętości 20 Journal of Statistical Software: Special Objętość: Psychometria w R . Zasadniczo, większość pakietów interesujący R, który używam w mojej codziennej pracy są: LTM , ERM , psych , psy . Inne są wymienione w widoku zadań CRAN Psychometrics . Inne interesujące zasoby to:
Dobry przegląd zastosowania FA vs. IRT w rozwoju skali można znaleźć w Konstrukcji i ocenie skali w praktyce: Przegląd analizy czynnikowej w porównaniu do teorii teorii odpowiedzi na odpowiedź , przeprowadzony przez dziesięć Holt i wsp. (Psychological Test and Assessment Modeling (2010) 52 (3): 272–297).