Chociaż nadal brakuje pewnych informacji (liczba osób i przedmiotów na podskalę), oto kilka ogólnych wskazówek na temat zmniejszania skali. Ponadto, ponieważ pracujesz na poziomie kwestionariusza, nie rozumiem, dlaczego jego długość ma tak duże znaczenie (w końcu podasz tylko statystyki podsumowujące, takie jak wyniki całkowite lub średnie).
Zakładam, że (a) masz zestaw przedmiotów K mierzących jakąś konstrukcję związaną z morale, (b) twoja „jednowymiarowa” skala jest czynnikiem drugiego rzędu, który może być podzielony na różne aspekty, (c) chciałbyś zmniejsz swoją skalę do k <K elementów, aby podsumować z wystarczającą dokładnością łączne wyniki skali podmiotów, zachowując przy tym ważność treści skali.
O ważności treści / konstruktu tej zatwierdzonej skali: Liczba elementów została z pewnością wybrana, aby jak najlepiej odzwierciedlać interesującą konstrukcję. Skracając kwestionariusz, faktycznie zmniejszasz zasięg konstruktu. Dobrze byłoby sprawdzić, czy struktura czynnikowa pozostaje taka sama, biorąc pod uwagę tylko połowę elementów (co może w końcu wpłynąć na sposób ich wyboru). Można tego dokonać za pomocą tradycyjnych technik FA. Ponosisz odpowiedzialność za interpretację skali w duchu podobnym do autorów.
O wiarygodności wyników : Chociaż jest to miara zależna od próby, wiarygodność wyników zmniejsza się przy zmniejszaniu liczby elementów (patrz wzór Spearmana-Browna ); innym sposobem na stwierdzenie, że standardowy błąd pomiaru (SEM) wzrośnie, ale patrz Moduł instruktażowy NCME na temat standardowego błędu pomiaru autorstwa Leo M. Harvilla. Nie trzeba dodawać, że stosuje się do każdego wskaźnika, który zależy od liczby elementów (np. Alfa Cronbacha, którego można użyć do oszacowania jednej formy wiarygodności, a mianowicie wewnętrznej spójności). Mamy nadzieję, że nie wpłynie to na porównania między grupami oparte na surowych wynikach.
Tak więc moje rekomendacje (najprostszy sposób) to:
- Wybierz swoje przedmioty, aby zmaksymalizować zasięg konstrukcji; sprawdzić wymiarowość za pomocą FA i pokrycie za pomocą rozkładów odpowiedzi jednoznacznych;
- Porównaj średnie korelacje między elementami z wcześniej zgłoszonymi;
- Oblicz spójność wewnętrzną dla pełnej skali i swoich kompozytów; sprawdzić, czy są one zgodne z opublikowanymi statystykami w oryginalnej skali (nie trzeba niczego testować, są to środki zależne od próby);
- Przetestuj korelacje liniowe (lub polichoryczne lub rangowe) między oryginalnymi i zredukowanymi (pod) wynikami, aby upewnić się, że są one porównywalne (tj. Że poszczególne lokalizacje utajonej cechy nie różnią się w znacznym stopniu, co jest zobiektywizowane przez surowe wyniki );
- Jeśli masz zewnętrzną zmienną specyficzną dla przedmiotu (np. Płeć, wiek lub najlepiej miarę związaną z morale), porównaj ważność znanej grupy między tymi dwiema formami.
Trudno byłoby polegać na Teorii Reakcji na Przedmiot, aby wybrać te przedmioty, które niosą maksimum informacji o utajonej skali cech - to tak naprawdę jedno z jej najlepszych zastosowań. Modele dla elementów polimorficznych zostały częściowo opisane w tym wątku, Sprawdzanie poprawności kwestionariuszy .
Zaktualizuj po drugiej aktualizacji
- Zapomnij o jakichkolwiek modelach IRT dla przedmiotów z polimotomią z tak małą liczbą tematów.
- Analiza czynnikowa będzie również cierpieć z powodu tak małej wielkości próbki; otrzymasz niewiarygodne oszacowania obciążeń czynnikowych.
- 30 elementów podzielonych przez 2 = 15 elementów (łatwo jest uzyskać wyobrażenie o wzroście odpowiedniego SEM dla całkowitego wyniku), ale zdecydowanie pogorszy się, jeśli weźmiesz podskale (to było właściwie moje drugie pytanie - Liczba przedmiotów na podskalę, jeśli występuje)