Teoria odpowiedzi na pytanie a analiza czynnikowa potwierdzająca


14

Zastanawiałem się, jakie są podstawowe, znaczące różnice między Teorią Reakcji na Pozycję a Analizą Czynnika Potwierdzającego.

Rozumiem, że istnieją różnice w obliczeniach (bardziej skupiając się na elemencie vs. kowariancje; log-liniowy vs. liniowy).

Nie mam jednak pojęcia, co to oznacza z perspektywy wyższego poziomu - czy to oznacza, że ​​IRT jest lepszy od CFA w niektórych okolicznościach? Lub dla nieco innych celów końcowych?

Wszelkie rozważania byłyby przydatne, ponieważ skan literatury badawczej doprowadziłby do bardziej opisu IRT i CFA niż do jakiegokolwiek przydatnego porównania podstawowych różnic między nimi.

Odpowiedzi:


7

Odpowiedź Philchalmersa jest na miejscu, a jeśli chcesz referencji od jednego z liderów w tej dziedzinie, Muthena (twórcy Mplusa), proszę: (Edytowano, aby dołączyć bezpośredni cytat)

Użytkownik MPlus pyta: staram się opisać i zilustrować obecne podobieństwa i różnice między binarnym CFA i IRT w mojej pracy magisterskiej. Domyślną metodą oszacowania w Mplus dla kategorycznego CFA jest WLSMV. Aby uruchomić model IRT, przykład w podręczniku sugeruje użycie MLR jako metody szacowania. Kiedy używam MLR, czy dane wejściowe są nadal macierzą korelacji tetrachorycznej, czy też używana jest pierwotna macierz danych odpowiedzi?

Bengt Muthen odpowiada: Nie sądzę, że istnieje różnica między CFA zmiennych jakościowych a IRT. Czasami twierdzi się, ale nie zgadzam się. Który estymator jest zwykle używany, może się różnić, ale to nie jest konieczne. MLR wykorzystuje surowe dane, a nie przykładową macierz korelacji tetrachorycznej. ... Podejście ML (R) jest takie samo, jak podejście „marginalne ML (MML)” opisane np. W pracy Bocka. Więc używając surowych danych i całkując czynniki przy użyciu integracji numerycznej. MML kontrastuje z „warunkowym ML” stosowanym np. W podejściach Rascha.

Zakładając normalne współczynniki, probit (normalny ostiw) relacje element-czynnik oraz niezależność warunkową, założenia są takie same dla ML i WLSMV, gdzie ta ostatnia wykorzystuje tetrachorię. Wynika to z faktu, że założenia te odpowiadają założeniu wielowymiarowych normalnych zmiennych leżących u podstaw ciągłej odpowiedzi utajonej za wynikami kategorycznymi. Tak więc WLSMV korzysta tylko z informacji pierwszego i drugiego rzędu, podczas gdy ML sięga aż do najwyższego rzędu. Utrata informacji wydaje się jednak niewielka. ML nie pasuje do tego modelu tetrachoriki, więc można powiedzieć, że WLSMV marginalizuje się w inny sposób. Jest to kwestia różnic estymatorów, a nie różnic modeli.

Na naszej stronie internetowej znajduje się informacja IRT:

http://www.statmodel.com/download/MplusIRT2.pdf

ale znowu podejście ML (R) nie różni się niczym od tego, co jest używane w IRT MML.

Źródło: http://www.statmodel.com/discussion/messages/9/10401.html?1347474605


2
Czy możesz skopiować i wkleić kilka istotnych cytatów z Muthen w swojej odpowiedzi? Odpowiedzi tylko do linków są na ogół marne, szczególnie dlatego, że linki mają tendencję do gnicia.
ameba mówi Przywróć Monikę

2
Nie jestem pewien, czy zgadzam się z tym stwierdzeniem Muthena, ponieważ zdaje się on definiować IRT w bardzo wąski sposób. Tak, modele 2PL i stopniowane odpowiedzi można zrozumieć w ramach SEM, ponieważ mają ładne kanoniczne funkcje łączenia, a zatem można je ponownie wyrazić przy użyciu innych wystarczających statystyk (takich jak korelacje polichoryczne). Ale co z innymi popularniejszymi modelami IRT, takimi jak model 3PL, model punktowy idealny, model częściowo kompensacyjny itp.? Pewnie, niektóre modele można zrozumieć w ramach SEM, ale myślę, że mój punkt widzenia na temat IRT nadal jest słuszny.
philchalmers

17

Pod pewnymi względami masz rację, CFA i IRT są cięte z tej samej tkaniny. Ale pod wieloma względami są one również zupełnie inne. CFA, lub bardziej odpowiednio pozycja CFA, jest adaptacją struktury modelowania równania strukturalnego / kowariancji w celu uwzględnienia szczególnego rodzaju kowariancji między kategoriami. IRT dotyczy bardziej bezpośrednio modelowania relacji zmiennych zmiennych jakościowych bez wykorzystywania w zmiennych tylko informacji pierwszego i drugiego rzędu (jest to pełna informacja, więc jej wymagania na ogół nie są tak surowe).

Pozycja CFA ma kilka zalet, ponieważ wchodzi w zakres SEM, a zatem ma bardzo szerokie zastosowanie do wielowymiarowych systemów relacji z innymi zmiennymi. Z drugiej strony IRT koncentruje się głównie na samym teście, chociaż zmienne towarzyszące mogą być również uwzględnione w teście bezpośrednio (np. Patrz tematy dotyczące wyjaśniającego IRT). Przekonałem się również, że relacje modelowania przedmiotów są znacznie bardziej ogólne w strukturze IRT, ponieważ łatwiej jest sobie radzić z niemonotonicznymi, nieparametrycznymi lub po prostu niestandardowymi modelami odpowiedzi na przedmioty, ponieważ nie trzeba się martwić o wystarczalność stosowania polichorycznej macierzy korelacji.

Oba frameworki mają swoje zalety i wady, ale ogólnie CFA jest bardziej elastyczny, gdy poziom abstrakcji / wnioskowania modelowania koncentruje się na relacji w systemie zmiennych, podczas gdy IRT jest ogólnie preferowany, jeśli sam test (i elementy w nim zawarte) są w centrum zainteresowania.


Cudownie - jest to piękny i przejrzysty przegląd. Dziękuję Phil.
SimonsSchus

2
To powinna być zaakceptowana odpowiedź.
Vladislavs Dovgalecs

2

Wierzę, że Yves Rosseel omawia to krótko w slajdach 91–93 ze swoich warsztatów w 2014 r .: http://www.personality-project.org/r/tutorials/summerschool.14/rosseel_sem_cat.pdf

Zaczerpnięte z Rosseel (2014, link powyżej):

Podejście oparte na pełnej informacji: marginalne maksymalne prawdopodobieństwo

pochodzenie: modele IRT (np. Bock i Lieberman, 1970) i ​​GLMM

...

połączenie z IRT

• teoretyczny związek między SEM i IRT został dobrze udokumentowany:

Takane, Y. i De Leeuw, J. (1987). O związku między teorią odpowiedzi na pytanie a analizą czynnikową zmiennych dyskretnych. Psychome- trika, 52, 393-408.

Kamata, A., i Bauer, DJ (2008). Uwaga na temat związku między modelami analizy analitycznej a modelami teorii odpowiedzi. Modelowanie równań strukturalnych, 15, 136-153.

Joreskog, KG, i Moustaki, I. (2001). Analiza czynnikowa zmiennych porządkowych: Porównanie trzech podejść. Multivariate Behavioural Research, 36, 347-387.

kiedy są równoważne?

• probit (normalnie-ostroogowy) kontra logit: oba wskaźniki są stosowane w praktyce

• jednoskładnikowy CFA na elementach binarnych jest równoważny dwuparametrowemu modelowi IRT (Birnbaum, 1968):

W CFA: ... W IRT: ... (patrz slajd)

• jednoskładnikowy CFA na polichotomicznych (porządkowych) elementach jest równoważny modelowi stopniowanej odpowiedzi (Samejima, 1969)

• nie ma odpowiednika CFA dla modelu 3-parametrowego (z parametrem zgadywania)

• model Rasch jest równoważny jednoskładnikowemu CFA na elementach binarnych, ale gdzie wszystkie ładunki czynnikowe muszą być równe (a metryka probit jest konwertowana na metrykę logit)

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.