Czy właściwe jest traktowanie danych w skali n-punktowej Likerta jako n prób z procesu dwumianowego?

11

Nigdy nie podobało mi się, jak ludzie zazwyczaj analizują dane ze skal Likerta tak, jakby błąd był ciągły i Gaussa, gdy istnieją uzasadnione oczekiwania, że te założenia zostaną naruszone przynajmniej w skrajnych skalach. Co sądzisz o następującej alternatywie:

Jeśli odpowiedź przyjmuje wartość w skali punktowej, rozwiń te dane do prób, z których ma wartość 1, a mają wartość 0. Tak więc traktujemy odpowiedź w skali Likerta tak, jakby jest jawną agregacją tajnej serii badań dwumianowych (w rzeczywistości z punktu widzenia kognitywistyki jest to w rzeczywistości atrakcyjny model mechanizmów zaangażowanych w takie scenariusze decyzyjne). Dzięki rozszerzonym danym możesz teraz używać modelu efektów mieszanych, określając respondenta jako efekt losowy (także pytanie jako efekt losowy, jeśli masz wiele pytań) i używając funkcji linku dwumianowego do określenia rozkładu błędów. $k$ $n$ $n$ $k$ $n-k$

Czy ktoś może zobaczyć jakiekolwiek naruszenia założeń lub inne szkodliwe aspekty tego podejścia?

— Mike Lawrence
źródło

2

Czy znasz jakieś opublikowane badania, które analizują względne zalety stosowania skal Likerta jako przedziałów względem danych porządkowych? Być może wady traktowania ich jako skal poziomów przedziałowych nie są wystarczająco poważne, aby uzasadnić złożone podejście. Jeśli tak jest, twoje podejście może być po prostu dziką gęś.

16

Nie znam żadnych artykułów związanych z twoim pytaniem w literaturze psychometrycznej. Wydaje mi się, że uporządkowane modele logistyczne uwzględniające komponenty efektów losowych całkiem dobrze poradzą sobie z tą sytuacją.

Zgadzam się z @Srikant i uważam, że proporcjonalny model szans lub uporządkowany model probit (w zależności od wybranej funkcji łącza) może lepiej odzwierciedlać wewnętrzne kodowanie elementów Likerta i ich typowe zastosowanie jako skale ocen w badaniach opinii / postaw lub kwestionariuszach .

Inne alternatywy to: (1) użycie kategorii sąsiadujących zamiast proporcjonalnych lub skumulowanych (w przypadku powiązania z modelami logarytmiczno-liniowymi); (2) zastosowanie modeli odpowiedzi na odpowiedź, takich jak model częściowego kredytu lub model skali ratingowej (jak wspomniano w mojej odpowiedzi dotyczącej analizy skal Likerta ). Ten ostatni przypadek jest porównywalny z podejściem mieszanym, z osobnikami traktowanymi jako efekty losowe, i jest łatwo dostępny w systemie SAS (np. Dopasowanie modeli mieszanych efektów dla powtarzających się wyników porządkowych z zastosowaniem procedury NLMIXED ) lub R (patrz tom. 20 z Urzędowym oprogramowania statystycznego ). Może Cię również zainteresować dyskusja prowadzona przez Johna Linacre na temat optymalizacji skuteczności kategorii skali ocen .

Przydatne mogą być również następujące dokumenty:

Wu, CH (2007). Badanie empiryczne dotyczące transformacji danych w skali Likerta na wyniki liczbowe . Applied Mathematical Sciences , 1 (58) : 2851–2862.
Rost, J i Luo, G (1997). Zastosowanie modelu rozkładania opartego na Rasch do kwestionariusza dotyczącego centralizmu młodzieży . W Rost, J i Langeheine, R (red.), Zastosowanie cechy utajonej i modeli klasy utajonej w naukach społecznych , Nowy Jork: Waxmann.
Lubke, G i Muthen, B (2004). Analiza czynnikowa danych w skali Likerta przy założeniu wielowymiarowej normalności komplikuje sensowne porównanie obserwowanych grup lub klas utajonych . Modelowanie równań strukturalnych , 11 : 514-534.
Nering, ML i Ostini, R (2010). Handbook of Polytomous Item Response Theory Models . Routledge Academic
Bender R i Grouven U (1998). Wykorzystanie binarnych modeli regresji logistycznej dla danych porządkowych o nieproporcjonalnych szansach. Journal of Clinical Epidemiology , 51 (10) : 809-816. (Nie można znaleźć pliku pdf, ale ten jest dostępny, Regresja logistyczna porządkowa w badaniach medycznych )

— chl
źródło

1

Mieszane efekty porządkowa regresja logistyczna jest również dostępna w R z pakietem porządkowym i clmm ().

— John

9

Jeśli naprawdę chcesz zrezygnować z założenia danych na poziomie przedziałów dla skal Likerta, sugerowałbym, aby przyjąć, że dane są uporządkowanym logitem lub probitem. Skale Likerta zwykle mierzą siłę odpowiedzi, a zatem wyższe wartości powinny wskazywać silniejszą odpowiedź na podstawowy przedmiot zainteresowania.

Załóżmy, że masz skalę przedmiotu a reprezentuje nieobserwowaną siłę odpowiedzi na przedmiot zainteresowania. Następnie możesz założyć następujący model odpowiedzi: $H$ $S$

$y = 1$ jeśli $S \le \alpha_1$

$y = h\$ if dla $\alpha_{h-1} < S\ \le \alpha_h$ $h = 2, 3, ..H-1$

$y = H\$ if $\alpha_{H-1} < S <\ \infty$

Zakładając, że ma rozkład normalny z nieznaną średnią i wariancją, dałby uporządkowany model probitowy. $S$

2

Jednym z problemów jest to, że stosując to podejście narzucasz określony związek między średnią a wariancją odpowiedzi. W tego typu ankietach często stosuje się skale Likerta - np. Wybierasz jedną z pięciu kategorii spośród „zdecydowanie zgadzam się” na „zdecydowanie się nie zgadzam” w odniesieniu do niektórych stwierdzeń lub innych - wydaje mi się to niewłaściwe. Na przykład oczekiwałbym, że dziesięciopunktowa skala da mniej więcej taki sam rozkład odpowiedzi jak pięciopunktowa skala, jeśli sąsiednie pary kategorii: dla odpowiedzi wspólnej $np$ $np(1-p)$ $y$ $p$

\underset{n = 4}{Pr} (Y = y) \neq \underset{n = 9}{Pr} (Y = 2 y) + \underset{n = 9}{Pr} (Y = 2 y + 1)

$\Pr_{n=4}(Y=y)\neq\Pr_{n=9}(Y=2y)+\Pr_{n=9}(Y=2y+1)$ Przypominam niektóre badania, które wydają się to potwierdzać: Coelho i Esteves (2006), „Wybór między pięciopunktową a dziesięciopunktową skalą w ramach pomiaru satysfakcji klienta”.

— Scortchi - Przywróć Monikę
źródło

1

Możesz użyć dwumianowego przybliżenia w 5-punktowej skali Likerta, jeśli połączysz zgodzić się i zdecydowanie zgodzić się w jednej grupie, a nie zgadzam się i zdecydowanie nie zgadzam się w innej. Oczywiście nadal musisz zdecydować, gdzie idą neutralne. Umieściłbym neutralne w dowolnej grupie, użyłem normalnego przybliżenia dwumianowego (pod warunkiem, że masz więcej niż 40 odpowiedzi) i opracowałem przedziały ufności dla proporcji każdej grupy (zobacz dowolny standardowy tekst statystyczny, jak uzyskać konf. odstępy w proporcjach pochodzących z rozkładu dwumianowego z normalnym przybliżeniem). Następnie umieściłbym neutralne w drugiej grupie i powtórzyłem przedziały ufności. Jeśli wyciągnę ten sam wniosek z obu, to istnieje potencjalny wniosek. W przeciwnym razie nie widzę, jak dwumianowy może być używany z danymi Likerta.

— użytkownik35193
źródło

0

Jeśli dobrze zrozumiałem, ten artykuł sugeruje bardzo podobne podejście do tego, co opisałeś, sugerując, że tak, w rzeczywistości dane podobne do Likerta mogą powstać z procesu dwumianowego.

Pełny odnośnik: Allik, J. (2014). Model mieszany dwumianowy dla miar osobowości typu Likerta. Frontiers in Psychology , (5) 371

— Kasia
źródło

Witamy na stronie! Czy możesz dodać pełne odniesienie do tego artykułu? Jest to standardowa praktyka tutaj, ponieważ linki zwykle giną.

— mkt - Przywróć Monikę

-1

Właściwie przygotowuję artykuł, w którym wykorzystuję twoje podejście do traktowania odpowiedzi na podobny element, tak jakby to była jawna agregacja ukrytej serii prób dwumianowych.

W moim artykule rozkład dwumianowy jest używany w celu wyjaśnienia kształtu obserwowanych rozkładów częstotliwości. Uzasadnieniem takiego podejścia są dwa założenia. W wielu apletach pokazujących, jak powstaje rozkład dwumianowy, powtarzano niezależne próby Bernoulliego przez pojedynczą kulkę wpadającą przez szereg szpilek. Za każdym razem, gdy piłka spada na sworzeń, odbija się w prawo (tj. Sukces) z prawdopodobieństwem p lub w lewo (tj. Błąd) z prawdopodobieństwem 1-p. Po tym, jak piłka wpadnie przez tablicę, wyląduje w koszu oznaczonym odpowiednią liczbą sukcesów. W mojej pracy proces podejmowania decyzji jest również postrzegany jako seria powtarzanych niezależnych prób Bernoulliego, w których na każdej próbie podmiot decyduje się zgodzić lub nie zgodzić się z danym stwierdzeniem.

(i) Na każdej niezależnej próbie Bernoulliego badany podejmuje decyzję o zgodzie z prawdopodobieństwem p lub nie (nie zgadza się) z prawdopodobieństwem 1-p.

(ii) Jeśli w oświadczeniu dostępnych jest pięć kategorii odpowiedzi, liczba podejmowanych decyzji Bernoulliego dotyczących decyzji o wyrażeniu zgody lub braku zgody (nie zgadzać się) jest równa 4 (5-1).

Ostatecznego wyboru konkretnej kategorii odpowiedzi udzielają następujące zasady.

Jeżeli we wszystkich (czterech) przypadkach zostanie podjęta decyzja Bernoulliego o wyrażeniu zgody, wówczas zostanie udzielona odpowiedź „zdecydowanie się zgadzam”.
Jeżeli w trzech przypadkach zostanie podjęta decyzja o zgodzie Bernoulliego, wówczas zostanie udzielona odpowiedź „zgodzić się”.
Jeżeli w dwóch przypadkach zostanie podjęta decyzja o zgodzie Bernoulliego, zostanie udzielona odpowiedź „niezdecydowana”.
Jeżeli tylko w jednym przypadku zostanie podjęta decyzja Bernoulliego, zostanie udzielona odpowiedź „nie zgadzam się”.
Jeżeli w żadnym przypadku nie zostanie podjęta decyzja Bernoulliego o udzieleniu zgody, zostanie udzielona odpowiedź „zdecydowanie nie zgadzam się”.

Podobne uzasadnienie można podać przy użyciu decyzji „nie zgadzam się”. Aby uzyskać rozkład dwumianowy, punktacja kategorii odpowiedzi jest następująca.

zdecydowanie się nie zgadzam = 0, nie zgadzam się = 1, neutralnie = 2, zgadzam się = 3, zdecydowanie się zgadzam = 4

Te dwa założenia prowadzą do dwumianowego rozkładu częstotliwości odpowiedzi, pod warunkiem, że nie ma systematycznych różnic między respondentami.

Mam nadzieję, że się zgodzisz. Byłbym bardzo wdzięczny, gdybyś mógł poprawić mój angielski w powyższym tekście.

— Ad van der Ven
źródło

Usunąłem twoją starszą odpowiedź. Proszę zauważyć, że mój komentarz nie był zamierzone jako uwaga negatywna; odpowiedzi w jednym wierszu nie są na ogół bardzo pouczające i należy preferować dyskusyjne odpowiedzi (ale zobacz nasze FAQ ).

— chl

1

To ciekawa i kreatywna propozycja, ale jestem sceptyczny. Zarówno w twojej wersji, jak i w reginalnej regresji logistycznej, jak sugerują np. Inni w tym wątku, będzie wymagało proporcjonalnego zakładania szans. Jednak OLR pozwoli progom / punktom odcięcia b / t kategoriom zmieniać się bardziej elastycznie, jak sądzę, podczas gdy będą one określone przez dwumianowe parametry & w twoim schemacie. To założenie musiałoby zostać zweryfikowane na podstawie danych i podejrzewam, że doprowadziłoby to do problemów. (BTW, -1 nie pochodzi ode mnie).

p

$p$

n

$n$

— gung - Przywróć Monikę