Wyświetlanie danych porządkowych - środki, mediany i średnie stopnie


11

Mam pewne dane porządkowe, które zwykle nie są dystrybuowane, więc postanowiłem przeprowadzić testy nieparametryczne przy użyciu testu U Manna-Whitneya. Patrzę na różnice między grupami dla siedmiu wyników - te wyniki to 0, 1, 2 lub 3 dla każdego przedmiotu. Trudno mi znaleźć sposób na wyświetlenie moich danych!

Jeśli przedstawię dane przy użyciu median (i IQR median), wcale nie jest jasne, gdzie są różnice, ponieważ w większości mediany spadają na 0 lub 1. Tak więc pomimo testu U Manna-Whitneya wykazującego znaczne różnice, stół wygląda po prostu nieciekawie.

Mógłbym również przedstawić dane za pomocą środków . Istnieje kilka prac naukowych, które mówią, że można używać środków z danymi porządkowymi, ale że nie można przyjmować tego samego rodzaju założeń dotyczących różnic między wynikami (np. Różnica między 0 a 1 nie jest taka sama jak między 1 a 2). Używanie środków byłoby nieco kontrowersyjne, chociaż liczby w tabeli dobrze opowiadają historię, gdy ich używam.

Trzecią opcją jest użycie średnich rang, które SPSS podaje mi w danych wyjściowych Manna-Whitneya. Średnie stopnie są porównywane między grupami, więc może powinienem po prostu ich użyć? Jedyny problem, jaki mam z tym, to to, że średnie stopnie tak naprawdę nic nie znaczą w odniesieniu do rzeczywistych danych (np. Nie widzę, że badani są bliżej 3, podczas gdy kontrole są bliższe 1 przy użyciu średnich stopni).

Ostatnią opcją było przeprowadzenie analizy chi-kwadrat porównującej badanych i kontrole po podzieleniu wyników na dwie grupy (0 i 1 dla niskich i 2 i 3 dla wysokich). Jednak kiedy to zrobiłem, różnice nie były tak wyraźne (prawdopodobnie z wielu powodów).


Czy zastanawiasz się, jak najlepiej przedstawić swoje dane w tekście, w tabeli lub na rysunku?
Gung - Przywróć Monikę

Zarówno tekst, jak i tabela. W tekście powiem, że istniały znaczące różnice między grupami w kilku elementach mojej ankiety dotyczącej snu. Różnice te wynikają z testu Manna-Whitneya, więc porównują średnie stopnie. Nie wiem, jak powinienem przedstawić te różnice w tabeli. Korzystanie z median nie działa, ponieważ są one zbyt podobne i nie widać różnic. Środki działają lepiej, ale dziwne wydaje się stosowanie miar parametrycznych w tabeli, która powinna dotyczyć median nieparametrycznych. I średnie szeregi by działały, ale nie reprezentują rzeczywistych wartości.
Eric

1
Zastanawiam się, czy niektóre odpowiedzi z wykresu dotyczące zależności między dwiema zmiennymi porządkowymi można dostosować do twoich celów? Przykładowe wykresy pokazują związek między dwiema zmiennymi, z których każda ma pięć poziomów, ale jeśli np. Porównujesz dwie grupy i masz cztery możliwe poziomy, możesz ponownie wyobrazić sobie niektóre z tych wizualizacji jako 4 na 2 zamiast 5 na 2 5, być może.
Silverfish

Pomocne może być opublikowanie niektórych (prawdopodobnie całkowicie fałszywych) przykładowych danych, aby ludzie, którzy chcą wykazać się możliwą techniką, mieli z czym pracować.
Silverfish

1
Eric, z definicji test nieparametryczny, w szczególności Mann-Whitney, porównuje (dla dominacji) dwa rozkłady ogólnie, nie porównuje konkretnej wartości parametru rozkładu, takiego jak średnia lub mediana. Nie ma jednej liczby, która byłaby charakterystyczna dla rozkładu, a jednocześnie jest tym, co jest porównywane, w tym przypadku. Możesz użyć estymatora 2-próbkowego Hodgesa-Lehmanna, ale jest to cecha charakterystyczna różnicy między dwoma rozkładami, a nie każdej z dwóch rozkładów.
ttnphns

Odpowiedzi:


8

1,2),=3)

Prawidłowość użycia średniej do podsumowania zmiennych porządkowych rzadko może wynikać z samych danych. To jest subiektywne.

rexyγxy


1
Cześć Frank, dziękuję za twoją przemyślaną odpowiedź. Jeśli nie masz nic przeciwko, mam kilka dalszych pytań. Jeśli chodzi o środki - uważam, że kategorie są co najmniej w połowie znaczące, ponieważ zasadniczo odnoszą się one odpowiednio do „nie, łagodnego, umiarkowanego i poważnego upośledzenia”. Czy znasz jakieś odniesienia, których mógłbym użyć jako precedensu? Waham się również używać środków tylko w jednym stole, a median w innych dla zachowania spójności. ORAZ dla średnich rang - wydaje mi się, że porównuję grupy - badanych vs. kontroli na 7 punktach. Czy porównywanie średnich rang jest dopuszczalne / przydatne?
Eric

W przypadku liczbowych danych porządkowych z kilkoma poziomami, takich jak liczby i być może twój przykład upośledzenia, średnie są przydatne, a mediany nie (z powodu zbyt wielu powiązań). Istnieje wiele przypadków, w których użyłem środków dla danych porządkowych i median dla ciągłych przekrzywionych, w tej samej tabeli.
Frank Harrell,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.