Błąd podczas zgłaszania z medianą i reprezentacjami graficznymi?

Użyłem szerokiej gamy testów dla danych mojej pracy magisterskiej, od parametrycznych ANOVA i testów t do nieparametrycznych testów Kruskala-Wallisa i Manna-Whitneysa, a także transformowanych rangą 2-drogowych ANOVA i GzLM z danymi binarnymi, dane Poissona i proporcjonalne. Teraz muszę wszystko zgłosić, pisząc to wszystko w moich wynikach.

Zapytałem już tutaj, jak zgłaszać asymetryczne przedziały ufności dla danych proporcjonalnych. Wiem, że odchylenie standardowe, błąd standardowy lub przedziały ufności są odpowiednie dla średnich, co zgłosiłbym, gdyby wszystkie moje testy były ładnie parametryczne. Czy jednak w przypadku moich testów nieparametrycznych powinienem zgłaszać mediany, a nie środki? Jeśli tak, jaki błąd z nim zgłosić?

Wiąże się to z tym, jak najlepiej prezentować graficznie wyniki nieparametrycznych testów. Ponieważ w dużej mierze mam dane ciągłe lub przedziałowe w ramach kategorii, generalnie używam wykresów słupkowych, przy czym górna część słupka jest średnią, a słupki błędów pokazują 95% CI. Czy do testów NP mogę nadal używać wykresów słupkowych, ale czy górna część paska reprezentuje medianę?

Dzięki za sugestie!

data-visualization median error

— Mog
źródło

Coś się nie liczy. Jak uzyskać środki, mediany lub elementy CI z danymi kategorycznymi?

— rolando2

Przepraszam, że nie było jasne @ rolando2 ... Mam kategorie, w których mam dane ciągłe lub przedziałowe (oryginalne pytanie zostało zredagowane, aby wyjaśnić teraz).

— Mog

Możesz zgłosić przedział ufności dla mediany. W R możesz użyć wilcox.testargumentu conf.int=TRUE. W prostych notatkach Johna Verzaniego znajduje się krótka dyskusja na ten temat : patrz tutaj .

Odnośnie wykresów: Naprawdę nie lubię używać wykresów słupkowych, nawet do reprezentowania zestawu środków. Wolę po prostu wykreślić małe segmenty linii dla CI: poprawione wykresy słupkowe

Działka na prawo zostało wykonane z errbar()od Hmisc pakietu [ strona CRAN ].

Możesz zrobić taki sam wykres dla median i powiązanych przedziałów ufności, lub możesz użyć wykresów pudełkowych (które w tej samej ilości miejsca opisują cały rozkład).

— Karl
źródło

Dzięki za wskazówki, Karl! Czy jest jakiś szczególny powód, dla którego nie lubisz barów, czy jest to osobiste preferencje?

— Mog

@Mog: Paski wydają się stratą atramentu / miejsca; zmuszają cię do włączenia 0 na osi y, co często nie jest konieczne; i uniemożliwiają pokazanie dolnych połówek przedziałów. Słupki mogą ulec pogorszeniu (np. Za darmo 3D). W przypadku małych zestawów danych wolę pokazywać rzeczywiste punkty danych.

— Karl