Warto jasno określić cel swojej działki. Zasadniczo istnieją dwa różne rodzaje celów: możesz sam stworzyć wykresy, aby ocenić przyjęte założenia i pokierować procesem analizy danych, lub możesz stworzyć wykresy, aby przekazać wyniki innym osobom. To nie to samo; na przykład wielu przeglądających / czytających twoją fabułę / analizę może być statystycznie niewyszukanych i może nie być zaznajomionych z ideą, powiedzmy, równej wariancji i jej roli w teście t. Chcesz, aby Twój dział przekazywał ważne informacje o twoich danych nawet takim konsumentom jak oni. Ufają domyślnie, że zrobiłeś wszystko poprawnie. Z twojego zestawu pytań wynika, że masz na myśli ten drugi typ.
Realistycznie najczęstszym i akceptowanym wykresem do przekazywania wyników testu t 1 innym osobom (odłożonym na bok, czy jest to najbardziej odpowiednie) jest wykres słupkowy średnich ze standardowymi słupkami błędów. To bardzo dobrze pasuje do testu t, ponieważ test t porównuje dwa sposoby przy użyciu ich standardowych błędów. Gdy masz dwie niezależne grupy, uzyskasz intuicyjny obraz, nawet dla statystycznie nieskomplikowanych, a (chętni do danych) ludzie „natychmiast zobaczą, że prawdopodobnie pochodzą z dwóch różnych populacji”. Oto prosty przykład z wykorzystaniem danych @ Tima:
nonsmokers <- c(18,22,21,17,20,17,23,20,22,21)
smokers <- c(16,20,14,21,20,18,13,15,17,21)
m = c(mean(nonsmokers), mean(smokers))
names(m) = c("nonsmokers", "smokers")
se = c(sd(nonsmokers)/sqrt(length(nonsmokers)),
sd(smokers)/sqrt(length(smokers)))
windows()
bp = barplot(m, ylim=c(16, 21), xpd=FALSE)
box()
arrows(x0=bp, y0=m-se, y1=m+se, code=3, angle=90)
To powiedziawszy, specjaliści od wizualizacji danych zwykle nie znoszą tych wykresów. Często są wyśmiewani jako „wykresy dynamitu” (por. Dlaczego wykresy dynamitu są złe ). W szczególności, jeśli masz tylko kilka danych, często zaleca się po prostu ich pokazanie . Jeśli punkty nachodzą na siebie, możesz je drżeć w poziomie (dodać niewielką ilość losowego hałasu), aby nie zachodziły już na siebie. Ponieważ test t zasadniczo dotyczy średnich i błędów standardowych, najlepiej nałożyć wykres średnich i błędów standardowych na taki wykres. Oto inna wersja:
set.seed(4643)
plot(jitter(rep(c(0,1), each=10)), c(nonsmokers, smokers), axes=FALSE,
xlim=c(-.5, 1.5), xlab="", ylab="")
box()
axis(side=1, at=0:1, labels=c("nonsmokers", "smokers"))
axis(side=2, at=seq(14,22,2))
points(c(0,1), m, pch=15, col="red")
arrows(x0=c(0,1), y0=m-se, y1=m+se, code=3, angle=90, length=.15)
Jeśli masz dużo danych, wykresy pudełkowe mogą być lepszym wyborem, aby uzyskać szybki przegląd dystrybucji, i możesz tam również nałożyć środki i SE.
data(randu)
x1 = qnorm(randu[,1])
x2 = qnorm(randu[,2])
m = c(mean(x1), mean(x2))
se = c(sd(x1)/sqrt(length(x1)), sd(x2)/sqrt(length(x2)))
boxplot(x1, x2)
points(c(1,2), m, pch=15, col="red")
arrows(x0=1:2, y0=m-(1.96*se), y1=m+(1.96*se), code=3, angle=90, length=.1)
# note that I plotted 95% CIs so that they will be easier to see
Proste wykresy danych i wykresy pudełkowe są wystarczająco proste, aby większość ludzi mogła je zrozumieć, nawet jeśli nie są zbyt bystre statystycznie. Pamiętaj jednak, że żaden z nich nie ułatwia oceny ważności testu t do porównania twoich grup. Celom tym najlepiej służą różne rodzaje fabuł.
1. Należy zauważyć, że ta dyskusja zakłada niezależny test t dla próbek. Te wykresy mogą być stosowane z testem t próbek zależnych, ale mogą być również mylące w tym kontekście (por. Czy stosowanie słupków błędów dla średnich w badaniu wewnątrz badanych jest nieprawidłowe? ).