Zasadniczo błąd standardowy mówi, jak bardzo jesteś niepewny, czy prawdziwa wartość górnej części słupka jest tam, gdzie pasek ją podaje. Gdy występuje wiele słupków, może także umożliwiać porównania między słupkami w sensie testu statystycznego. Jednak interpretacja ich w ten sposób wymaga pewnych założeń, pokazanych graficznie poniżej. Jeśli naprawdę chcesz porównać słupki, aby zobaczyć, czy różnice są istotne statystycznie, powinieneś uruchomić testy danych i wyświetlić, które testy były znaczące, w ten sposób.
Ponadto sugerowałbym stosowanie przedziałów ufności zamiast standardowych błędów.
Ten artykuł jest wart przeczytania:
Cumming and Finch. „Wnioskowanie przez oko: przedziały ufności i sposób odczytywania zdjęć danych”. Am Psych. Vol. 60, nr 2, 170–180.
Ich ogólny wniosek jest następujący: „Szukaj słupków, które odnoszą się bezpośrednio do efektów zainteresowania, bądź wrażliwy na eksperymentalny projekt i interpretuj interwały”.
W przypadku niezależnych próbek przy użyciu przedziałów ufności połowa nakładania się CI oznacza, że różnica jest istotna statystycznie.
W przypadku niezależnych próbek wykorzystujących zamiast tego standardowe słupki błędów poniższy wykres pokazuje, jak obliczyć istotność statystyczną: