Tak, możesz. Przynajmniej w przybliżeniu.
Przedstawiam poniżej (i rzeczywiście istnieje związek z „nakładaniem się pudełka”, jak sugerujesz) wraz z pewnymi zastrzeżeniami i ograniczeniami. Ale najpierw omówmy kilka wstępnych przygotowań do kontekstu i kontekstu. (Myślę, że odpowiednia odpowiedź tutaj nie powinna koncentrować się na szczegółach tego przykładu - choć może to zasługuje na wzmiankę na marginesie - ale na zasadniczej kwestii użycia wykresów pudełkowych do oceny, czy widoczne różnice można łatwo wytłumaczyć jako zmienność losową, czy nie .)
Jeśli masz dostęp do danych, możesz narysować wycięte wykresy pudełkowe, które są przeznaczone do tego rodzaju porównania wizualnego.
Omówiono tutaj obliczenia wykresów z karbem . Jeśli odstępy między wycięciami nie pokrywają się, dwie porównywane grupy są w przybliżeniu różne na poziomie 5%; obliczenia są oparte na obliczeniach normalnych, ale są dość solidne i działają dość dobrze w różnych zakresach dystrybucji. (Jeśli jest to traktowane jako formalny test, moc nie jest tak wysoka w normalnych warunkach, ale powinna dobrze sobie radzić w różnych mniej lub bardziej „typowych” ciężkich przypadkach).
Biorąc pod uwagę sposób, w jaki działają wycięte wykresy pudełkowe, możesz rozpoznać szybką, praktyczną regułę, która zadziała, gdy będziesz mieć tylko ekran taki jak w pytaniu. Gdy wielkość próbki wynosi 10, a mediana jest umieszczona blisko środka pudełka, wycięcia na wykresie z karbem mają mniej więcej szerokość pudełka, więc końce wycięć i pudełko znajdują się mniej więcej w tym samym miejscu.
n=10
n=10
n=9n=10
n=10n=10,10n=9,9n=8,8
nn−−√n=40
Patrząc na swoją działkę:
Zauważ, że po pojawieniu się wykresu możemy stwierdzić, że wielkość próbki musi wynosić co najmniej 5; jeśli byłyby mniejsze niż 5, wykresy pudełkowe dla pojedynczej próbki miałyby wyraźne wskazówki, że pochodziły z mniejszej wielkości próbki (takie jak mediany będące martwym środkiem każdego pudełka lub wąsy o długości 0, gdy występowała wartość odstająca).
Alternatywnie, jeśli pola (oznaczające kwartyle) nie nakładają się na siebie, a wielkość próby wynosi co najmniej 10, wówczas dwie porównywane grupy powinny mieć różne mediany na poziomie 5% (traktowane jako porównanie pojedynczej pary).
nn=5
[Uwaga: nie bierze to pod uwagę liczby porównań, więc jeśli wykonujesz wiele porównań, ogólny błąd typu I będzie większy. Jest przeznaczony raczej do kontroli wizualnej niż do testów formalnych; niemniej jednak zaangażowane pomysły można dostosować do bardziej formalnego podejścia, w tym dostosowania do wielokrotnych porównań.]
Po skierowana czy możliwe byłoby rozsądne, aby rozważyć, czy powinien . Może nie; kwestia potencjalnego hakowania p jest prawdziwa, ale jeśli używasz tego, aby dowiedzieć się, na przykład, czy chcesz kontynuować gromadzenie nowych danych na temat badań, a wszystko, co masz, to fabuła w gazecie - powiedzmy - może być całkiem użyteczne, aby móc dokonać oceny, czy jest tam więcej, niż można łatwo wytłumaczyć zmiennością spowodowaną hałasem. Ale dogłębne rozważenie tego problemu naprawdę byłoby odpowiedzią na inne pytanie.