Interesuje mnie definicja kwartylu, która jest zwykle używana, gdy jesteś w podstawowych statystykach. Mam książkę typu Stat 101, która daje intuicyjną definicję. „Około jedna czwarta danych przypada na pierwszy kwartyl lub poniżej ...”, ale daje przykład, w którym oblicza Q1, Q2 i Q3 dla zestawu danych
5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37
Ponieważ jest 15 danych, wybiera 15 jako medianę Q2. Następnie dzieli pozostałe dane na dwie połowy, od 5 do 14 i od 16 do 37. Każda z nich zawiera 7 części danych i znajduje medianę każdego z tych zbiorów, odpowiednio 10 i 18, odpowiednio jako Q1 i Q3. Tak bym to sam obliczył.
Przejrzałem artykuł Wikipedii, który podaje 2 metody. Jeden zgadza się z powyższym, a drugi mówi, że możesz również zawrzeć medianę 15 w obu zestawach (ale nie uwzględniłbyś mediany, gdyby była to średnia z dwóch środkowych liczb w przypadku parzystej liczby punktów danych). To wszystko ma dla mnie sens.
Ale potem sprawdziłem Excela, aby zobaczyć, jak Excel go oblicza. Korzystam z programu Excel 2010, który ma 3 różne funkcje. Kwartyl był dostępny w 2007 roku i poprzednich wersjach. Wygląda na to, że chcą, abyś przestał używać tego w 2010 roku, ale nadal jest dostępny. Kwartyl.Inc jest nowy, ale o ile wiem, zgadza się dokładnie z Kwartylem. I jest też Kwartyl. Exc. Wydaje mi się, że oba ostatnie 2 są nowe w 2010 roku. Tym razem po prostu spróbowałem użyć liczb całkowitych 1, 2, 3, ..., 10. Oczekuję, że Excel poda medianę 5,5, Q1 3 i Q3 8. Metoda z księgi statystycznej również ponieważ obie metody na Wikipedii dałyby te odpowiedzi, ponieważ mediana jest średnią z dwóch środkowych liczb. Excel daje
quartile number, Quartile.Inc, Quartile.Exc
1, 3.25, 2.75
2, 5.5, 5.5
3, 7.75, 8.25
Żadne z nich nie zgadza się z tym, o czym wcześniej mówiłem.
Opisy w pliku pomocy dla programu Excel to:
Quartile.Inc - Zwraca kwartyl zestawu danych na podstawie wartości percentyla od 0..1 włącznie.
Quartile.Exc - Zwraca kwartyl zestawu danych na podstawie wartości percentyli od 0..1, wyłączne.
Czy ktoś może mi pomóc zrozumieć tę definicję, z której korzysta Excel?