Co to jest odchylenie standardowe, jak jest obliczane i jakie jest jego zastosowanie w statystyce?
Co to jest odchylenie standardowe, jak jest obliczane i jakie jest jego zastosowanie w statystyce?
Odpowiedzi:
Odchylenie standardowe to liczba reprezentująca „rozproszenie” lub „rozproszenie” zestawu danych. Istnieją inne miary rozprzestrzeniania się, takie jak zasięg i wariancja.
Oto kilka przykładowych zestawów danych i ich standardowe odchylenia:
[1,1,1] standard deviation = 0 (there's no spread)
[-1,1,3] standard deviation = 1.6 (some spread)
[-99,1,101] standard deviation = 82 (big spead)
Powyższe zestawy danych mają tę samą średnią.
Odchylenie oznacza „odległość od średniej”.
„Standard” oznacza tutaj „znormalizowany”, co oznacza, że odchylenie standardowe i średnia są w tych samych jednostkach, w przeciwieństwie do wariancji.
Na przykład, jeśli średnia wysokość wynosi 2 metry , odchylenie standardowe może wynosić 0,3 metra , podczas gdy wariancja wyniesie 0,09 metra kwadratowego .
Dogodnie jest wiedzieć, że co najmniej 75% punktów danych zawsze mieści się w granicach 2 odchyleń standardowych średniej (lub około 95%, jeśli rozkład jest normalny).
Na przykład, jeśli średnia wynosi 100, a odchylenie standardowe wynosi 15, to co najmniej 75% wartości wynosi między 70 a 130.
Jeśli rozkład jest normalny, 95% wartości mieści się w przedziale od 70 do 130.
Ogólnie rzecz biorąc, wyniki testu IQ są zwykle rozłożone i wynoszą średnio 100. Ktoś, kto jest „bardzo jasny”, jest o dwa odchylenia standardowe powyżej średniej, co oznacza wynik testu IQ wynoszący 130.
Cytat z Wikipedii .
Pokazuje, jak duże jest odchylenie od „średniej” (średniej lub oczekiwanej / zapisanej w budżecie wartości). Niskie odchylenie standardowe wskazuje, że punkty danych wydają się być bardzo zbliżone do średniej, natomiast wysokie odchylenie standardowe wskazuje, że dane są rozłożone w szerokim zakresie wartości.
Opisując zmienną, zwykle podsumowujemy ją za pomocą dwóch miar: miary środka i miary rozproszenia. Typowe miary środka obejmują średnią, medianę i tryb. Częstą miarą spreadu jest wariancja i zakres międzykwartylowy.
Wariancja (reprezentowana przez grecką małą sigmę podniesioną do potęgi drugiej) jest powszechnie stosowana, gdy podaje się średnią. Wariancja jest średnim kwadratowym odchyleniem zmiennej. Odchylenie oblicza się, odejmując średnią z każdej obserwacji. Jest to podniesione do kwadratu, ponieważ w przeciwnym razie suma byłaby równa zero, a podniesienie do kwadratu usuwa ten problem, zachowując względny rozmiar odchyleń. Problem z użyciem wariancji jako miary rozpiętości polega na tym, że jest ona wyrażona w jednostkach kwadratowych. Na przykład, jeśli naszą zmienną będącą przedmiotem zainteresowania była wysokość mierzona w calach, wówczas wariancja byłaby zgłaszana w calach kwadratowych, co nie ma większego sensu. Odchylenie standardowe (reprezentowane przez grecką małą sigmę) jest pierwiastkiem kwadratowym wariancji i zwraca miarę spreadu do oryginalnych jednostek.
Używając odchylenia standardowego, należy uważać na wartości odstające, ponieważ wypaczą one odchylenie standardowe (i średnią), ponieważ nie są odpornymi miarami rozprzestrzeniania się. Prosty przykład zilustruje tę właściwość. Średnia z moich strasznych wyników po uderzeniu krykieta 13, 14, 16, 23, 26, 28, 33, 39 i 61 wynosi 28,11. Jeśli uznamy 61 za wartość odstającą i usuniemy ją, średnia wyniesie 24.
Oto jak odpowiedziałbym na to pytanie za pomocą diagramu.
Załóżmy, że ważymy 30 kotów i obliczamy średnią wagę. Następnie tworzymy wykres rozproszenia z ciężarem na osi y i tożsamością kota na osi x. Średnią masę można narysować jako linię poziomą. Następnie możemy narysować pionowe linie, które łączą każdy punkt danych z linią średnią - są to odchylenia każdego punktu danych od średniej i nazywamy je resztkami. Teraz te resztki mogą być przydatne, ponieważ mogą nam powiedzieć coś o rozprzestrzenianiu się danych: jeśli jest wiele dużych reszt, to koty bardzo różnią się masą. I odwrotnie, jeśli pozostałości są głównie małe, wówczas koty są dość blisko skupione wokół średniej masy. Więc jeśli moglibyśmy mieć jakieś dane, które mówią nam średniądługości reszty w tym zbiorze danych, byłby to przydatny sposób na określenie, jak duży jest rozpiętość w danych. Odchylenie standardowe jest w rzeczywistości długością średniej resztkowej.
Kontynuowałbym to, podając obliczenia dla sd, wyjaśniając, dlaczego obliczyć kwadrat, a następnie pierwiastek kwadratowy (lubię krótkie i słodkie wyjaśnienie Vaibhav'a). Następnie wspomniałbym o problemach wartości odstających, jak Graham w swoim ostatnim akapicie.
Jeśli wymagana jest informacja o rozkładzie średniej, przydatne jest odchylenie standardowe.
Suma różnicy między każdą wartością a średnią wynosi zero (oczywiście, ponieważ wartości są równomiernie rozłożone wokół średniej), dlatego każdą różnicę obliczamy kwadratowo, aby przekonwertować wartości ujemne na dodatnie, zsumować je w całej populacji i wziąć ich pierwiastek kwadratowy. Wartość tę dzieli się następnie przez liczbę próbek (lub wielkość populacji). Daje to standardowe odchylenie.
Odchylenie standardowe jest pierwiastkiem kwadratowym drugiego centralnego momentu rozkładu. Centralnym momentem jest oczekiwana różnica od oczekiwanej wartości rozkładu. Pierwszy moment centralny wynosiłby zwykle 0, więc definiujemy drugi moment centralny jako wartość oczekiwaną odległości kwadratowej zmiennej losowej od jej wartości oczekiwanej.
Aby umieścić go w skali bardziej zgodnej z pierwotnymi obserwacjami, bierzemy pierwiastek kwadratowy z tego drugiego centralnego momentu i nazywamy to odchyleniem standardowym.
Odchylenie standardowe jest własnością populacji. Mierzy, ile przeciętnej „dyspersji” ma ta populacja. Czy wszystkie zasłony są skupione wokół środka, czy też są szeroko rozpowszechnione?
Aby oszacować odchylenie standardowe populacji, często obliczamy odchylenie standardowe „próby” od tej populacji. W tym celu należy pobrać obserwacje z tej populacji, obliczyć średnią z tych obserwacji, a następnie obliczyć pierwiastek kwadratowy średniego odchylenia kwadratowego z tej „średniej próbki”.
Aby uzyskać obiektywny estymator wariancji, tak naprawdę nie obliczasz średniego kwadratowego odchylenia od średniej próbki, ale dzielisz przez (N-1), gdzie N jest liczbą obserwacji w próbie. Należy zauważyć, że to „próbne odchylenie standardowe” nie jest obiektywnym estymatorem odchylenia standardowego, ale kwadrat „próbki standardowego odchylenia” jest obiektywnym estymatorem wariancji populacji.
Najlepszym sposobem, w jaki zrozumiałem odchylenie standardowe, jest wymyślenie fryzjera! (Musisz zebrać dane z fryzjera i uśrednić jej szybkość strzyżenia, aby ten przykład zadziałał).
Obcinanie włosów przez osobę zajmuje fryzjerowi średnio 30 minut.
Załóżmy, że wykonujesz obliczenia (większość pakietów oprogramowania zrobi to za Ciebie) i okaże się, że standardowe odchylenie wynosi 5 minut. Oznacza to, co następuje:
Skąd to wiem? Musisz spojrzeć na krzywą normalną, gdzie 68% mieści się w granicach 1 odchylenia standardowego, a 96% mieści się w 2 odchyleniach standardowych średniej (w tym przypadku 30 minut). Więc dodajesz lub odejmujesz standardowe odchylenie od średniej.
Jeśli pożądana jest spójność, jak w tym przypadku, im mniejsze odchylenie standardowe, tym lepiej. W takim przypadku fryzjer spędza z każdym klientem maksymalnie około 40 minut. Musisz szybko obciąć włosy, aby prowadzić udany salon!