To pytanie dotyczy sedna statystyk i tego, jak przeprowadzić dobrą analizę statystyczną. Porusza wiele zagadnień, niektóre terminologiczne i inne teoretyczne. Aby je wyjaśnić, zacznijmy od zwrócenia uwagi na ukryty kontekst pytania i przejdźmy dalej do zdefiniowania kluczowych terminów „parametr”, „właściwość” i „estymator”. Odpowiedzi na kilka części pytania pojawiają się w trakcie dyskusji. Ostatnia sekcja podsumowująca podsumowuje kluczowe pomysły.
Przestrzenie państwowe
Popularnym statystycznym zastosowaniem „rozkładu”, jak w „rozkładzie normalnym z PDF proporcjonalnym do ” jest w rzeczywistości (poważne) nadużycie angielskiego, ponieważ oczywiście nie jest to jedna dystrybucja: jest to cała rodzina dystrybucji sparametryzowanych za pomocą symboli i . Standardowym zapisem tego jest „przestrzeń stanu” , zbiórμσΩΩexp(−12(x−μ)/σ)2)dxμσΩdystrybucji. (Trochę upraszczam tutaj dla celów ekspozycyjnych i będę się upraszczał w miarę postępów, pozostając tak rygorystycznym, jak to tylko możliwe). Jego rolą jest wyznaczenie możliwych celów naszych procedur statystycznych: kiedy coś oszacujemy, jesteśmy wybranie jednego (lub czasem więcej) elementów .Ω
Czasami spacje stanu są jawnie sparametryzowane, jak w . W tym opisie istnieje zgodność jeden-do-jednego między zbiorem krotek w górnej połowie płaszczyzny i zbiorem rozkładów, których będziemy używać do modelowania naszych danych. Jedną z wartości takiej parametryzacji jest to, że możemy teraz konkretnie odnosić się do rozkładów w za pomocą uporządkowanej pary liczb rzeczywistych.{ ( μ , σ ) } ΩΩ={N(μ,σ2)|μ∈R,σ>0}{(μ,σ)}Ω
W innych przypadkach przestrzenie stanów nie są jawnie sparametryzowane. Przykładem może być zbiór wszystkich unimodalnych ciągłych rozkładów. Poniżej zajmiemy się pytaniem, czy w takich przypadkach można znaleźć odpowiednią parametryzację.
Parametryzacje
Ogólnie, parametryzacja z jest korespondencji (matematyczna funkcja ) z podzbioru (z skończoności) do . Oznacza to, że używa uporządkowanych zestawów -plejek do oznaczania dystrybucji. Ale to nie tylko korespondencja: musi być „dobrze wychowana”. Aby to zrozumieć, należy rozważyć zestaw wszystkich ciągłych dystrybucji, których pliki PDF mają skończone oczekiwania. Byłoby to powszechnie uważane za „nieparametryczne” w tym sensie, że każda „naturalna” próba parametryzacji tego zestawu pociągałaby za sobą policzalną sekwencję liczb rzeczywistych (z wykorzystaniem rozszerzenia dowolnej podstawy ortogonalnej). Niemniej jednak, ponieważ ten zestaw ma licznośćR d d Ω d ℵ 1 RΩRddΩdℵ1 , która jest reali, musi istnieć pewna korespondencja jeden do jednego między tymi dystrybucjami a . Paradoksalnie wydaje się, że czyni to sparametryzowaną przestrzeń stanów z jednym rzeczywistym parametrem!R
Paradoks rozwiązuje się, zauważając, że pojedyncza liczba rzeczywista nie może cieszyć się „ładną” relacją z rozkładami: kiedy zmieniamy wartość tej liczby, rozkład, którym ona odpowiada, musi w niektórych przypadkach zmieniać się radykalnie. Wykluczamy takie „patologiczne” parametryzacje, wymagając, aby rozkłady odpowiadające bliskim wartościom ich parametrów były same w sobie „bliskie”. Omówienie odpowiednich definicji „bliskich” zabrałoby nas za daleko, ale mam nadzieję, że ten opis wystarczy, aby wykazać, że parametr jest czymś więcej niż tylko nazywanie określonego rozkładu.
Właściwości rozkładów
Poprzez wielokrotne stosowanie przyzwyczajamy się do myślenia o „własności” rozkładu jako pewnej zrozumiałej ilości, która często pojawia się w naszej pracy, takiej jak oczekiwanie, wariancja i tak dalej. Problem z tą możliwą definicją „własności” polega na tym, że jest ona zbyt niejasna i niewystarczająco ogólna. (To właśnie tam matematyka była w połowie XVIII wieku, gdzie „funkcje” były uważane za skończone procesy stosowane do obiektów.) Zamiast tego, jedyną sensowną definicją „własności”, która zawsze zadziała, jest myślenie o własności jako jest liczbą, która jest jednoznacznie przypisana do każdej dystrybucji wΩ Ω Ω t 1 ΩΩ. Obejmuje to średnią, wariancję, dowolny moment, dowolną kombinację algebraiczną momentów, dowolne kwantyle i wiele innych, w tym rzeczy, których nawet nie da się obliczyć. Nie obejmuje jednak rzeczy, które nie miałyby sensu dla niektórych elementów . Na przykład, jeśli składa się ze wszystkich rozkładów Studenta t, to średnia nie jest prawidłową właściwością dla (ponieważ nie ma średniej). To robi na nas wrażenie, jak bardzo nasze pomysły zależą od tego, na czym tak naprawdę składa się .ΩΩΩt1Ω
Właściwości nie zawsze są parametrami
Właściwość może być tak skomplikowaną funkcją, że nie służyłaby jako parametr. Rozważ przypadek „rozkładu normalnego”. Możemy chcieć wiedzieć, czy rzeczywista średnia rozkładu, po zaokrągleniu do najbliższej liczby całkowitej, jest parzysta. To własność. Ale to nie będzie służyć jako parametr.
Parametry niekoniecznie są właściwościami
Gdy parametry i rozkłady są w relacji jeden do jednego, to oczywiście każdy parametr i dowolna funkcja parametrów w tym zakresie jest właściwością zgodnie z naszą definicją. Ale nie musi istnieć relacja jeden-do-jednego między parametrami a rozkładami: czasami kilka rozkładów musi być opisanych przez dwie lub więcej wyraźnie różnych wartości parametrów. Na przykład parametr lokalizacji dla punktów na kuli użyłby naturalnie szerokości i długości geograficznej. W porządku - z wyjątkiem dwóch biegunów, które odpowiadają danej szerokości geograficznej i dowolnej prawidłowej długości geograficznej. lokalizacja(punkt na kuli) rzeczywiście jest własnością, ale jej długość niekoniecznie jest własnością. Chociaż istnieją różne uniki (na przykład deklaruj długość geograficzną bieguna jako zero), to zagadnienie podkreśla ważną konceptualną różnicę między właściwością (która jest wyjątkowo związana z rozkładem) a parametrem (który jest sposobem znakowania dystrybucja i może nie być unikalna).
Procedury statystyczne
Cel oszacowania nazywany jest oszacowaniem . To tylko własność. Statystyk nie może swobodnie wybierać szacunków: jest to prowincja jej klienta. Gdy ktoś przyjdzie do ciebie z próbką populacji i poprosi cię o oszacowanie 99. percentyla populacji, prawdopodobnie nie podasz zamiast tego oszacowania średniej! Twoim zadaniem, jako statystykiem, jest określenie dobrej procedury szacowania oszacowania i otrzymanego przez ciebie. (Czasami Twoim zadaniem jest przekonanie klienta, że wybrał niewłaściwe oszacowanie do swoich celów naukowych, ale to inny problem ...)
Z definicji procedura jest sposobem na uzyskanie liczby z danych. Procedury są zwykle podawane jako formuły stosowane do danych, takie jak „dodaj je wszystkie i podziel według liczby”. Dosłownie każdą procedurę można określić jako „estymator” danego oszacowania. Na przykład mógłbym zadeklarować, że średnia próbki (wzór zastosowany do danych) szacuje wariancję populacji (właściwość populacji, zakładając , że nasz klient ograniczył zestaw możliwych populacji aby uwzględnić tylko te, które faktycznie mają wariancje) .Ω
Estymatory
Estymator nie musi mieć żadnego oczywistego związku z estymatorem. Na przykład, czy widzisz związek między średnią próby a wariancją populacji? Ja też nie. Ale mimo to średnia z próby jest w rzeczywistości przyzwoitym estymatorem wariancji populacji dla pewnychΩ (takich jak zbiór wszystkich rozkładów Poissona). Oto jeden klucz do zrozumienia estymatorów: ich cechy zależą od zestawu możliwych stanów . Ale to tylko część tego.Ω
Kompetentny statystyk będzie chciał wiedzieć, jak dobrze faktycznie wykona zalecaną przez siebie procedurę. Nazwijmy procedurę „ ” i niech estymat będzie . Nie wiedząc, która dystrybucja jest prawdziwa, rozważy wydajność procedury dla każdej możliwej dystrybucji . Biorąc pod uwagę takie , i biorąc pod uwagę ewentualnych wynikach (czyli zbiór danych), będzie ona porównać (co jej przewidywany wewnętrznego) do (wartość estimand do ). Obowiązkiem jej klienta jest poinformowanie jej, jak blisko są te dwie odległości.tθ F∈ΩFst(s)θ(F)F (Często odbywa się to za pomocą funkcji „straty”). Następnie może rozważyć oczekiwanie odległości między a . To ryzyko jej procedury. Ponieważ zależy od , ryzyko jest funkcją zdefiniowaną w .t(s)θ(F)FΩ
(Dobre) statystycy zalecają procedury oparte na porównaniu ryzyka. Załóżmy na przykład, że dla każdego ryzyko procedury jest mniejsze lub równe ryzyku . Zatem nie ma powodu, aby używać : jest to „niedopuszczalne”. W przeciwnym razie jest to „dopuszczalne”.F∈Ωt1tt
(Statystyk „bayesowski” zawsze porówna ryzyko, uśredniając rozkład „wcześniejszych” możliwych stanów (zwykle dostarczanych przez klienta). Statystyk „częsty” może to zrobić, jeśli taki uprzednio istnieje, ale jest również skłonny porównaj ryzyko na inne sposoby, których Bayesianie unikają.)
Wnioski
Mamy prawo powiedzieć, że każdy , który jest dopuszczalny dla jest Estymator z . tθθ Musimy, ze względów praktycznych (ponieważ trudno jest znaleźć dopuszczalne procedury), nagiąć to do stwierdzenia, że każde które ma akceptowalnie małe ryzyko (w porównaniu do ) wśród wykonalnych procedur jest estymatorem . tθθ „Dopuszczalne” i „wykonalne” są określane przez klienta, oczywiście: „akceptowalne” odnosi się do ich ryzyka, a „wykonalne” odzwierciedla koszt (ostatecznie przez nich zapłacony) wdrożenia procedury.
U podstaw tej definicji zwięzły są wszystkie pomysły właśnie omówione: aby zrozumieć, że należy mieć na uwadze specyficzny (który jest modelem problemu, procesu lub populacji badanej), określony estimand (dostarczonego przez klienta), konkretna funkcja straty (która ilościowo łączy z estymatą i jest również podawana przez klienta), idea ryzyka (obliczona przez statystykę), pewna procedura porównywania funkcji ryzyka (odpowiedzialność statystyki w porozumieniu z klientem) oraz poczucie, jakie procedury można faktycznie przeprowadzić (kwestia „praktyczności”), nawet jeśli żadna z nich nie jest wyraźnie wymieniona w definicji.Ωt