Jaki jest związek między estymatorem a oszacowaniem?
Jaki jest związek między estymatorem a oszacowaniem?
Odpowiedzi:
EL Lehmann, w swojej klasycznej teorii oszacowania punktu , odpowiada na to pytanie na s. 1-2.
Postuluje się, że obserwacje są wartościami przyjmowanymi przez zmienne losowe, które przyjmuje się, że podążają za wspólnym rozkładem prawdopodobieństwa, , należącym do jakiejś znanej klasy ...
... specjalizujemy się teraz w estymacji punktowej ... załóżmy, że jest funkcją o wartościach rzeczywistych zdefiniowaną [w określonej klasie rozkładów] i że chcielibyśmy poznać wartość [przy jakimkolwiek rzeczywistym rozkładzie w efekt, ]. Niestety , a zatem , jest nieznany. Dane te można jednak wykorzystać do uzyskania oszacowania , wartości, która, jak można się spodziewać, będzie zbliżona do .g θ θ g ( θ ) g ( θ ) g ( θ )
Innymi słowy: estymator to określona procedura matematyczna, która podaje liczbę ( szacunek ) dla każdego możliwego zestawu danych, które może wygenerować konkretny problem. Liczba ta ma reprezentować pewną określoną właściwość numeryczną ( ) procesu generowania danych; możemy to nazwać „szacunkiem”.
Sam estymator nie jest zmienną losową: jest to po prostu funkcja matematyczna. Jednak szacunki, które produkuje, oparte są na danych, które same są modelowane jako zmienne losowe. To sprawia, że oszacowanie (uważane za zależne od danych) staje się zmienną losową, a określone oszacowanie dla określonego zestawu danych staje się realizacją tej zmiennej losowej.
W jednym (konwencjonalnym) zwykłym sformułowaniu najmniejszych kwadratów dane składają się z uporządkowanych par . Wartości zostały określone przez eksperymentatora (mogą to być na przykład ilości podanego leku). Zakłada się, że każdy (na przykład odpowiedź na lek) pochodzi z rozkładu prawdopodobieństwa, który jest normalny, ale z nieznaną średnią i wspólną wariancją . Ponadto zakłada się, że środki są powiązane z za pomocą wzoru . Te trzy parametry - , ix i y i μ i σ 2 x i μ i = β 0 + β 1 x i σ β 0 β 1 y i x i ( σ , β 0 , β 1 ) β 0 β 1 cos ( σ + β 2 0 - β 1 ) x- określ podstawowy rozkład dla dowolnej wartości . Dlatego każdą właściwość tego rozkładu można traktować jako funkcję . Przykładami takich właściwości są punkt przecięcia , nachylenie , wartość , a nawet średnia o wartości , która (zgodnie z tym sformułowaniem ) musi być .β 0 + 2 β 1
W tym kontekście OLS, A nie przykład estymatora będzie procedura domyślać się wartość , gdy zostały równy 2. To nie estymator ponieważ ta wartość jest przypadkowy (w sposób całkowicie oddzielone od losowość danych): nie jest to (określona liczbowo) właściwość rozkładu, nawet jeśli jest związana z tym rozkładem. (Jak tylko piła, chociaż, oczekiwanie z dla , która jest równa może być określona).x y y x = 2 β 0 + 2 β 1
W sformułowaniu Lehmanna prawie każda formuła może być estymatorem prawie każdej właściwości. Nie ma nieodłącznego matematycznego związku między estymatorem a estymatorem. Możemy jednak z wyprzedzeniem ocenić szansę, że estymator będzie racjonalnie zbliżony do wielkości, którą zamierza oszacować. Sposoby i sposoby ich wykorzystania są przedmiotem teorii szacunków.
W skrócie: estymator jest funkcją, a oszacowanie jest wartością, która podsumowuje obserwowaną próbkę.
Estymator jest funkcją, która odwzorowuje losową próbkę do oszacowania parametrów:
X1,X2,. . . ,Xn Θ Ż X =1
x1,x2,. . . ,Xn μ = Ż x =1
Pomocne może być zilustrowanie odpowiedzi Whubera w kontekście modelu regresji liniowej. Załóżmy, że masz dane dwuwymiarowe i używasz zwykłych najmniejszych kwadratów, aby wymyślić następujący model:
Y = 6X + 1
W tym momencie możesz wziąć dowolną wartość X, podłączyć ją do modelu i przewidzieć wynik, Y. W tym sensie możesz myśleć o poszczególnych składnikach ogólnej postaci modelu ( mX + B ) jako estymatorach . Przykładowe dane (które przypuszczalnie podłączony do rodzajowego modelu do obliczania wartości specyficzne dla m i B powyżej) stanowi podstawę, na której można wymyślić szacunków dla m i B odpowiednio.
Zgodnie z punktami @ whubera w naszym poniższym wątku, niezależnie od wartości Y, dla których generowany jest określony zestaw estymatorów, w kontekście regresji liniowej są uważane za wartości prognozowane.
(edytowany - kilka razy - w celu odzwierciedlenia poniższych komentarzy)
Załóżmy, że otrzymałeś jakieś dane i zaobserwowałeś zmienną o nazwie theta. Teraz twoje dane mogą pochodzić z rozkładu danych, dla tego rozkładu istnieje odpowiednia wartość theta, którą wnioskujesz, która jest zmienną losową. Możesz użyć MAP lub średniej do obliczenia oszacowania tej zmiennej losowej, ilekroć zmienia się rozkład danych. Tak więc losowa zmienna theta jest znana jako oszacowanie , pojedyncza wartość nieobserwowanej zmiennej dla określonego rodzaju danych.
Podczas gdy estymator to twoje dane, które są również zmienną losową. Dla różnych typów rozkładów masz różne typy danych, a zatem masz inne oszacowanie, a zatem ta odpowiadająca zmienna losowa jest nazywana estymatorem .