Czy ktoś może wyjaśnić wystarczające statystyki w bardzo podstawowych terminach? Pochodzę z inżynierii i przeszedłem wiele rzeczy, ale nie znalazłem intuicyjnego wyjaśnienia.
Czy ktoś może wyjaśnić wystarczające statystyki w bardzo podstawowych terminach? Pochodzę z inżynierii i przeszedłem wiele rzeczy, ale nie znalazłem intuicyjnego wyjaśnienia.
Odpowiedzi:
Wystarczająca statystyka podsumowuje wszystkie informacje zawarte w próbce, abyś mógł oszacować ten sam parametr niezależnie od tego, czy daliśmy ci próbkę, czy tylko samą statystykę. To redukcja danych bez utraty informacji.
Oto jeden przykład. Załóżmy, że ma rozkład symetryczny około zera. Zamiast dać ci próbkę, wręczam ci próbkę wartości bezwzględnych (to jest statystyka). Nie zobaczysz znaku. Ale wiesz, że rozkład jest symetryczny, więc dla danej wartości , i są jednakowo prawdopodobne (prawdopodobieństwo warunkowe wynosi ). Możesz rzucić uczciwą monetą. Jeśli pojawi się głowa, spraw, aby ujemne. Jeśli ogony, zrób to pozytywnie. To daje próbkę z , który ma taki sam rozkład jak dane oryginalnego . Zasadniczo byłeś w stanie zrekonstruować dane ze statystyki. To wystarcza.x - x x 0,5 x X ′ X
W kategoriach bayesowskich masz pewną obserwowalną właściwość i parametr . Rozkład łączny dla jest określony, ale uwzględniany jako rozkład warunkowy i wcześniejszy rozkład . Statystyka jest wystarczająca dla tego modelu wtedy i tylko wtedy, gdy rozkład tylny jest taki sam jak , dla każdego wcześniejszego rozkładu . Innymi słowy, twoja zaktualizowana niepewność dotycząca po znajomości wartości jest tym samym, co zaktualizowana niepewność dotycząca po znajomości wartości ,bez względu na wcześniejsze informacje o . Należy pamiętać, że wystarczalność jest koncepcją zależną od modelu.
Powiedz, że masz monetę i nie wiesz, czy jest to uczciwe, czy nie. Innymi słowy, ma prawdopodobieństwo zbliżających się głów ( ) i nadchodzących ogonów ( ) i nie znasz wartości .
Próbujesz zrozumieć wartość , rzucając monetą kilka razy, powiedzmy razy.
Powiedzmy, że a wynikiem jest sekwencja .
Wyrażamy to, mówiąc, że liczba głów jest wystarczającą statystyką dla p .
Ten przykład nadaje smak koncepcji. Czytaj dalej, jeśli chcesz zobaczyć, jak łączy się z definicją formalną.
Formalnie statystyka jest wystarczająca dla parametru, jeżeli biorąc pod uwagę wartość statystyki, rozkład prawdopodobieństwa wyników nie obejmuje parametru.