Uczę się statystyk dla zabawy i mam pewne wątpliwości co do wystarczających statystyk . Moje zamieszanie napiszę w formie listy:
Jeśli rozkład ma parametrów, to czy będzie miał wystarczających statystyk?n
Czy istnieje jakakolwiek bezpośrednia zgodność między wystarczającymi statystykami a parametrami? Czy też wystarczające statystyki służą po prostu jako pula „informacji”, dzięki czemu możemy odtworzyć ustawienie, abyśmy mogli obliczyć te same oszacowania dla parametrów rozkładu podstawowego.
Czy wszystkie dystrybucje mają wystarczające statystyki? to znaczy. czy twierdzenie o faktoryzacji może kiedykolwiek zawieść?
Korzystając z naszej próbki danych, zakładamy rozkład, z którego najprawdopodobniej pochodzą dane, a następnie możemy obliczyć szacunki (np. MLE) dla parametrów rozkładu. Wystarczające statystyki są sposobem na obliczenie tych samych oszacowań parametrów bez konieczności polegania na samych danych, prawda?
Czy wszystkie zestawy wystarczających statystyk będą miały wystarczającą minimalną statystykę?
To jest materiał, którego używam do zrozumienia tematu: https://onlinecourses.science.psu.edu/stat414/node/283
Z tego, co rozumiem, mamy twierdzenie faktoryzacyjne, które dzieli rozkład połączeń na dwie funkcje, ale nie rozumiem, w jaki sposób jesteśmy w stanie wydobyć wystarczającą statystykę po rozkładeniu rozkładu na nasze funkcje.
Pytanie Poissona podane w tym przykładzie miało wyraźną faktoryzację, ale następnie stwierdzono, że wystarczające statystyki to średnia próbki i suma próbki. Skąd wiedzieliśmy, że są to wystarczające statystyki, patrząc tylko na formę pierwszego równania?
W jaki sposób można przeprowadzić te same oszacowania MLE przy użyciu wystarczających statystyk, jeśli drugie równanie wyniku faktoryzacji będzie czasem zależeć od samych danych ? Na przykład w przypadku Poissona druga funkcja zależała od odwrotności iloczynu silni danych i nie mielibyśmy już danych!
Dlaczego wielkość próby nie byłaby wystarczającą statystyką w stosunku do przykładu Poissona na stronie internetowej ? Wymagalibyśmy od rekonstruowania niektórych części pierwszej funkcji, więc dlaczego nie jest to również wystarczająca statystyka?