Cytat z wikipedii:
W statystyce spójny estymator lub asymptotycznie spójny estymator jest estymatorem - regułą obliczania szacunków parametru mając właściwość, że wraz ze wzrostem liczby wykorzystywanych punktów danych w nieskończoność wzrasta wynikowa sekwencja estymacji z prawdopodobieństwem do .θ ∗
Aby uczynić tę instrukcję precyzyjną, niech będzie wartością prawdziwego parametru, który chcesz oszacować, i niech będzie regułą do szacowania tego parametru jako funkcji danych. Następnie definicję spójności estymatora można wyrazić w następujący sposób:* θ ( S n )
moje pytanie wydaje się powierzchowne na pierwszy rzut oka, ale brzmi: dlaczego słowo „spójność / konsekwencja” zostało użyte do opisania tego zachowania estymatora?
Powodem, dla którego mnie to obchodzi, jest to, że intuicyjnie słowo „konsekwentnie” oznacza coś innego (a przynajmniej wydaje mi się inne, być może można je wykazać jako równe). Pozwól, że powiem ci, co to oznacza na przykładzie. Powiedz „jesteś” konsekwentnie „dobry” (dla jakiejś definicji dobra), a następnie konsekwentny oznacza, że za każdym razem, gdy masz szansę udowodnić / pokazać mi, że jesteś dobry, rzeczywiście udowodnisz mi, że jesteś dobry, za każdym razem (lub przynajmniej przez większość czasu).
Zastosujmy moją intuicję, aby zdefiniować spójność estymatora. Niech „ty” będzie funkcją obliczeniową i niech „dobry” oznacza, jak daleko jesteś od prawdziwej oceny (dobrze, w sensie , dlaczego nie). Zatem lepsza definicja spójności byłaby: θ*l1
Chociaż może to być mniej przydatna definicja spójności, ma dla mnie większy sens sposób, w jaki zdefiniowałbym spójność, ponieważ dla każdego zestawu treningów / próbek, które rzucisz do mojego estymatora , będę mógł zrobić dobra robota, tzn. konsekwentnie będę dobrze sobie radził. Wiem, że to trochę nierealne, aby zrobić to dla wszystkich n (prawdopodobnie niemożliwe), ale możemy naprawić tę definicję, mówiąc:
tzn. dla wystarczająco dużego n nasz estymator nie zrobi gorszego niż (tj. nie więcej niż od „prawdy”) od prawdziwej ( próbuje uchwycić intuicję, której potrzebujesz przynajmniej pewną liczbę przykładów na naukę / oszacowanie czegokolwiek, a gdy już osiągniesz tę liczbę, twój estymator będzie robił dobrze przez większość czasu, jeśli będzie zgodny ze sposobem, w jaki staramy się to zdefiniować).ε θ * n 0
Jednak poprzednia definicja jest zbyt silna, być może moglibyśmy pozwolić nam mieć małe prawdopodobieństwo bycia dalekim od dla większości zestawów treningowych o rozmiarze (tj. Nie wymaga tego dla wszystkich , ale ponad rozkład n ≥ n 0 S n S n lub coś w tym rodzaju). Tak więc bardzo rzadko będziemy mieli wysoki błąd w przypadku większości zestawów próbek / treningów, które mamy.
Tak czy inaczej, moje pytanie brzmi: czy te proponowane definicje „spójności” są faktycznie takie same jak „oficjalna” definicja spójności, ale trudno jest udowodnić równoważność? Jeśli znasz dowód, podziel się nim! A może moja intuicja jest kompletnie wyłączona i czy istnieje głębszy powód, aby wybierać spójność definicji w sposób, w jaki jest ona zwykle definiowana? Dlaczego („oficjalna”) spójność jest zdefiniowana w taki sposób?
Niektóre moje przemyślenia na temat potencjalnego dowodu na jakąś równoważność, a może podobieństwo między moim pojęciem spójności a przyjętym pojęciem spójności, może polegać na rozwikłaniu definicji ograniczenia w oficjalnej definicji spójności przy użyciu definicja limitu. Nie byłem jednak w 100% pewien, jak to zrobić, a nawet gdybym próbował, oficjalna definicja spójności nie wydaje się brać pod uwagę mówienia o wszystkich potencjalnych zestawach szkoleń / próbek. Ponieważ uważam, że są one równoważne, czy podana przeze mnie oficjalna definicja jest niepełna (tj. Dlaczego nie mówi o zestawach danych, które moglibyśmy, ani o wszystkich różnych zestawach danych, które mogłyby wygenerować nasze zestawy próbek)?
Jedną z moich ostatnich myśli jest to, że każda definicja, którą podajemy, powinna być również precyzyjna, o czyim prawdopodobieństwie mówimy, czy to czy . Uważam, że kandydat powinien również być precyzyjny, jeśli cokolwiek to gwarantuje, jeśli gwarantuje to pewną stałą dystrybucję lub wrt do wszystkich możliwych dystrybucji do zestawów szkoleniowych ... prawda?P S n