Patrzyłem na wiele pytań na tej stronie dotyczących ładowania początkowego i przedziałów ufności, ale nadal jestem zdezorientowany. Jednym z powodów mojego zamieszania jest prawdopodobnie to, że nie jestem wystarczająco zaawansowany w mojej wiedzy statystycznej, aby zrozumieć wiele odpowiedzi. Jestem mniej więcej w połowie kursu wprowadzającego, a mój poziom matematyki dotyczy tylko połowy Algebry II, więc wszystko, co przekroczy ten poziom, tylko mnie dezorientuje. Gdyby jedna z kompetentnych osób na tej stronie mogła wyjaśnić ten problem na moim poziomie, byłoby to niezwykle pomocne.
Nauczyliśmy się w klasie, jak pobierać próbki za pomocą metody ładowania początkowego i używać ich do budowania przedziału ufności dla niektórych statystyk, które chcielibyśmy zmierzyć. Załóżmy na przykład, że pobieramy próbkę z dużej populacji i stwierdzamy, że 40% twierdzi, że zagłosuje na kandydata A. Zakładamy, że ta próbka jest dość dokładnym odzwierciedleniem pierwotnej populacji, w którym to przypadku możemy pobrać próbki z odkryć coś o populacji. Więc bierzemy próbki i stwierdzamy (przy 95% poziomie ufności), że wynikowy przedział ufności wynosi od 35% do 45%.
Moje pytanie brzmi: co tak naprawdę oznacza ten przedział ufności ?
Ciągle czytam, że istnieje różnica między (częstymi) przedziałami ufności i (bayesowskimi) wiarygodnymi przedziałami. Jeśli dobrze zrozumiałem, wiarygodny przedział byłoby powiedzieć, że istnieje 95% szans, że w naszej sytuacji prawdziwym parametrem jest w zadanym przedziale (35% -45%), natomiast przedział ufności byłoby powiedzieć, że tam jest 95%, że to rodzaj sytuacji (ale niekoniecznie w naszej konkretnej sytuacji) zastosowana metoda dokładnie zgłosi, że prawdziwy parametr mieści się w podanym przedziale czasowym.
Zakładając, że ta definicja jest poprawna, moje pytanie brzmi: jaki jest „prawdziwy parametr”, o którym mówimy, gdy używa się przedziałów ufności zbudowanych za pomocą metody bootstrap? Czy mówimy o (a) prawdziwym parametrze pierwotnej populacji , czy (b) prawdziwym parametrze próby ? Jeśli (a), to powiedzielibyśmy, że w 95% przypadków metoda ładowania początkowego dokładnie zgłasza prawdziwe stwierdzenia o oryginalnej populacji. Ale skąd możemy to wiedzieć? Czy cała metoda bootstrap nie opiera się na założeniuczy oryginalna próbka jest dokładnym odzwierciedleniem populacji, z której została pobrana? Jeśli (b) to w ogóle nie rozumiem znaczenia przedziału ufności. Czy nie znamy już prawdziwego parametru próbki? To prosty pomiar!
Rozmawiałem o tym z moją nauczycielką i była bardzo pomocna. Ale wciąż jestem zdezorientowany.