Wyjaśnienie dotyczące interpretacji przedziałów ufności?


47

Moje obecne rozumienie pojęcia „przedziału ufności z poziomem ufności ” jest to, że jeśli będziemy próbowali obliczyć przedział ufności wiele razy (za każdym razem świeżą próbkę), będzie ona zawierać poprawny parametr z czas.1 - α1α1α

Chociaż zdaję sobie sprawę, że to nie to samo, co „prawdopodobieństwo, że prawdziwy parametr leży w tym przedziale”, jest coś, co chcę wyjaśnić.

[Ważna aktualizacja]

Przed obliczeniem 95% przedziału ufności istnieje 95% prawdopodobieństwo, że obliczany przedział obejmie prawdziwy parametr. Po obliczeniu przedziału ufności i uzyskaniu określonego przedziału nie możemy już tego powiedzieć. Nie możemy nawet wysunąć jakiegoś nieczęstego argumentu, że jesteśmy w 95% pewni, że prawdziwy parametr będzie leżał w ; bo gdybyśmy mogli, przeczyłoby to kontrprzykładom takim jak ten: Czym dokładnie jest przedział ufności?[ a , b ][a,b][a,b]

Nie chcę, aby debata ta dotyczyła filozofii prawdopodobieństwa; zamiast tego szukam dokładnego, matematycznego wyjaśnienia, w jaki sposób i dlaczego zobaczenie danego przedziału zmienia (lub nie zmienia) 95% prawdopodobieństwa, jakie mieliśmy przed zobaczeniem tego przedziału. Jeśli argumentujesz, że „po zobaczeniu przedziału pojęcie prawdopodobieństwa nie ma już sensu”, to dobrze, popracujmy nad interpretacją prawdopodobieństwa, w którym ma on sens.[a,b]

Dokładniej:

Załóżmy, że programujemy komputer w celu obliczenia 95% przedziału ufności. Komputer wykonuje pewne crunchowanie liczb, oblicza interwał i nie pokazuje mi interwału, dopóki nie wprowadzę hasła. Zanim wprowadzę hasło i zobaczę interwał (ale po tym, jak komputer już go obliczył), jakie jest prawdopodobieństwo, że interwał będzie zawierał prawdziwy parametr? To 95%, a ta część nie jest przedmiotem dyskusji : oto interpretacja prawdopodobieństwa, która mnie interesuje w tym konkretnym pytaniu (zdaję sobie sprawę, że istnieją główne kwestie filozoficzne, które tłumię, i to jest zamierzone).

Ale gdy tylko wpisam hasło i sprawię, że komputer pokaże mi obliczony przedział, prawdopodobieństwo (że przedział zawiera prawdziwy parametr) może ulec zmianie. Wszelkie twierdzenia, że ​​prawdopodobieństwo nigdy się nie zmienia, byłyby sprzeczne z powyższym przykładem. W tym kontrprzykładzie prawdopodobieństwo może zmienić się z 50% na 100%, ale ...

  • Czy istnieją przykłady, w których prawdopodobieństwo zmienia się na coś innego niż 100% lub 0% (EDYCJA: a jeśli tak, to jakie są)?

  • Czy istnieją przykłady, w których prawdopodobieństwo nie zmienia się po zobaczeniu określonego przedziału (tj. Prawdopodobieństwo, że prawdziwy parametr leży w wynosi nadal 95%)?[ a , b ][a,b][a,b]

  • Jak (i ​​dlaczego) ogólnie zmienia się prawdopodobieństwo po zobaczeniu, jak komputer wypluwa ?[a,b]

[Edytować]

Dziękujemy za wszystkie wspaniałe odpowiedzi i pomocne dyskusje!


1
Może to dostarczyć kilku interesujących punktów: en.wikipedia.org/wiki/Credible_interval
nico

Twoje założenia, że ​​P (E | C) = 1 i P (E | C ') = 0 są nieuzasadnione. Dlaczego twierdzisz, że jeśli rzeczywisty przedział nie zawiera prawdziwej wartości parametru, to ten ostatni z pewnością jest poza nim?
szklisty

Nie jestem pewien, co rozumiesz przez „rzeczywisty odstęp” lub „drugi”. Czy możesz wyjaśnić?
Elliott,

@nico Dzięki za link. Celem mojego pierwotnego pytania było „mój argument wydaje się wskazywać, że przedział ufności można interpretować jako wiarygodny przedział bayesowski, ale tak nie jest, więc co jest nie tak z moim rozumowaniem”. Ale muszę przyznać, że nie jestem zadowolony z pojęcia „prawdopodobieństwo, że przedział zawiera [nieznany] prawdziwy parametr, wynosi 0 lub 1”. Dla mnie jest to jak powiedzenie „prawdopodobieństwo, że moneta wylądowała po tym, jak ją rzuciłem, ale zanim na nią spojrzałem, wynosi 0 lub 1”; Nie rozumiem, dlaczego nie jest 1/2.
Elliott,

@Elliot: Kot Schrödingera przychodzi mi na myśl :) Nie jestem wystarczająco ekspertem, aby udzielić właściwego wyjaśnienia, ale chciałbym zobaczyć odpowiedź na to pytanie. PS: i nie zapominajmy, że moneta może również spaść na krawędź!
nico

Odpowiedzi:


28

Myślę, że podstawowym problemem jest to, że statystyki częstokrzyskie mogą przypisać prawdopodobieństwo tylko do czegoś, co może mieć częstotliwość długofalową. Niezależnie od tego, czy prawdziwa wartość parametru leży w określonym przedziale, czy nie, nie ma ona częstotliwości długiego przebiegu, ponieważ eksperyment możemy wykonać tylko raz, więc nie można przypisać do niego prawdopodobieństwa częstego. Problem wynika z definicji prawdopodobieństwa. Jeśli zmienisz definicję prawdopodobieństwa na bayesowską, problem natychmiast zniknie, ponieważ nie jesteś już przywiązany do dyskusji na temat długofalowych częstotliwości.

Zobacz moją (raczej językową w policzek) odpowiedź na powiązane pytanie tutaj :

Frequentist to ktoś, kto uważa, że ​​prawdopodobieństwa reprezentują częstotliwości długoterminowe, z którymi zdarzają się zdarzenia; w razie potrzeby wymyśli fikcyjną populację, z której twoją szczególną sytuację można by uznać za losową próbę, aby mógł w sposób znaczący mówić o częstotliwościach długoterminowych. Jeśli zadajesz mu pytanie dotyczące konkretnej sytuacji, on nie udzieli bezpośredniej odpowiedzi, ale zamiast tego wypowie się na temat tej (być może wyobrażonej) populacji ”.

W przypadku przedziału ufności pytaniem, które normalnie chcielibyśmy zadać (chyba że mamy na przykład problem z kontrolą jakości), jest „biorąc pod uwagę tę próbkę danych, zwróć najmniejszy przedział, który zawiera prawdziwą wartość parametru z prawdopodobieństwem X ”. Jednak częsty nie może tego zrobić, ponieważ eksperyment jest przeprowadzany tylko raz, więc nie ma częstotliwości długich przebiegów, których można by użyć do przypisania prawdopodobieństwa. Zamiast tego częsty musi wymyślić populację eksperymentów (których nie wykonałeś), z których przeprowadzony eksperyment można uznać za próbę losową. Częstochowiec daje następnie pośrednią odpowiedź na temat tej fikcyjnej populacji eksperymentów, a nie bezpośrednią odpowiedź na pytanie, które naprawdę chciałeś zadać na temat konkretnego eksperymentu.

Zasadniczo jest to problem języka, częstokroć definicja populacji po prostu nie pozwala na dyskusję na temat prawdopodobieństwa prawdziwej wartości parametru leżącego w danym przedziale. Nie oznacza to, że statystyki często są złe lub nieprzydatne, ale ważne jest, aby znać ograniczenia.

W odniesieniu do głównej aktualizacji

Nie jestem pewien, czy możemy powiedzieć: „Przed obliczeniem 95% przedziału ufności istnieje 95% prawdopodobieństwo, że obliczany przedział obejmie prawdziwy parametr”. w ramach częstych. Istnieje tutaj domyślny wniosek, że częstotliwość długoterminowa, z którą prawdziwa wartość parametru leży w przedziałach ufności skonstruowanych przez określoną metodę, jest również prawdopodobieństwem, że prawdziwa wartość parametru będzie leżeć w przedziale ufności dla konkretnej próbki danych, które będziemy wykorzystywać. Jest to całkowicie rozsądne wnioskowanie, ale jest to wnioskowanie bayesowskie, a nie częste, ponieważ prawdopodobieństwo, że prawdziwa wartość parametru leży w przedziale ufności, który tworzymy dla konkretnej próbki danych, nie ma częstotliwości długofalowej, ponieważ mamy tylko jedną próbkę danych.

Możemy jednak „wysunąć jakiś nieczęsto argumentujący argument, że jesteśmy w 95% pewni, że prawdziwy parametr będzie leżał w [a, b]”, to jest dokładnie taki przedział wiarygodności Bayesa, a dla wielu problemów wiarygodny przedział Bayesa dokładnie pokrywa się z częstym przedziałem ufności.

„Nie chcę, aby była to debata na temat filozofii prawdopodobieństwa”, niestety jest to nieuniknione, ponieważ nie można przypisywać częstemu prawdopodobieństwu tego, czy prawdziwa wartość statystyki leży w przedziale ufności, jest bezpośrednią konsekwencją częstej filozofii prawdopodobieństwa. Częstotliwości mogą przypisywać prawdopodobieństwa tylko rzeczom, które mogą mieć częstotliwości długofalowe, ponieważ tak często definiują prawdopodobieństwo w swojej filozofii. To nie czyni błędnej filozofii częstym, ale ważne jest, aby zrozumieć granice narzucone przez definicję prawdopodobieństwa.

„Zanim wprowadziłem hasło i zobaczyłem interwał (ale po tym, jak komputer go już obliczył), jakie jest prawdopodobieństwo, że interwał będzie zawierał prawdziwy parametr? To 95%, a ta część nie podlega dyskusji:„ To jest niepoprawny, a przynajmniej składając takie oświadczenie, odszedłeś od ram statystyki częstokroć i dokonałeś wnioskowania bayesowskiego, co wiąże się z pewnym prawdopodobieństwem prawdziwości stwierdzenia, a nie z częstotliwością długoterminową. Jednak, jak powiedziałem wcześniej, jest to całkowicie rozsądne i naturalne wnioskowanie.

Nic się nie zmieniło przed ani po wprowadzeniu hasła, ponieważ do innego zdarzenia można przypisać częste prawdopodobieństwo. Statystyki częstokroć mogą być raczej sprzeczne z intuicją, ponieważ często chcemy zadawać pytania o stopień wiarygodności stwierdzeń dotyczących konkretnych wydarzeń, ale nie leży to w zakresie statystyki częstokroć i jest to przyczyną większości błędnych interpretacji procedur częstokroć.


2
Tak, o to mi chodzi, to drugie stwierdzenie nie jest tak naprawdę stwierdzeniem na temat tej konkretnej monety. Jest to stwierdzenie o wyimaginowanej populacji monet, które większość ludzi błędnie interpretuje jako stwierdzenie o naszej konkretnej monecie. Jednak robiąc ten skok, stosujemy bayesowską intuicję dotyczącą prawdopodobieństwa i ignorując, czym tak naprawdę jest przedział ufności. Nie ma problemu z przypisaniem prawdopodobieństwa do stanu monety, pod warunkiem, że odejdziemy od częstokroć definiującej prawdopodobieństwo.
Dikran Marsupial

2
Wyjaśnienie, powiedzenie, że „wyobraź sobie wiele osobnych początków czasu; można się spodziewać, że około połowa z nich wyprodukuje głowy”, jest całkowicie poprawnym argumentem dla osób często uprawiających takie podejście. Jednak przejście od tego do „dlatego prawdopodobieństwo, że ta konkretna moneta ma również 0,5”, nie jest, ponieważ prawdopodobieństwo stosuje się do czegoś, co nie ma częstotliwości długiego biegu, ponieważ może się zdarzyć tylko raz i tylko raz. Jest to jednak całkowicie rozsądne rozumowanie bayesowskie, ponieważ prawdopodobieństwo bayesowskie jest stwierdzeniem o prawdopodobieństwie zdania (które może być oparte na częstotliwości długofalowej w obrębie populacji).
Dikran Marsupial

1
Jego odpowiedź na oba pytania byłaby stwierdzeniem o proporcji wyimaginowanej populacji monet, które wylądowałyby na głowach. Jest jednak prawdopodobne, że nie zostanie to wyjaśnione, ponieważ ludzie na ogół lubią być pomocni (pośrednie odpowiedzi nie są na ogół tak pomocne), a statystyki często są sprzeczne z intuicją, a osoby często jeżdżące omijają ten punkt, aby uniknąć zamieszanie. Jeśli zostanie przypięty do stanowiska probabilistycznego na temat konkretnego przerzucenia, dobry częsty nie chciałby po prostu odpowiedzieć - leży to poza granicami częstych statystyk.
Dikran Marsupial

1
Zasadniczo częsty nie odpowiedziałby na twoje pytanie, wypowiedziałby się na temat liczby rzutów monetą i pozwoliłby ci wywnioskować, że prawdopodobieństwo trafienia głową w ten konkretny rzut było takie samo jak odsetek w domniemanej populacji . Ale to byłby twój wniosek bayesowski, a nie jego.
Dikran Marsupial

1
@Aaron Oczywiście, możesz powiedzieć „prawdopodobieństwo wynosi 0 lub 1” dla wielu rzeczy, ale ta odpowiedź nic nas nie kupi (na przykład, jeśli chcemy odpowiedzieć na konkretne pytanie, ile powinniśmy postawić na grę lub czy czy nie powinniśmy wystrzelić prom kosmiczny). Poza tym rzeczy, które „mogą się zdarzyć” to: (1) moneta wylądowała na głowach i przykryłeś ją, (2) moneta wylądowała na ogonach i przykryłeś ją; w „wyimaginowanej populacji” wielu prób „przerzucania i zakrywania” około 50% powoduje, że widzisz głowy.
Elliott,

14

Ważna aktualizacja, ważna nowa odpowiedź. Pozwól, że postaram się wyraźnie rozwiązać ten problem, ponieważ na tym polega problem:

„Jeśli argumentujesz, że„ po zobaczeniu przedziału pojęcie prawdopodobieństwa nie ma już sensu ”, to dobrze, popracujmy nad interpretacją prawdopodobieństwa, w którym ma on sens”.

Zasady prawdopodobieństwa nie zmieniają się, ale zmienia się twój model wszechświata. Czy chcesz skwantyfikować swoje wcześniejsze przekonania na temat parametru przy użyciu rozkładu prawdopodobieństwa? Czy aktualizacja rozkładu prawdopodobieństwa po zobaczeniu danych jest rozsądnym rozwiązaniem? Jeśli tak uważasz, możesz tworzyć takie zdania jak . Mój wcześniejszy podział może reprezentować moją niepewność co do prawdziwego stanu przyrody , a nie tylko przypadkowościP(θ[L(X),U(X)]|X=x)jak to jest powszechnie rozumiane - to znaczy, jeśli przydzielę wcześniejszy rozkład liczby czerwonych piłek w urnie, to nie znaczy, że uważam, że liczba czerwonych piłek jest losowa. Jest naprawiony, ale nie jestem tego pewien.

Kilka osób, w tym ja, powiedziałem to, ale jeśli nie chcesz wywołać zmiennej losowej, wówczas instrukcja P ( θ [ L ( X ) , U ( X ) ] | X = x ) nie ma znaczenia. Jeśli jestem częstym, traktuję θ jako stałą ilość ORAZ nie mogę przypisać jej rozkładu prawdopodobieństwa. Dlaczego? Ponieważ jest ustalony, a moja interpretacja prawdopodobieństwa dotyczy częstotliwości długofalowych. Liczba czerwonych kulek w urnie nigdy się nie zmienia. θ jest tym, co θθP(θ[L(X),U(X)]|X=x)θθθjest. Jeśli wyciągnę kilka piłek, mam losową próbkę. Mogę zapytać, co by się stało, gdybym wziął kilka losowych próbek - to znaczy, że mogę mówić o ponieważ interwał zależy od próbki, która jest (poczekaj na to!) losowo.P(θ[L(X),U(X)])

Ale tego nie chcesz. Chcesz - jakie jest prawdopodobieństwo, że ten przedział, który zbudowałem z moją zaobserwowaną (i teraz ustaloną) próbką, zawiera parametr. Jednak gdy uznasz, że X = x to dla mnie, częstego, nie ma już nic losowego i zdania P ( θ [ L ( X ) , U ( X ) ] |P(θ[L(X),U(X)]|X=x)X=x nie ma żadnego sensu.P(θ[L(X),U(X)]|X=x)

Jedynym zasadowym sposobem (IMO) do złożenia oświadczenia o jest oszacowanie naszej niepewności co do parametru z (wcześniejszym) rozkładem prawdopodobieństwa i zaktualizowanie tego dystrybucja z nowymi informacjami za pośrednictwem Twierdzenia Bayesa. Każde inne podejście, które widziałem, jest niefrasobliwym przybliżeniem do Bayesa. Z pewnością nie możesz tego zrobić z częstej perspektywy.P.(θ[L.(X),U(X)]|X=x)

Nie oznacza to, że nie można oceniać tradycyjnych procedur częstokroć z perspektywy bayesowskiej (często przedziały ufności są tylko wiarygodnymi przedziałami, na przykład w ramach jednolitych priorytetów), lub że ocena estymatorów bayesowskich / rzetelnych przedziałów z częstości nie jest cenna (Myślę, że może być). Nie oznacza to, że klasyczne / częste statystyki nie są przydatne, ponieważ nie są. Tak właśnie jest i nie powinniśmy próbować robić tego więcej.

Czy uważasz, że uzasadnione jest wcześniejsze podanie parametru w celu przedstawienia swoich przekonań na temat wszechświata? To brzmi jak z twoich komentarzy; z mojego doświadczenia wynika, że ​​większość ludzi by się zgodziła (to mały żart, który napisałem w komentarzu do @G. Jay Kerns). Jeśli tak, paradygmat bayesowski zapewnia logiczny, spójny sposób wypowiadania się na temat . Podejście częsterzy po prostu tego nie robi.P.(θ[L.(X),U(X)]|X=x)


1
(+1) ponownie bardzo dobrze zrobione, i znajdź w martwym punkcie.

+1 Taki sam komentarz, jak powyżej (patrz odpowiedź G. Jaya Kernsa); to było naprawdę pomocne.
Elliott,

Bounty schmounty :) Cieszę się, że okaże się to pomocne.
JMS

11

OK, teraz rozmawiasz! Głosowałem za usunięciem mojej poprzedniej odpowiedzi, ponieważ nie ma to sensu w przypadku tego ważnego, zaktualizowanego pytania.

W tym nowym, zaktualizowanym pytaniu z komputerem, który oblicza 95% przedziały ufności, zgodnie z ortodoksyjną interpretacją częstokroć, oto odpowiedzi na twoje pytania:

  1. Nie.
  2. Nie.
  3. Po zaobserwowaniu odstępu nie jest on już losowy i nie zmienia się. (Być może odstęp wynosił ). Ale θ też się nie zmienia i nigdy się nie zmienia. (Być może jest to θ = 7. ) Prawdopodobieństwo zmienia się z 95% na 0%, ponieważ 95% przedziałów obliczanych przez komputer obejmuje 7, ale 100% przedziałów [ 1 , 3 ] NIE obejmuje 7.[1,3]θθ=7[1,3]

(Nawiasem mówiąc, w świecie rzeczywistym eksperymentator nigdy nie wie, że , co oznacza, że ​​eksperymentator nigdy nie może wiedzieć, czy prawdziwe prawdopodobieństwo [ 1 , 3 ] obejmuje θ jest równe zero, czy jeden. (S) może tylko powiedzieć, że to musi być jedno albo drugie). to, plus eksperymentator może powiedzieć, że 95% z przerwami przez komputer jako pokrycie θ , ale wiedzieliśmy, że już.θ=7[1,3]θθ

Duch twojego pytania powraca do wiedzy obserwatora i tego, w jaki sposób odnosi się to do tego, gdzie leży . To (przypuszczalnie) dlatego mówiłeś o haśle, o tym, że komputer oblicza interwał, jeszcze go nie widząc itp . Widziałem w swoim komentarzu do odpowiedzi, które wydaje się niezadowalający / unseemly być zobowiązany do popełniania 0 lub 1, mimo wszystko, dlaczego nie mogliśmy uwierzyć, że to jest 87%, lub 15 / 16 , a nawet 99% ?? ? Ale taka jest właśnie siła - i jednocześnie pięta achillesowa - częstych ram: subiektywna wiedza / przekonanie obserwatora nie ma znaczenia. Liczy się tylko częstotliwość względna w długim okresie. Nic dodać nic ująć.θ15/16

Na koniec: jeśli zmienisz swoją interpretację prawdopodobieństwa (której celowo nie zdecydowałeś się zrobić w przypadku tego pytania), nowe odpowiedzi to:

  1. Tak.
  2. Tak.
  3. Prawdopodobieństwo zmienia się, ponieważ prawdopodobieństwo = wiedza subiektywna lub stopień przekonania, a wiedza obserwatora uległa zmianie. Reprezentujemy wiedzę z wcześniejszymi / późniejszymi rozkładami, a gdy nowe informacje stają się dostępne, te pierwsze przekształcają się w drugie (poprzez Regułę Bayesa).

(Ale w celu pełnego ujawnienia opisana konfiguracja nie pasuje zbyt dobrze do subiektywnej interpretacji. Na przykład zwykle mamy 95% wcześniej wiarygodny odstęp, zanim nawet włączymy komputer, a następnie uruchamiamy go i zatrudniamy komputer, aby dać nam 95% wiarygodny przedział czasowy, który jest zwykle znacznie szczuplejszy niż poprzedni).


Jeszcze raz! :) Dobra robota.
JMS

3
Powinienem tylko zaznaczyć, że interpretacja Bayesa prawdopodobieństwa niekoniecznie jest subiektywna, więc nie jest tak naprawdę siłą podejścia częstokrzyskiego. W przypadku obiektywnego bayesowskiego podejścia do „prawdopodobieństwa lądowania na monecie”, stosowanie nieinformacyjnego uprzedzenia nie wiąże się z żadną subiektywnością. Rzeczywista siła podejścia częstych polega na problemach takich jak kontrola jakości, w których naturalne jest mówienie o powtarzanych próbach i częstotliwościach długofalowych. Ma trudności tylko wtedy, gdy stawiasz pytania dotyczące konkretnych wydarzeń.
Dikran Marsupial,

@JMS, dzięki. @Dikran, trudno jest rozmawiać o tym z 544 znakami w małym pudełku na ekranie komputera. W skrócie: Zgadzam się z tobą, że słowo „Bayesian” nie jest synonimem „subiektywnego”. I nie ma sensu próbować ustalić, gdzie naprawdę leży prawdziwa siła obu podejść. Podsumowując: wszyscy możemy zgodzić się na długoterminową częstotliwość względną, ale częściej twój tył będzie inny niż mój.

2
@Dikran Marsupial Masz rację. Dodałbym tylko, że po przejściu problemów z zabawkami do rzeczywistego modelowania stosowanego często zdarza się, że prawdziwie ważna subiektywność pojawia się poprzez to, jak określamy prawdopodobieństwo, niekoniecznie same wcześniejsze rozkłady (Czy te obserwacje są naprawdę wymienne? Gaussowski? itp). W ten sposób subiektywność jest wbudowana w ogromną część statystyk opartych na modelach, zarówno bayesowskich, jak i częstych.
JMS

+1 Dzięki za piękną odpowiedź. To zdecydowanie zasługuje na nagrodę, ale aby uniknąć polityczności, ostatecznie poparłem głosowanie.
Elliott,

6

Wrzucę moje dwa centy (być może przepisuję niektóre z wcześniejszych odpowiedzi). Dla częstego użytkownika sam przedział ufności jest w istocie dwuwymiarową zmienną losową: jeśli powtórzyłbyś eksperyment razy gazillion, przedział ufności, który oszacowałeś (tj. Za każdym razem obliczaj na podstawie nowo znalezionych danych), będzie się różnił . Jako takie dwie granice przedziału są zmiennymi losowymi.

Zatem 95% CI oznacza nic więcej niż pewność (biorąc pod uwagę wszystkie założenia, które prowadzą do tego CI są prawidłowe), że ten zestaw zmiennych losowych będzie zawierał prawdziwą wartość (wyrażenie bardzo częste) w 95% przypadków.

Możesz łatwo obliczyć przedział ufności dla średniej 100 losowań ze standardowego rozkładu normalnego. Następnie, jeśli narysujesz 10000 razy 100 wartości z tego standardowego rozkładu normalnego i za każdym razem obliczysz przedział ufności dla średniej, rzeczywiście zobaczysz, że 0 jest tam około 9500 razy.

Fakt, że zostały stworzone przedział ufności tylko raz (z danych rzeczywistych) rzeczywiście nie zmniejsza prawdopodobieństwa prawdziwej wartości będącej w tym przedziale do 0 lub 1, ale to nie zmienia prawdopodobieństwa przedziału ufności jako zmienna losowa zawierająca prawdziwą wartość.

Podsumowując: prawdopodobieństwo dowolnego (tj. Średnio) 95% przedziału ufności zawierającego prawdziwą wartość (95%) nie zmienia się, podobnie jak prawdopodobieństwo określonego przedziału (CI lub cokolwiek innego) zawierającego prawdziwą wartość (0 lub 1). Prawdopodobieństwo przedziału czasu, który komputer zna, ale ty nie, wynosi w rzeczywistości 0 lub 1 (ponieważ jest to konkretny przedział), ale ponieważ go nie znasz (i często nie jesteś w stanie ponownie obliczyć tego samego przedziału nieskończenie wiele razy z tych samych danych), jedyne, co musisz zrobić, to prawdopodobieństwo dowolnego interwału.


Zabawna uwaga: narzędzie sprawdzania pisowni na tej stronie uważa, że ​​słowo „częsty” jest warte podkreślenia. Czy ta strona jest potajemnie opanowana przez bayesianów? Och, myślę, że nie, ponieważ bayesians mają własne kręcone podkreślenie :-)
Nick sabbe

4

Przyczyną tego, że przedział ufności nie określa „prawdopodobieństwa, że ​​prawdziwy parametr leży w przedziale”, jest to, że po określeniu przedziału parametr leży w nim lub nie. Jednak na przykład dla 95% przedziału ufności masz 95% szansy na utworzenie przedziału ufności, który zawiera tę wartość. Jest to dość trudny do uchwycenia pomysł, więc może nie sformułuję go dobrze. Więcej informacji można znaleźć na stronie http://frank.itlab.us/datamodel/node39.html .


2
Załóżmy, że programujesz komputer w celu obliczenia przedziału ufności, ale nie patrzysz na wynik. Zanim zobaczysz wynik, wiesz, że istnieje 95% szansa, że ​​przedział zawiera odpowiedni parametr (tak jak przed zobaczeniem wyniku rzutu monetą, wiesz, że istnieje 50% szans na trafienie). W jaki sposób późniejsze spojrzenie na wyjście zmienia to prawdopodobieństwo, biorąc pod uwagę, że nie znasz właściwego parametru w pierwszej kolejności (Zgadzam się, że patrząc na wynik rzutu monetą zmienia prawdopodobieństwo trafienia z 50% na którykolwiek 1 lub 0)?
Elliott,

Co więcej, chociaż zgadzam się, że istnieje różnica, zastanawiam się, co jest nie tak z moim powyższym „argumentem” pokazującym, że są one tym samym.
Elliott,

2
@Elliott Twoje pytania wyglądają tak samo jak ta analogia: rzucisz uczciwą monetą. Ergo, prawdopodobieństwo głów wynosi 50%. Teraz patrzysz na monetę i są to główki. W jaki sposób zmienia to prawdopodobieństwo głów? Odpowiedź brzmi: tak nie jest, ponieważ prawdopodobieństwo odnosi się do procedury rzutu monetą, a nie do wyniku. Wydaje mi się, że kontrprzykład, do którego się odwołujesz, działa w podobny sposób: procedura może mieć 50% szansy na pokrycie parametru, ale po fakcie można zweryfikować, czy parametr rzeczywiście jest objęty. Więc co?
whuber

Nie mówię o zmianie prawdopodobieństwa, że ​​uczciwa moneta będzie głowami; zamiast tego mówię o zmianie prawdopodobieństwa, że ​​ta konkretna moneta będzie głowami. Po tym, jak go rzuciłem i zanim na niego spojrzałem, twierdzę, że prawdopodobieństwo, o którym mowa, wynosi 50%, ponieważ około połowa takich przypadków dotyczy monety z podniesioną głową. Z drugiej strony, po obejrzeniu i zobaczeniu głów, 100% takich przypadków dotyczy monety z podniesionymi głowami (skrzynki z podniesionymi ogonami zostały wyeliminowane, gdy spojrzałem na monetę i nie zobaczyłem głów).
Elliott,

Zgadzam się, że po fakcie może być możliwe sprawdzenie, czy parametr został objęty. Moja odpowiedź na „co z tego?” to „więc mój powyższy argument (w pierwotnym pytaniu) musi być błędny i zastanawiam się, co jest z nim nie tak”.
Elliott

4

Nie sądzę, by częsty mógł powiedzieć, że istnieje jakiekolwiek prawdopodobieństwo prawdziwej (populacyjnej) wartości statystyki leżącej w przedziale ufności dla konkretnej próbki. To jest albo nie jest, ale nie ma długiej częstotliwości dla konkretnego zdarzenia, tylko populacja zdarzeń, które można uzyskać, powtarzając wykonywanie procedury statystycznej. Dlatego musimy trzymać się takich stwierdzeń, jak: „95% tak zbudowanych przedziałów ufności będzie zawierało prawdziwą wartość statystyki”, ale nie „istnieje prawdopodobieństwo, że prawdziwa wartość leży w przedziale ufności obliczonym dla tego konkretnego próba". Jest to prawdą w przypadku dowolnej wartości p, po prostu nie jest możliwe w przypadku częstej definicji prawdopodobieństwa. Bayesian może jednak złożyć takie oświadczenie, używając wiarygodnego odstępu czasu.


3

Sposób, w jaki stawiasz problem, jest trochę zagmatwany. Weźmy to zdanie: Niech będzie zdarzeniem, w którym prawdziwy parametr przypada w przedziale [ a , b ] . To stwierdzenie nie ma znaczenia z częstej perspektywy; parametr jest parametrem i nigdzie nie spada, po prostu jest. P (E) jest bez znaczenia, P (E | C) jest bez znaczenia i dlatego twój przykład się rozpada. Problemem nie jest też warunkowanie zestawu miar zerowych; problem polega na tym, że próbujesz złożyć oświadczenia o prawdopodobieństwie dotyczące czegoś, co nie jest zmienną losową.E[a,b]

Częstochowiec powiedziałby coś w stylu: Niech będzie zdarzeniem, w którym przedział ( L ( X ) , U ( X ) ) zawiera prawdziwy parametr. Jest to coś, do czego częsty może przypisać prawdopodobieństwo.E~(L(X),U(X))

Edycja: @G. Jay Kerns sprawia, że ​​kłótnia jest lepsza ode mnie i pisze szybciej, więc prawdopodobnie po prostu idź dalej :)


Dzięki, rozumiem, dlaczego częsty nie chce odpowiedzieć na pytanie „jakie jest prawdopodobieństwo, że prawdziwy parametr przypada w danym przedziale czasowym” (nawet jeśli uważam, że jest to przydatna rzecz do rozmowy, szczególnie jeśli nie zna się prawdziwego parametru ). Ale dlaczego nie uzależniam się od zestawu zerowego, jeśli warunkuję w przypadku zdarzenia, że ​​moje obliczenia zwracają dokładnie przedział ? [a,b]
Elliott,

2
Częstotliwy (pryncypialny) nie odmawia odpowiedzi, nie może odpowiedzieć. Parametr nie jest losowy, interwał to. Co jest przed kiedy warunkujesz przestrzeganie określonego przedziału? Dla częstych, po zaobserwowaniu próbki i skonstruowaniu interwału interwał, nic już nie jest losowe. |
JMS

Nie wiem, twoje jest na miejscu. :-)

2

W statystykach częstych zdarzenie jest stałe - parametr albo znajduje się w [ a , b ], albo nie. Zatem E jest niezależne od C i C ', a zatem zarówno P ( E | C ) = P ( E ), jak i P ( E | C ' ) = P ( E ) .E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

(W twoim argumencie wydaje ci się, że i P ( E | C ) = 0 , co jest niepoprawne.)P(E|C)=1P(E|C)=0


Biorąc pod uwagę, że zdefiniowałem C jako zdarzenie, w którym ten konkretny przedział [a, b] zawiera prawdziwy parametr, nie jestem pewien, czy zgadzam się, że E i C / C 'są niezależne: wiedząc, że C wystąpiło, gwarantuje, że E wystąpiło .
Elliott

Ale C jest zmienną losową! Zmieniasz definicje wszystkich tych wydarzeń po tym, jak wszystko już się wydarzyło. Innymi słowy, jeśli definiujesz C jako to konkretne zdarzenie, C nie jest już przedziałem ufności.
raegtin

2
Problem polega na tym, że jeśli C jest zdarzeniem, w którym interwał zawiera prawdziwy parametr w tym konkretnym przebiegu eksperymentu, nie ma on częstotliwości długiego przebiegu (ten konkretny przebieg może się zdarzyć tylko raz), a zatem nie można przypisać prawdopodobieństwo to częste. Dlatego definicja częstego przedziału ufności jest wyrażona w populacji powtórzeń eksperymentów. Wygląda na to, że stosuje się rozumowanie bayesowskie do ustawień częstych, a definicje prawdopodobieństwa są błędnie dopasowane.
Dikran Marsupial

Oto inny sposób na to spojrzeć. Wygląda na to, że robisz to: wykonaj obliczenia, aby uzyskać przedział ufności [a, b]. Zdefiniuj C jako zdarzenie, że ten konkretny przedział ufności [a, b] zawiera prawdziwy parametr. Zdefiniuj również E jako zdarzenie, że ten konkretny przedział [a, b] zawiera prawdziwy parametr. Zatem E i C są tym samym wydarzeniem!
raegtin

Właśnie to robisz. Wygląda na to, że uważasz, że wykonujesz następujące czynności (a nie jesteś): uruchom obliczenie nr 1, aby uzyskać interwał [a, b]. Zdefiniuj E jako zdarzenie, w którym ten konkretny przedział [a, b] zawiera prawdziwy parametr. Następnie zapomnij o obliczeniu nr 1 i zdefiniuj C jako zdarzenie, że każdy inny obliczony przedział [a ', b'] zawiera prawdziwy parametr. W tym przypadku E i C są niezależne.
raegtin

2

Jest tu tyle długich wyjaśnień, że nie mam czasu ich czytać. Myślę jednak, że odpowiedź na podstawowe pytanie może być krótka i słodka. Jest to różnica między prawdopodobieństwem, które jest bezwarunkowe dla danych. Prawdopodobieństwo 1-alfa przed zebraniem dat jest prawdopodobieństwem, że dobrze zdefiniowana procedura będzie zawierać parametr. Po zebraniu danych i poznaniu określonego przedziału czasu, który został wygenerowany, przedział jest ustalony, więc ponieważ parametr jest stały, prawdopodobieństwo warunkowe wynosi 0 lub 1. Ale ponieważ nie znamy rzeczywistej wartości parametru, nawet po zebraniu danych nie wiemy, jaką to wartość.

Rozszerzenie postu przez Michaela Chernicka skopiowane komentarze z formularza:

istnieje patologiczny wyjątek od tego, który można nazwać doskonałym oszacowaniem. Załóżmy, że mamy autoregresyjny proces pierwszego rzędu podany przez X (n) = pX (n-1) + en. Jest stacjonarny, więc wiemy, że p nie jest 1 lub -1 i jest <1 w wartości bezwzględnej. Teraz en są niezależne, identycznie rozmieszczone z rozkładem mieszanym, istnieje dodatnie prawdopodobieństwo q, że en = 0

Istnieje patologiczny wyjątek, który można nazwać doskonałym oszacowaniem. Załóżmy, że mamy autoregresyjny proces pierwszego rzędu podany przez X (n) = pX (n-1) + en. Jest stacjonarny, więc wiemy, że p nie jest 1 lub -1 i jest <1 w wartości bezwzględnej.

Teraz en są niezależne, identycznie rozmieszczone z rozkładem mieszanym, istnieje prawdopodobieństwo dodatnie q, że en = 0, a przy prawdopodobieństwie 1-q ma absolutnie ciągły rozkład (powiedzmy, że gęstość nie jest zerowa w przedziale ograniczonym od 0. Wtedy zbieraj dane z szeregów czasowych kolejno i dla każdej kolejnej pary wartości oszacuj p przez X (i) / X (i-1). Teraz, gdy ei = 0, stosunek będzie równy p dokładnie.

Ponieważ q jest większe niż 0, w końcu stosunek powtórzy wartość, a ta wartość musi być dokładną wartością parametru p, ponieważ jeśli nie jest to wartość ei, która nie jest równa 0, powtórzy się z prawdopodobieństwem 0 i ei / x (i -1) się nie powtórzy.

Tak więc reguła sekwencyjnego zatrzymywania polega na próbkowaniu, aż stosunek się powtórzy dokładnie, a następnie użyj wartości powtarzanej jako oszacowania p. Ponieważ jest to dokładnie ten sam przedział, który jest konstruowany w tym oszacowaniu, ma prawdopodobieństwo 1 włączenia prawdziwego parametru. Chociaż jest to patologiczny przykład, który nie jest praktyczny, istnieją stacjonarne procesy stochastyczne o właściwościach, których wymagamy do rozkładu błędów


2
czy zamiast tego rozważasz dodanie do swojej odpowiedzi przykładu opisanego w trakcie tych kilku komentarzy?
Makro

@Michael dodam drugi komentarz Makro. Należy pamiętać, że komentarze są ogólnie uważane za sposób interakcji z innymi użytkownikami (np. Podczas proszenia o wyjaśnienia itp.), Aw każdym razie czasami są postrzegane jako „ obywatele trzeciej klasy w Stack Exchange ”. Jednak po naszej ostatniej wymianie pozwolę ci zdecydować, jak kontynuować tę serię komentarzy. Ta uwaga dotyczy innej serii komentarzy tutaj znalezionych .
chl

Nie zamieszczam komentarzy w odpowiedziach, ponieważ wydaje się, że istnieje zasada, by głosować za odpowiedziami, które zawierają wiele dyskusji, szczególnie gdy ktoś ocenia, że ​​odpowiedź tak naprawdę nie odpowiada na pytanie. Odpowiedzi mają dać odpowiedzi, a komentarze należy wpisać w komentarzach. Moje komentarze zwykle przekraczają limit znaków, więc używam kilku.
Michael Chernick

@MichaelChernick Nie ma takich zasad, dlatego zamieściłem twoje komentarze w poście.

1
@MichaelChernick, publikuję na tej stronie dość regularnie od około roku i nigdy nie słyszałem, aby ktokolwiek sugerował, że moderatorzy są opresyjni lub że zasady witryny są mylące. Problemy, na które się natknąłeś: Twoje posty są wyraźnie omówione w FAQ.
Makro

1

Dwie uwagi na temat wielu pytań i odpowiedzi, które mogą pomóc.

Część zamieszania wynika z glosowania głębszej matematyki teorii prawdopodobieństwa, która, nawiasem mówiąc, nie była oparta na solidnych podstawach matematycznych aż do około 1940 roku. Wchodzi w to, co stanowi przestrzenie próbki, przestrzenie prawdopodobieństwa itp.

Po pierwsze, stwierdziliście, że po rzucie monetą wiemy, że istnieje 0% prawdopodobieństwa, że ​​nie wyskoczyłoby do reszki, gdyby wyszło na głowę. W tym momencie mówienie o prawdopodobieństwie nie ma sensu; co się stało, i wiemy o tym. Prawdopodobieństwo dotyczy nieznanego w przyszłości, nieznanego w teraźniejszości.

Jako następstwo tego, co tak naprawdę oznacza zerowe prawdopodobieństwo, rozważ to: zakładamy, że rzetelna liczba ma prawdopodobieństwo 0,5 zbliżających się głów i 0,5 zbliżających się ogonów. Oznacza to, że ma 100% szans na pojawienie się albo głów, albo ogonów, ponieważ wyniki te są MECE (wzajemnie wykluczające się i całkowicie wyczerpujące). Ma jednak zerową zmianę w zestawianiu głów i ogonów : nasze pojęcia „głów” i „ogonów” są takie, że wykluczają się one wzajemnie. Zatem ma to zerową szansę, ponieważ jest to niemożliwe w naszym rozumieniu (lub zdefiniowaniu) „rzucania monetą”. I jest to niemożliwe przed i po rzucie.

Jako następstwo tego wszystkiego możliwe jest wszystko, co z definicji nie jest niemożliwe. W prawdziwym świecie nienawidzę, gdy prawnicy pytają „czy to możliwe, że podpisaliście ten dokument i zapomnieliście o nim?” ponieważ odpowiedź zawsze brzmi „tak” ze względu na charakter pytania. W tym przypadku odpowiedź brzmi „tak” na pytanie „czy nie jest możliwe, że zostałeś przetransportowany przez dematerializację na planetę Remulak 4 i zmuszony do zrobienia czegoś, a następnie przetransportowany z powrotem bez pamięci?”. Prawdopodobieństwo może być bardzo niskie, ale to, co nie jest niemożliwe, jest możliwe. W naszej zwykłej koncepcji prawdopodobieństwa, kiedy mówimy o rzucie monetą, może ona przynieść głowę; może pojawić się ogon; i może nawet stać na końcu lub (jakoś tak, jakbyśmy zostali wciągnięci w statek kosmiczny podczas odurzenia i zabrania na orbitę) unosić się w powietrzu na zawsze. Ale przed lub po rzucie ogony jednocześnie: są one wzajemnie wykluczającymi się wynikami w przestrzeni próbki eksperymentu (patrz „przestrzenie próbki prawdopodobieństwa” i „sigma-algebry”).

Po drugie, w całej tej filozofii bayesowskiej / częstościowej dotyczącej przedziałów ufności prawdą jest, że odnosi się ona do częstotliwości, jeśli ktoś działa jako częsty. Tak więc, gdy mówimy, że przedział ufności dla próbkowanej i oszacowanej średniej wynosi 95%, nie mówimy, że jesteśmy w 95% pewni, że „rzeczywista” wartość leży między granicami. Mówimy, że gdybyśmy mogli powtarzać ten eksperyment w kółko, w 95% przypadków stwierdzilibyśmy, że średnia rzeczywiście była między granicami. Kiedy robimy to za jednym razem, przyjmujemy skrót myślowy i mówimy „mamy 95% pewności, że mamy rację”.

Wreszcie, nie zapomnij o standardowej konfiguracji testu hipotezy opartego na eksperymencie. Jeśli chcemy wiedzieć, czy hormon wzrostu roślin przyspiesza wzrost roślin, być może najpierw określamy średnią wielkość pomidora po 6 miesiącach wzrostu. Następnie powtarzamy, ale z hormonem i uzyskujemy średni rozmiar. Nasza hipoteza zerowa jest „hormonem nie działa” i testujemy że . Ale jeśli badane rośliny są średnio większe, z 99% pewnością, oznacza to, że „zawsze będzie przypadkowa zmienność ze względu na rośliny i to, jak dokładnie ważymy, ale ilość losowości, która by to wyjaśniła, wystąpiłaby mniej niż jeden czas na sto ”.


1

Zagadnienie to można scharakteryzować jako pomieszanie prawdopodobieństwa wcześniejszego i późniejszego, a może jako niezadowolenie z nieznajomości wspólnego rozkładu niektórych zmiennych losowych.

Kondycjonowanie

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

Nieuzależnianie od dowodów oznacza ignorowanie dowodów. Możemy jednak uzależnić tylko to, co można wyrazić w modelu probabilistycznym. W naszym przykładzie z dwiema kulkami z urny nie możemy zależeć od pogody ani tego, jak się dzisiaj czujemy. Jeśli mamy powody, by sądzić, że takie dowody są istotne dla eksperymentu, musimy najpierw zmienić nasz model, aby umożliwić nam wyrażenie tego dowodu jako zdarzenia formalnego.

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

Przedział ufności

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγoznaczałoby uznanie tego dowodu i jednocześnie jego zignorowanie.

Dowiedz się więcej, wiedząc mniej

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

Jeśli powiem, że prawdopodobieństwo, że Knicks zdobył między xbar - 2sd (x) a xbar + 2sd (x) wynosi około 0,95 w danym meczu w przeszłości, jest to rozsądne stwierdzenie, biorąc pod uwagę pewne szczególne założenie dystrybucyjne dotyczące rozkładu wyników koszykówki . Jeśli zbieram dane o wynikach danej próby gier i obliczam ten przedział, prawdopodobieństwo, że uzyskali wyniki w tym przedziale w danym dniu w przeszłości, wynosi wyraźnie zero lub jeden, i możesz przejrzeć wynik gry, aby się dowiedzieć. Jedyne pojęcie, że utrzymuje niezerowe lub jedno prawdopodobieństwo dla częstego, pochodzi z powtarzania próbkowania, a realizacja oszacowania przedziału dla konkretnej próbki jest magicznym punktem, w którym to się stało lub nie podała oszacowania przedziału dla tej próbki . To nie jest miejsce, w którym wpisujesz hasło,

To właśnie argumentuje Dikran powyżej i głosowałem za jego odpowiedzią. Punktem, w którym powtarzane próbki nie są brane pod uwagę, jest punkt w paradygmacie częstych, w którym niedyskretne prawdopodobieństwo staje się nieosiągalne , nie wtedy, gdy wpiszesz hasło jak w powyższym przykładzie lub gdy przejdziesz do wyniku w moim przykładzie Gra Knicks, ale moment, w którym liczba próbek = 1.


0

Modelowanie

S=(Ω,Σ,P)EΣP(E)ESS może być domyślnie podana przez jedną lub więcej zmiennych losowych i ich wspólny rozkład.

Krok (1) może dać trochę swobody. Właściwość modelowania można czasem przetestować, porównując prawdopodobieństwo pewnych zdarzeń z tym, czego byśmy intuicyjnie oczekiwali. W szczególności przyjrzenie się pewnym marginalnym lub warunkowym prawdopodobieństwom może pomóc zorientować się, jak właściwe jest modelowanie.

X1,,XnDist(θ)θR

Estymator przedziału ufności

γL.RRnP.(L.(X)θR(X))γX=(X1,,Xn) ”, aby podkreślić, że liczą się funkcje i ich właściwości funkcjonalne; L.(X)R(X)xRnL.(x)θR(x)

Preferencje

γ1γ2)γ1<γ2)Wyższe prawdopodobieństwo wygranej w losowaniu niż w przypadku pierwszego losowania. Preferencje dotyczące różnych obserwacji (dwa bilety w tym przykładzie) oparte na probabilistycznych właściwościach losowych procesów generujących obserwacje są w porządku. Pamiętaj, że nie twierdzimy, że którykolwiek z biletów ma większe szanse na wygraną. Jeśli kiedykolwiek tak mówimy, to z „prawdopodobieństwem” w znaczeniu potocznym, co może znaczyć wszystko, więc najlepiej tutaj unikać.

0,95

Przykład z prostym przeorem

θP.(θ=0)=P.(θ=1)=1/2)ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ , ale może być czymś zupełnie innym.

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

Gdybyśmy mogli powiedzieć „prawdopodobieństwo, że prawdziwy parametr leży w tym przedziale ufności”, nie wzięlibyśmy pod uwagę wielkości próbki. Bez względu na to, jak duża jest próbka, o ile średnia jest taka sama, przedział ufności byłby równie szeroki. Ale kiedy mówimy „jeśli powtórzę to 100 razy, to oczekiwałbym, że w 95 przypadkach prawdziwy parametr znajdzie się w przedziale czasowym”, bierzemy pod uwagę wielkość próbki i to, jak pewne jest nasze oszacowanie . Im większy rozmiar próbki, tym mniejsza wariancja będzie miała średnia wartość szacunkowa. Nie zmieni się to tak bardzo, a kiedy powtarzamy procedurę 100 razy, nie potrzebujemy dużego odstępu, aby upewnić się, że w 95 przypadkach prawdziwy parametr znajduje się w tym przedziale.


Pamiętaj, że przedział ufności jest pojęciem częstym.
Michael Chernick
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.