TL; DR: Jeśli nie przypuszczasz, że ludzie są nieuzasadnie źle oceniając kolor samochodu lub że niebieskie samochody są nieuzasadnione rzadko, duża liczba osób w twoim przykładzie oznacza prawdopodobieństwo, że samochód jest niebieski, wynosi w zasadzie 100%.
Matthew Drury już udzielił prawidłowej odpowiedzi, ale chciałbym dodać do tego kilka przykładów liczbowych, ponieważ wybraliście swoje liczby tak, aby uzyskać całkiem podobne odpowiedzi dla szerokiego zakresu różnych ustawień parametrów. Załóżmy na przykład, jak powiedzieliśmy w jednym ze swoich komentarzy, że prawdopodobieństwo, że ludzie prawidłowo ocenią kolor samochodu, wynosi 0,9. To znaczy:
a także
p ( powiedzmy, że nie jest niebieski | samochód nie jest niebieski ) = 0,9 = 1 - p ( powiedz, że jest niebieski | samochód nie jest niebieski )
p ( powiedzmy, że to niebieski | samochód jest niebieski ) = 0,9 = 1 - p ( powiedzmy, że to nie niebieski | samochód jest niebieski )
p ( powiedzmy, że to nie niebieski | samochód nie jest niebieski ) = 0,9 = 1 - p ( powiedzmy, że to niebieski | samochód nie jest niebieski )
Po zdefiniowaniu tego pozostaje nam jeszcze jedna decyzja: jakie jest wcześniejsze prawdopodobieństwo, że samochód jest niebieski? Wybierzmy bardzo małe prawdopodobieństwo, aby zobaczyć, co się stanie, i powiedzmy, że , tj. Tylko 0,1% wszystkich samochodów ma kolor niebieski. Następnie prawdopodobieństwo tylne, że samochód jest niebieski, można obliczyć jako:p ( samochód jest niebieski ) = 0,001
p ( samochód jest niebieski | odpowiedzi )= p ( odpowiedzi | samochód jest niebieski )p ( samochód jest niebieski )p ( odpowiedzi | samochód jest niebieski )p ( samochód jest niebieski ) + p ( odpowiedzi | samochód nie jest niebieski )p ( samochód nie jest niebieski )= 0,9900× 0,1100× 0,0010,9900× 0,1100× 0,001 + 0,1900× 0,9100× 0,999
Jeśli spojrzymy na mianownik, jasne jest, że drugi wyraz w tej sumie będzie nieistotny, ponieważ względna wielkość wyrazów w sumie jest zdominowana przez stosunek do , co jest rzędu . I rzeczywiście, jeśli wykonasz te obliczenia na komputerze (uważając, aby uniknąć problemów z niedopełnieniem numerycznym), otrzymasz odpowiedź równą 1 (z dokładnością do maszyny). 0,1 900 10 580,99000,19001058
Powody, dla których wcześniejsze prawdopodobieństwa tak naprawdę nie mają tutaj większego znaczenia, to fakt, że masz tyle dowodów na jedną możliwość (samochód jest niebieski) w porównaniu z drugą. Można to określić ilościowo za pomocą współczynnika wiarygodności , który możemy obliczyć jako:
p ( odpowiedzi | samochód jest niebieski )p ( odpowiedzi | samochód nie jest niebieski )= 0,9900× 0,11000,1900× 0,9100≈ 10763
Tak więc, zanim jeszcze weźmiemy pod uwagę wcześniejsze prawdopodobieństwa, dowody sugerują, że jedna opcja jest już astronomicznie bardziej prawdopodobna niż druga, a zanim coś zmieni, niebieskie samochody musiałyby być nierozsądnie, głupio rzadkie (tak rzadkie, że spodziewalibyśmy się znajdź 0 niebieskich samochodów na ziemi).
A co jeśli zmienimy, jak dokładni ludzie opisują kolor samochodu? Oczywiście moglibyśmy doprowadzić to do skrajności i powiedzieć, że robią to dobrze tylko w 50% przypadków, co nie jest lepsze niż rzut monetą. W tym przypadku prawdopodobieństwo tylne, że samochód jest niebieski, jest po prostu równe prawdopodobieństwu wcześniejszemu, ponieważ odpowiedzi ludzi nic nam nie mówiły. Ale z pewnością ludzie robią co najmniej trochę lepiej, a nawet jeśli mówimy, że ludzie są dokładni tylko w 51% przypadków, współczynnik prawdopodobieństwa nadal działa, tak że jest to około razy większe prawdopodobieństwo dla samochodu być niebieskim.1013
Wszystko to wynika z dość dużych liczb, które wybrałeś w przykładzie. Gdyby 9/10 osób twierdziło, że samochód jest niebieski, byłaby to zupełnie inna historia, mimo że ten sam stosunek ludzi był w jednym obozie w porównaniu do drugiego. Ponieważ dowody statystyczne nie zależą od tego stosunku, ale raczej od numerycznej różnicy między przeciwnymi frakcjami. W rzeczywistości, w stosunku prawdopodobieństwa (który kwantyfikuje dowody), 100 osób, które mówią, że samochód nie jest niebieski, dokładnie anuluje 100 z 900 osób, które twierdzą, że jest niebieski, więc jest tak, jakby wszyscy zgodzili się na 800 osób było niebieskie. I to oczywiście dość wyraźne dowody.
(Edycja: Jak zauważył Silverfish , założenia, które tu poczyniłem, faktycznie sugerują, że ilekroć ktoś nieprawidłowo opisuje nie niebieski samochód, domyślnie powie, że jest niebieski. Nie jest to oczywiście realistyczne, ponieważ mogliby naprawdę powiedzieć dowolny kolor i przez pewien czas będą mówić o kolorze niebieskim. Nie ma to jednak znaczenia dla wniosków, ponieważ im mniej prawdopodobne jest, że ludzie pomylą niebieski samochód z niebieskim, tym silniejsze dowody, że jest niebieski, kiedy to mówią. jeśli więc cokolwiek, liczby podane powyżej są w rzeczywistości tylko dolną granicą pro-niebieskich dowodów).