Zacznijmy od zwykłego problemu Monty Hall. Troje drzwi, za jednym z nich jest samochód. Pozostali dwaj mają za sobą kozy. Wybierasz drzwi numer 1, a Monty otwiera drzwi numer 2, aby pokazać ci, że za tym stoi koza. Czy powinieneś zmienić zgadywanie na drzwi numer 3? (Pamiętaj, że liczby, których używamy w odniesieniu do każdych drzwi, nie mają tutaj znaczenia. Mogliśmy wybrać dowolne zamówienie, a problem jest taki sam, więc w celu uproszczenia rzeczy możemy po prostu użyć tej numeracji.)
Oczywiście odpowiedź brzmi „tak”, jak już wiesz, ale przejdźmy do obliczeń, aby zobaczyć, jak później się zmienią. Niech do będzie wskaźnikiem drzwi z samochodem, a M. oznacza zdarzenie, w którym Monty ujawnił, że drzwi 2 mają kozę. Musimy obliczyć p ( C= 3 | M.) . Jeśli ta jest większa niż 1 / 2 , musimy włączyć nasze przypuszczenie do tych drzwi (ponieważ mamy tylko dwie pozostałe opcje). Prawdopodobieństwo to daje:
p ( C= 3 | M.) = p ( M| do= 3 )p ( M| do= 1 ) + p ( M| do= 2 ) + p ( M| do= 3 )
(Jest to tylko zastosowanie reguły Bayesa z płaską wcześniejszą literą na
do)
p ( M| do= 3 )równa się 1: jeśli samochód znajduje się za drzwiami numer 3, to Monty nie miał innego wyjścia, jak otworzyć drzwi numer 2 tak jak on.
p ( M| do= 1 )wynosi
1 / 2 : jeśli samochód znajduje się za drzwiami 1, wtedy Monty miał wybór otwarcia jednego z pozostałych drzwi, 2 lub 3.
p ( M| do= 2 ) wynosi 0, ponieważ Monty nigdy nie otwiera drzwi, o których wie, że ma samochód. Wypełniając te liczby, otrzymujemy:
p ( C= 3 | M.) = 10,5 + 0 + 1= 23)
Z tego znamy wynik.
Rozważmy teraz przypadek, w którym Monty nie ma doskonałej wiedzy o tym, które drzwi mają samochód. Kiedy więc wybierze drzwi (które będziemy dalej nazywać drzwiami nr 2), może przypadkowo wybrać drzwi z samochodem, ponieważ uważa, że ma kozę. Niech do′ za drzwi, które Monty myśli ma samochód i niech p ( C′| do) jest prawdopodobieństwo, że on myśli, że samochód jest w pewnym miejscu, uzależnione od jego rzeczywistej lokalizacji. Zakładamy, że jest to opisane przez pojedynczy parametr q który określa jego dokładność, na przykład: p ( C′= x | do= x ) = q= 1 - p ( C′≠ x | do= x ) . Jeśliq jest równe 1, Monty ma zawsze rację. Jeśliq wynosi 0, Monty zawsze się myli (co nadal ma charakter informacyjny). Jeśliq jest1 / 3 , informacja Monty ma lepszego niż losowej zgadywanie jest.
Oznacza to, że mamy teraz:
p ( M| do= 3 ) = ∑xp ( M| do′= x ) p ( C′= x | do= 3 )
= p ( M| do′= 1 ) p ( C′= 1 | do= 3 ) + p ( M| do′= 2 ) p ( C′= 2 | do= 3 )+ p ( M| do′= 3 ) p ( C′= 3 | do= 3 )
= 12)× 12)(1−q)+0×12(1−q)+1×q
= 14- q4+ q= 34q+ 14
To znaczy, jeśli samochód był naprawdę za drzwiami 3, istniałyby trzy możliwości, które mogły się rozegrać: (1) Monty myślał, że jest za 1, (2) Monty myślał 2 lub (3) Monty myślał 3. Ostatnia opcja występuje z prawdopodobieństwem q (jak często robi to dobrze), pozostałe dwa dzielą prawdopodobieństwo, że pomyli się ( 1 - q) między nimi. A zatem, biorąc pod uwagę każdy scenariusz, jakie jest prawdopodobieństwo, że zdecydowałby się wskazać drzwi numer 2, tak jak to zrobił? Gdyby myślał, że samochód jest za 1, prawdopodobieństwo to byłoby 1 na 2, ponieważ mógł wybrać 2 lub 3. Gdyby myślał, że jest za 2, nigdy nie wybrałby wskazania na 2. Gdyby myślał, że jest za 3 , zawsze wybrałby 2.
Możemy podobnie obliczyć pozostałe prawdopodobieństwa:
p ( M| do= 1 ) = ∑xp ( M| do′=x)p(C′=x|C=1)
=12×q+1×12(1−q)
=q2+12−q2=12
p(M|C=2)=∑xp(M|C′=x)p(C′=x|C=2)
=12×12(1−q)+1×12(1−q)
=34−34q
Wypełniając to wszystko, otrzymujemy:
p(C=3|M)=34q+1412+34−34q+34q+14
=0.75q+0.251.5
W ramach kontroli poczytalności, gdy
q=1, widzimy, że odzyskujemy naszą pierwotną odpowiedź
11.5=23 .
Kiedy więc powinniśmy zmienić? Dla uproszczenia założę, że nie wolno nam przejść do drzwi wskazanych przez Monty. I tak długo, jak Monty jest co najmniej w pewnym stopniu poprawny (bardziej niż przypadkowe zgadywanie), drzwi, na które wskazuje, zawsze będą mniej prawdopodobne niż inni, aby mieć samochód, więc nie jest to realna opcja i tak dla nas. Musimy więc wziąć pod uwagę tylko prawdopodobieństwa drzwi 1 i 3. Ale chociaż samochód był za drzwiami 2, to teraz ta opcja ma niezerowe prawdopodobieństwo, więc nie jest już tak, że powinniśmy zmienić gdy p(C=3|M)>0.5 , ale raczej powinniśmy przełączyć, gdy p(C=3|M)>p(C=1|M) (which used to be the same thing). This probability is given by p(C=1|M)=0.51.5=13, same as in the original Monty Hall problem. (This makes sense since Monty can never point towards door 1, regardless of what's behind it, and so he cannot provide information about that door. Rather, when his accuracy drops below 100%, the effect is that some probability "leaks" towards door 2 actually having the car.) So, we need to find q such that p(C=3|M)>13:
0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(Which, when
q=1, gives an answer of 2, matching the fact that we double our chances of winning by switching doors in the original Monty Hall problem.)
Edit: People were asking about the scenario where we are allowed to switch to the door that Monty points to, which becomes advantageous when q<13, i.e. when Monty is a (somewhat) reliable "liar". In the most extreme scenario, when q=0, this means the door Monty thinks has the car actually for sure has a goat. Note, though, that the remaining two doors could still have either a car or a goat.
The benefit of switching to door 2 is given by:
p(C=2|M)p(C=1|M)=0.75−0.75q1.513=1.5−1.5q
Which is only larger than 1 (and thus worth switching to that door) if
1.5q<0.5, i.e. if
q<13, which we already established was the tipping point. Interestingly, the maximum possible benefit for switching to door 2, when
q=0, is only 1.5, as compared to a doubling of your winning odds in the original Monty Hall problem (when
q=1).
The general solution is given by combining these two switching strategies: when q>13, you always switch to door 3; otherwise, switch to door 2.