Zakład Blackwella


12

Czytałem o paradoksie zakładów Blackwella na szafie Futility . Oto podsumowanie: otrzymasz dwie koperty, i . Koperty zawierają losową kwotę pieniędzy, ale nie wiesz nic o dystrybucji pieniędzy. Otworzysz jeden, sprawdzisz ile pieniędzy tam jest ( ) i będziesz musiał wybrać: weź kopertę czy ?E yExEyxExEy

Futility Closet odnosi się do matematyka Leonarda Wapnera: „Niespodziewanie jest coś, co możesz zrobić, bez otwierania drugiej koperty, aby dać sobie większą niż szansę na poprawne wykonanie”.

Pomysł, który wydaje mi się niewłaściwy, jest następujący: wybierz liczbę losową . Jeśli , weź . Jeśli , wybierz .dd<xExd>xEy

Wapner: „Jeśli d mieści się w przedziale od x do y, wówczas Twoja prognoza (jak wskazano przez d) jest gwarantowana. Załóżmy, że dzieje się to z prawdopodobieństwem p. Jeśli d spadnie mniej niż zarówno x, jak i y, twoje przewidywania będą poprawne tylko w przypadku, gdy wybrana przez ciebie liczba x jest większa z dwóch. Jest na to 50 procent szans. Podobnie, jeśli d jest większe niż obie liczby, twoje prognozy będą poprawne tylko wtedy, gdy wybrana liczba będzie mniejsza z dwóch. Dzieje się tak również z 50-procentowym prawdopodobieństwem. ”

Jeśli prawdopodobieństwo, że jest w jest większe od zera, to średni sukces tej metody wynosi . Oznaczałoby to, że obserwując niepowiązaną zmienną losową daje nam dodatkowe informacje.d[x,y]12+p2

Myślę, że to wszystko źle i że problem polega na wybraniu losowej liczby całkowitej. Co to znaczy? Jakaś liczba całkowita? W takim przypadku, prawdopodobieństwo , że leży pomiędzy i jest równa zero, ponieważ zarówno i są ograniczone.pdxyxy

Jeśli mówimy, że istnieje limit maksymalnej kwoty pieniędzy, powiedzmy , lub przynajmniej wybieramy d spośród , to przepis sprowadza się do trywialnych porad dotyczących wyboru jeśli i wybranie jeśli .M1...MEyx<M/2Exx>M/2

Czy coś tu brakuje?

EDYTOWAĆ

OK, teraz zaczynam rozumieć, skąd bierze się pozorny paradoks. Wydawało mi się niemożliwe, aby niepowiązana zmienna losowa mogła dostarczyć dodatkowych informacji.

Pamiętaj jednak, że musimy świadomie wybrać rozkład d . Na przykład wybierz granice dla rozkładu jednolitego lub rozkładu Poissionian itp. Oczywiście, jeśli gramy dla orzeszków ziemnych, i wybraliśmy rozkład d, aby był jednolity na dolarów, . To ostatnie prawdopodobieństwo będzie zależeć przede wszystkim od naszej oceny, co może być w kopertach.λ[109,2109]P(d(x,y))=0

Innymi słowy, jeśli technika działa, wówczas narusza się założenie, że nie wiemy, jaki jest rozkład pieniędzy w kopertach (jak wybrano ilość pieniędzy na koperty). Jeśli jednak naprawdę nie wiemy, co jest w kopertach, to w najgorszym przypadku niczego nie tracimy, stosując je.

EDYCJA 2

Kolejna myśl. Biorąc pod uwagę , wybierzmy do rysowania ciągły nieujemny rozkład taki, że . Możemy to zrobić, czy mam rację? Postępujemy zgodnie z instrukcją - jeśli , zachowamy kopertę, jeśli , zmienimy kopertę. Rozumowanie się nie zmienia, w zależności od tego, jak wybieramy rozkład, może być tak, że (czy się mylę?).xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Jednak biorąc pod uwagę sposób, w jaki wybraliśmy rozkład, to, co teraz robimy, jest równoważne rzutowi monetą. Rzucamy monetą, a jeśli są to głowy, zmieniamy koperty, jeśli są to ogony, trzymamy się koperty, którą trzymamy. Gdzie się mylę?

EDYCJA 3 :

OK, rozumiem teraz. Jeśli opieramy funkcję prawdopodobieństwa na (np. Próbkujemy z jednorodnego rozkładu w zakresie , to prawdopodobieństwo nie jest niezależne od .dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Tak więc, jeśli (z prawdopodobieństwem ), zgadywanie jest zawsze prawidłowe, jak poprzednio. Jeśli jest jednak niższą liczbą, a , to ma większą szansę być niższą niż niż wyższą niż , więc jesteśmy nastawieni na błędną decyzję. To samo rozumowanie ma zastosowanie, gdy jest wyższą z dwóch liczb.d(x,y)pxd(x,y)dxxx

Oznacza to, że musimy wybrać proces rysowania niezależnie od . Innymi słowy, musimy uczynić przypuszczenie o parametrach dystrybucji, z której i są sporządzone; najgorsze, co się dzieje, to to, że wciąż zgadujemy losowo, ale najlepsze, co się dzieje, to to, że nasze domysły były prawidłowe - i wtedy mamy przewagę. Jak powinno to być lepsze niż zgadywanie „xiy będzie, moim zdaniem, co najmniej 1 $ , ale co najwyżej 10 $ , więc jeśli , zachowamy to, a jeśli nie, wymienimy to” widzieć.dxxyx>5

Zostałem wprowadzony w błąd przez pop-sci sformułowanie problemu w książce Wapnera ( Nieoczekiwane oczekiwania: ciekawostki matematycznej kryształowej kuli ), która stwierdza

„W jakikolwiek sposób wybierz losową liczbę całkowitą dodatnią” (Wapner sugeruje rozkład geometryczny - rzucanie monetami aż do pojawienia się pierwszych głów, powtarzanie procesu, jeśli ) „Jeśli zgadnij wyżej i jeśli zgadnij niżej. (...) Zgadniesz poprawnie więcej niż 50 procent czasu, ponieważ wskazuje poprawnie więcej niż 50 procent czasu! "d=xd>xd<xd


1

2
Jest to całkiem odmienne od problemu dwóch kopert w tym sensie, że: (1) argument podany za zamianę problemu dwóch kopert jest błędny, wadę argumentu można zobaczyć, dodając wcześniejszy Bayesian, podczas gdy (2) argument podana przez Wapnera dla zakładu Blackwell jest poprawna.
Matthew Gunn

Jeśli kwoty pieniędzy w kopertach są dowolnymi elementami zestawu liczb S, wystarczającym i niezbędnym warunkiem działania strategii Wapnera jest CDF o liczbie, którą wybrałeś, ściśle zwiększając S.
Przywróć Monikę

OK, wciąż czegoś brakuje - proszę zobaczyć moją EDYCJĘ 2, ale wydaje mi się, że moglibyśmy rzucić monetą i nadal powinna działać, zgodnie z uzasadnieniem. Gdzie się mylę?
styczeń

Odpowiedzi:


8

Jest to szerzej znane jako problem dwóch kopert . Najczęściej kwoty są podane jako i 2 A, ale nie jest to wymagane.A2A

Kilka punktów:

  1. Nie możesz wybrać losowej liczby całkowitej jednorodnie *, ale cytowana część nie wydaje się wymagać, aby była jednolita. Wybierz rozkład - nie ma znaczenia, co to jest dla argumentu - pod warunkiem, że istnieje prawdopodobieństwo przekroczenia dowolnej skończonej wartości.

  2. Nie ma sensu wybierać liczby całkowitej z regułą cytowanej decyzji, ponieważ pieniądze są dyskretne, co oznacza, że ​​istnieje niezerowa szansa d = x i nie ma nic wymienionego dla tego przypadku. (Lub alternatywnie, aby zmodyfikować regułę, aby określić, co robić, gdy są równe)d d=x

  3. Pomijając to, możesz wybrać z jakiegoś nieujemnego ciągłego rozkładu - wtedy nie musimy się martwić o równość.d

* (nie można również wybrać jednoznacznie nieujemnej liczby całkowitej ani jednoznacznie dodatniej liczby całkowitej)


Jeśli mówimy, że istnieje limit maksymalnej kwoty pieniędzy, powiedzmy , lub przynajmniej wybieramy d spośród 1 ... M , to przepis sprowadza się do trywialnych porad dotyczących wyboru E y, jeśli x < M / 2 i wybierając E x, jeśli x > M / 2Md1...MEyx<M/2Exx>M/2

Jeśli okaże się, że losowy rozkład, z którego wybrano obejmuje M / 2, powinno to zadziałać (dać ci więcej niż 50-50); jeśli rozkład utknie w połowie, nie będzie.xM/2

Jednak wersje tej gry, w której po raz pierwszy zostałem przedstawiony, to to, że kopertę przedstawia ktoś, kto (prawdopodobnie) stara się zminimalizować twoje dochody z gry. Strategia polegająca na użyciu dystrybucji do podjęcia decyzji o przejściu na inną kopertę nadal będzie działać w tym przypadku.


dP(d<x)=P(d>x)

P(d<x)=P(d>x)

d

czyniąc strategię funkcją x, nie dajesz sobie przewagi, dokonując właściwego wyboru, gdy d jest między xiy - określasz swoją drogę do wygrania gry. Jeśli
podany

dxP(d(x,y))>0x(1,2x)d(x,y)
styczeń

7

Argument Wapnera jest poprawny!

Niektóre komentarze:

  • x<dd
  • d
  • W niektórych sytuacjach (np. Gdy im więcej obserwujesz, tym bardziej prawdopodobne jest, że masz dużą kopertę), strategia odcięcia jest nawet optymalna.
  • W bardziej ogólnym ustawieniu bayesowskim możesz zrobić coś lepszego niż prosta strategia odcięcia dla wielu priorów.

Powiązany, ale inny problem:

Jak wspomnieli niektórzy @Glen_b i @whuber, istnieje powiązana łamigłówka zwana Problemem Dwóch Kopert, w której podawany jest błędny argument za zawsze zmienianiem kopert, a wadę argumentu można zobaczyć, przyjmując podejście bayesowskie i dodając wcześniejsze przekonania ponad zawartość dwóch kopert.

W pewnym sensie opisana tutaj łamigłówka jest raczej inna. Argument Wapnera jest poprawny!


1
OK, teraz widzę, skąd bierze się paradoks. Lub, mówiąc konkretnie, gdzie dodatkowe informacje wpływają do systemu. Wybierając świadomie rozkład d , korzystamy z naszej a priori wiedzy o tym, gdzie mniej więcej powinny znajdować się kwoty w obu kopertach. W najgorszym przypadku nasza wiedza jest bezużyteczna, ale metoda gwarantuje, że korzystanie z niej nie będzie niekorzystne.
styczeń

Po namyśle, ja nadal nie rozumiem - zobacz EDIT 2.
Styczeń

1020dP(x<d)=P(x>d)

d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9

xyxdd

0

Byłem tym zaintrygowany i przyjąłem pragmatyczne podejście do zabawy z nim w Excelu.

Wygenerowałem trzy liczby losowe dla x, yid w zakresie 1-100. Następnie dokonałem porównania między di x oraz między x i y i spojrzałem na wynik, dobry lub zły.

Zrobiłem to 500 razy i powtórzyłem to kilka razy i regularnie otrzymałem prawidłową odpowiedź na około 330 z 500, zgodnie z przewidywaniami.

Następnie zwiększyłem zakres d do 1-10000, a poprawna odpowiedź spadła do około 260 na 500 przebiegów.

Tak więc wybór d zależy od oczekiwanych wartości xiy.

Kok


0

Myślę, że pozornym paradoksem z rozszerzeniem Wapnera równania p + (1-p) / 2 jest to, że zakłada on, że (1-p) / 2> 0. Dla wielu zakresów d wartość ta wynosi 0.

Na przykład: dowolne d wybrane z rozkładu symetrycznego wyśrodkowanego na wartości w otwartej obwiedni daje prawdopodobieństwo błędnej 1/2 i poprawnej 1/2.

Jakikolwiek asymetrycznie wybrany rozkład wydaje się wpływać na niewłaściwy wybór 1/2 czasu.

Czy jest więc sposób na wybranie zakresu i rozkładu dla d, aby to równanie było ważne?

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.