Paradoks kopert

Istnieją dwie koperty. Jeden zawiera pieniędzy, a drugi zawiera ilość pieniędzy. Dokładna ilość „ ” nie jest mi znana, ale znam powyższe. Wybieram jedną kopertę i otwieram. Widzę w nim pieniądze, oczywiście gdzie . $x$ $2x$ $x$ $y$ $y \in \{x, 2x\}$

Teraz zaproponowano mi zachowanie lub zmianę kopert.

Oczekiwana wartość przełączenia to . Oczekiwana wartość utrzymania mojej koperty wynosi . $(\frac{1}{2} \cdot 2y + \frac{1}{2} \cdot \frac{1}{2}y) = \frac{5}{4}y$ $y$

Wydaje się, że zawsze powinienem zmieniać koperty. Moje dwa pytania:

Czy to rozumowanie jest prawidłowe?

Jest to inaczej, jeśli nie wolno mi, aby otworzyć kopertę i zobaczyć ilość pieniędzy, a potem mam możliwość, aby przełączyć się w nieskończoność? $y$

microeconomics expected-utility

— Kawaleria Kitsune
źródło

Powiązane: en.wikipedia.org/wiki/Two_envelopes_problem

— Herr K.

Nie możesz po prostu przyjąć oczekiwań, powinieneś zacząć od przekonań na temat x i zaktualizować swoje przekonania zgodnie z zasadą Bayesa. Gdy zobaczysz y, twoje przekonania o tym, którą kopertę otworzyłeś, ulegną zmianie.

— HRSE

Powiedzmy, że x jest równomiernie rozłożone między 0 a . Co wtedy

\infty

$\infty$

— Kawaleria Kitsune

@KitsuneCavalry Nie ma takiej dystrybucji. (Proszę o przesłanie mi programu generującego taki rozkład.) W rzeczywistości nie ma rozdzielczości, która generowałaby złe wierzenia podane w twoim pytaniu dla wszystkich wartości . W linku Herr K. wyjaśniono to w en.wikipedia.org/wiki/…

y

$y$

— Giskard

@Kitsune Cavalry Jednolity rozkład w połowie linii (lub całej linii) jest dobrze znanym niewłaściwym wcześniej w statystykach bayesowskich, sprawdź smak stats.stackexchange.com/a/97790/28746 lub stats.stackexchange.com/a/ 35794/28746

— Alecos Papadopoulos

Oto podejście oparte na „oczekiwanej maksymalizacji użyteczności / teorii gier” (z odrobiną prawdopodobieństwa set-teoretycznego). W takich ramach odpowiedzi wydają się jasne.

LOKAL

Powiedziano nam z absolutną uczciwością, że dla ściśle dodatniej kwoty pieniężnej dwa następujące bilety zostały umieszczone w pudełku: z przypisanym numerem identyfikacyjnym i z przypisanym numerem identyfikacyjnym $x$ $\{A=x, B= 2x\}$ $1$ $\{A=2x, B= x\}$ $0$ . Następnie czerpać z Bernoulliego zmiennej losowej został wykonany, oraz w oparciu o wynik i zdarzenia, które wystąpiło kwoty i umieszczano w kopertach i . Nie powiedziano nam, jaka jest wartość ani jaka kwota trafiła do której koperty. $(p=0.5)$ $x$ $2x$ $A$ $B$ $x$

Pierwszy przypadek: wybierz kopertę z opcją przełączania bez otwierania

Pierwszą kwestią jest to, jak wybrać kopertę ? Ma to związek z preferencjami. Załóżmy więc , że oczekujemy maksymalizatorów użyteczności z funkcją użyteczności . $u()$

Możemy tutaj modelować strukturę probabilistyczną, biorąc pod uwagę dwie dychotomiczne zmienne losowe, i reprezentujące obwiednie oraz ich ilość. Obsługa każdego z nich to . Ale nie są niezależni. Musimy więc zacząć od wspólnej dystrybucji. W postaci tabeli łączny rozkład i odpowiadające mu rozkłady krańcowe to $A$ $B$ $\{x, 2x\}$

\begin{array}{rr} A / B \to & x & 2 x & Marg A \\ x & 0 & 0.5 & 0.5 \\ 2 x & 0.5 & 0 & 0.5 \\ Marg B & 0.5 & 0.5 & 1.00 \end{array}

$\begin{array}{| r | r | } \hline \text{A} \;/ \;\;\text{B} \rightarrow & x & 2x & \text {Marg A} \\ \hline \hline x & 0 & 0.5 & 0.5\\ \hline 2x & 0.5 & 0 & 0.5 \\ \hline \text{Marg B} & 0.5 & 0.5 & 1.00 \\ \hline \end{array}$

To mówi nam, że i mają identyczne rozkłady krańcowe. $A$ $B$

Oznacza to jednak, że nie ma znaczenia, w jaki sposób wybieramy koperty, ponieważ zawsze otrzymamy taką samą oczekiwaną użyteczność ,

0.5 \cdot u (x) + 0.5 \cdot u (2 x)

$0.5 \cdot u(x) + 0.5\cdot u(2x)$

Mamy tu do czynienia z hazardem złożonym (jak wybrać kopertę) nad dwoma identycznymi hazardami (każda koperta). Możemy wybrać z prawdopodobieństwem $A$ $1$ , lub dowolną wartością pośrednią (i komplementarnie dla ). To nie ma znaczenia Zawsze otrzymamy taką samą oczekiwaną użyteczność. Pamiętaj, że nasze podejście do ryzyka nie odgrywa tutaj żadnej roli. $0$ $B$

Wybieramy więc kopertę, powiedzmy , i patrzymy na nią. Jaka jest teraz nasza oczekiwana użyteczność? Dokładnie tak samo jak przed wyborem . Jakiekolwiek wybranie koperty nie wpływa na prawdopodobieństwo tego, co jest w środku. $A$

Możemy się zmienić. Powiedzmy, że tak, a teraz trzymamy kopertę $B$ . Jaka jest teraz oczekiwana użyteczność? Dokładnie tak samo jak poprzednio .

Są to dla nas dwa możliwe stany świata: wybierz $A$ lub wybierz . Niezależnie od wyboru, oba stany świata oznaczają tę samą wartość dla naszej wybranej / zakładanej siły napędowej (tj. Maksymalizują oczekiwaną użyteczność). $B$

Więc tutaj jesteśmy obojętni na zamianę. , a tak naprawdę moglibyśmy również losowo.

2. PRZYPADEK: OTWARCIE KOPERTY z opcją przełączania po

Załóżmy teraz, że wybraliśmy , otworzyliśmy go i znaleźliśmy wewnątrz kwoty $A$ $y \in \{x, 2x\}$ . Czy to coś zmienia?

Zobaczmy. Zastanawiam się co jest

P (A = x ∣ A \in {x, 2 x}) = ?

$P(A = x \mid A \in \{x, 2x\}) = ?$

Cóż, to przestrzeń próbki, na której zdefiniowana jest zmienna losowaUwarunkowanie całej przestrzeni próbki, tj. Trywialnej sigma-algebry, nie wpływa ani na prawdopodobieństwa, ani na oczekiwane wartości. To tak, jakbyśmy się zastanawiali „jaka jest wartość jeśli wiemy, że wszystkie możliwe wartości mogły zostać zrealizowane?” Nie uzyskano żadnej skutecznej wiedzy, dlatego wciąż jesteśmy w oryginalnej strukturze probabilistycznej. $\{x, 2x\}$ $A$ $A$

Ale zastanawiam się też, co to jest

P (B = x ∣ A \in {x, 2 x}) = ?

$P(B = x \mid A \in \{x, 2x\}) = ?$

Instrukcja warunkowa, poprawnie postrzegana jako sigma-algebra wygenerowana przez zdarzenie , jest całą przestrzenią próbki produktu, na której losowy wektor został zdefiniowany. Z powyższej tabeli rozkładu połączeń widzimy, że alokacja prawdopodobieństwa alokacji jest równoważna alokacji prawdopodobieństwa marginesów (kwalifikacja „prawie na pewno” ze względu na obecność dwóch zdarzeń o wartości zero). Więc tutaj również zasadniczo warunkujemy prawdopodobieństwa dla całej przestrzeni próbki. Wynika z tego, że nasze działanie mające na celu otwarcie koperty nie wpłynęło na strukturę probabilistyczną dla $\big \{A \in \{x, 2x\}\big\}$ $(A,B)$ $B$ $B$ również.

Wprowadź teorię gry wraz z podejmowaniem decyzji. Otworzyliśmy kopertę i musimy zdecydować, czy zmienimy, czy nie. Jeśli się nie przełączymy, otrzymamy narzędzie $u(y)$ . Jeśli zmienimy się, będziemy w następujących dwóch możliwych stanach świata

y = x, u (A) = u (x) ⟹ u (B) = u (2 x)

$y = x, u(A) = u(x) \implies u(B) = u(2x)$

y = 2 x, u (A) = u (2 x) ⟹ u (B) = u (x)

$y = 2x, u(A) = u(2x)\implies u(B) = u(x)$

Nie wiemy, który stan faktycznie się utrzymuje, ale z powyższej dyskusji wiemy, że każde ma prawdopodobieństwo $p=0.5$ istnienia.

Możemy to modelować jako grę, w której naszym przeciwnikiem jest „natura” i gdzie wiemy, że natura gra z pewnością losową strategią : przy a przy , $p=0.5$ $y=x$ $p=0.5$ $y=2x$ . Ale my także teraz, że jeśli się nie zmienimy, nasza wypłata jest pewna. Oto nasza gra w normalnej formie z naszymi wypłatami:

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 x) & u (x) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2x) & u(x) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

Należy pokusę zastąpić i do . to znana i pewna wypłata. Korzyści ze strategii „Switch” nie są tak naprawdę znane (ponieważ nie znamy wartości ). Powinniśmy więc odwrócić podstawienie . Jeśli to , a jeśli to $u(x)$ $u(2x)$ $u(y)$ $u(y)$ $x$ $y=x$ $u(2x) = u(2y)$ $y=2x$ $u(x) = u(y/2)$ . Oto nasza gra ponownie:

\begin{array}{rr} We / nature \to & y = x & y = 2 x \\ Switch & u (2 y) & u (y / 2) \\ Don't Switch & u (y) & u (y) \end{array}

$\begin{array}{| r | r | } \hline \text{We} \;/ \;\;\text{nature} \rightarrow &y= x & y=2x \\ \hline \text{Switch} & u(2y) & u(y/2) \\ \hline \text{Don't Switch} & u(y) & u(y) \\ \hline \end{array}$

Teraz wszystkie wypłaty w macierzy są znane. Czy istnieje strategia dominująca?

Oczekiwana wypłata strategii „Switch” to

E (V_{S}) = 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2)

$E(V_S) = 0.5\cdot u(2y) + 0.5 \cdot u(y/2)$

Oczekiwany zwrot strategii „Don't Switch” to

E (V_{D S}) = u (y)

$E(V_{DS}) = u(y)$

Powinniśmy zmienić jeśli

E (V_{S}) > E (V_{D S}) ⟹ 0.5 \cdot u (2 y) + 0.5 \cdot u (y / 2) > u (y)

$E(V_S) > E(V_{DS}) \implies 0.5\cdot u(2y) + 0.5 \cdot u(y/2) > u(y)$

A teraz stosunek do ryzyka staje się krytyczny. Nietrudno jest wydedukować, że przy zachowaniu ryzyka i neutralnym ryzyku powinniśmy zmienić.

Jeśli chodzi o zachowanie zapobiegające ryzyku , znajduję elegancki rezultat:

W przypadku „mniej wklęsłych” (ściśle powyżej) funkcji narzędziowych niż logarytmicznych (powiedzmy pierwiastek kwadratowy), powinniśmy nadal Przełączać.

Dla narzędzia logarytmicznego $u(y) = \ln y$ , jesteśmy obojętni między zmianą lub nie.

Za „niż” bardziej wklęsła (ściśle poniżej) logarytmicznych funkcji użytkowych, powinniśmy nie przełącznika.

Zamykam schematem przypadku logarytmicznego

Założyć $y=4$ . Następnie $y/2 =2, 2y = 8$ . Linia to linia, na której spoczywa oczekiwana użyteczność z „Switcha”. Ponieważ natura odgrywa strategię , faktycznie będzie w punkcie , który jest środkowym punktem . W tym momencie z narzędziem logarytmicznym otrzymujemy dokładnie to samo narzędzie z „Don't Switch”, czyli dla tego przykładu liczbowego. $Γ-Δ-Ε$ $50-50$ $\Delta$ $Γ-Δ-Ε$ $\ln(4)$

— Alecos Papadopoulos
źródło

Wywołanie „awersji do ryzyka” za pomocą funkcji logarytmicznej nie rozwiązuje paradoksu. Jak zauważono @HRSE używając Bayesa twierdzenie, prawdopodobieństwo, że są wypłat i jest nie 0,5 po obejrzeniu kwotę pierwszej koperty. To posiadać tylko dla bardzo wątpliwe jednolitej nieprawidłowego stanu ON (dla ). Jeśli użyjesz właściwego przedimka na (odzwierciedlającego przekonania na temat ), rozwiązaniem staje się zmiana, jeśli jest wystarczająco małe, i zachowanie pierwszej koperty, jeśli jest wystarczająco duże. Zobacz jstor.org/ stable / 2685310 .

u (2 y)

$u(2y)$

u (y / 2

$u(y/2$

x

$x$

x > 0

$x>0$

x

$x$

x

$x$

y

$y$

y

$y$

— Jarle Tufto

@JarleTufto Z mojego punktu widzenia przełożony jednolity jest prawidłowym przełożonym, jeśli ktoś zdecyduje się uwierzyć organizatorom gry, gdy powie, że kwoty pieniężne zostały umieszczone w kopertach po losowaniu Bernoulliego z . Jeśli ktoś chce być podejrzliwy, nie wierzyć organizatorom i formułować innego wcześniejszego przekonania, to oczywiście jego prawo, ale musiałby wystąpić z jakimś argumentem, aby mnie przekonać, co do: a) dlaczego organizatorzy kłamią oraz b) jak czy wybiera inny przedtem, który wybiera. Pamiętaj, że moja odpowiedź zakłada, że wierzymy organizatorom w tej sprawie.

p = 0.5

$p=0.5$

— Alecos Papadopoulos

Oczywiście zgadzam się, że otrzymujesz każdą kopertę zawierającą odpowiednio wartości i z jednakowymi prawdopodobieństwami 1/2. To, co mówię, to to, że domyślnie niewłaściwy jednolity przed , którego używasz, to znaczy , dla wszystkich prowadzi do paradoksu, ponieważ twierdzenie Bayesa prowadzi następnie do gdzie jest ilością obserwowaną w pierwszej kopercie. Używając zamiast tego właściwego przedimka , te warunkowe prawdopodobieństwa różnią się, a optymalna decyzja zależy od (i oczywiście funkcji użyteczności).

X

$X$

2 X

$2X$

X

$X$

π (x) = 1

$\pi(x) =1$

x > 0

$x>0$

P (X = y | Y = y) = P (X = y / 2 | Y = y) = 1 / 2

$P(X=y|Y=y) = P(X=y/2|Y=y)=1/2$

y

$y$

π (x)

$\pi(x)$

y

$y$

— Jarle Tufto

@JarleTufto To niewłaściwe, zanim wspomnisz, odzwierciedla prawdopodobieństwo związane z czym?

— Alecos Papadopoulos

Kwota pieniędzy w dwóch kopertach wynosi

X

$X$ i

2 X

$2X$ . Wcześniejszy rozkład prawdopodobieństwa reprezentuje twoje przekonania na temat

X

$X$ przed otwarciem dowolnej koperty. Albo domyślnie używasz tego konkretnego przejęcia, albo popełniasz błąd polegający na zrównaniu prawdopodobieństw warunkowych odwrotnych.

— Jarle Tufto 15.01.2018

Jeśli otworzysz obwiednię E1 i zobaczysz, że jej wartość to E1 = Y , to prawdą jest, że wartość drugiej obwiedni E2 jest w {E2 = Y / 2, E2 = 2Y} .

Prawdą jest również, że oczekiwana wartość tej obwiedni wynosi (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

Błąd zakłada, że Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 niezależnie od tego, co to jest Y. Uproszczonym sposobem na wykazanie tego jest założenie, że każda koperta zawiera amerykańskie pieniądze papierowe o różnych nominałach. Jeśli Y = 1 USD , E2 nie może być Y / 2 .

Bardziej rygorystyczny dowód jest zbyt szczegółowy, aby go tu podać, ale jego podsumowaniem jest najpierw założenie, że dla dowolnej wartości Z , że Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Jest to zasadniczo to samo założenie, co w poprzednim akapicie, rozszerzone na zakres wartości. Ale jeśli jest to prawdą dla dowolnej wartości Z , oznacza to, że Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) jest stały dla każdej wartości N , od -inf do inf. Ponieważ jest to niemożliwe, założenie nie może być prawidłowe.

+++++

To mogło być trochę mylące, więc pozwól mi spróbować. Dostajesz dwa zestawy dwóch kopert. W jednym zestawie zawierają 10 i 20 dolarów. W drugim zawierają 20 i 40. Ty wybierasz zestaw, a następnie otwierasz jedną kopertę w tym zestawie, aby znaleźć 20. Następnie masz szansę na przejście do drugiej koperty w tym zestawie. Powinieneś?

Tak, powinien się zmienić. Oczekiwany zysk po przełączeniu na drugą obwiednię wynosi [(20-10) + (20-40)] / 2 = +5.

Zauważ, że ten przypadek - to znaczy wiedząc, że znalazłeś 20, a nie 10 lub 40, odpowiada warunkom opisanym w pytaniu. Twoje rozwiązanie działa. Ale sam eksperyment nie pasuje do tego opisu. Jeśli znalazłeś 10 lub 40, prawdopodobieństwo, że inna koperta ma 20, wynosi 100%. Oczekiwane zyski wynoszą odpowiednio +10 i -20. A jeśli uśrednisz trzy możliwe zyski ponad prawdopodobieństwa, otrzymasz trzy wartości, otrzymasz 10/4 + 5/2 - 20/4 = 0.

— JeffJo
źródło

Dlaczego miałbym zakładać, że na kopercie nie ma 50 centów? Pytanie dotyczy również czasów, w których nie znasz możliwych kwot, które mogą być w nim zawarte, tylko możliwe kwoty względne, więc tak naprawdę nie podążam za tym.

— Kawaleria Kitsune

Powiedziałem, że to podejście uproszczone. Zaczęło się od „załóżmy, że każda koperta zawiera amerykańskie pieniądze papierowe”. Ponieważ nie możesz mieć 50 centów w amerykańskich papierowych pieniądzach, Pr (E2 =

2 | E 1 =

$2|E1=$ 1) = 1. Chodzi o to, że przyjęcie Y / 2 i 2Y jest równie prawdopodobne, gdy nie znasz Y, zakłada de facto rozkład dla Y, który jest niemożliwy do osiągnięcia.

— JeffJo

Ogólnie problem jest nierozwiązywalny, ponieważ nie określono procedury randomizacji dla całego eksperymentu.

Ale niech Y będzie wartością wybranej koperty, a X drugą kopertą. Odpowiedź brzmi zatem $E[X|Y=y]$ - co jest warunkiem warunkowym . Jednak przy założeniu najbardziej ogólnego rozkładu Y, Y jest równomiernie rysowane ze wszystkich $\mathbb{R}$ . Ale wtedy $Pr(Y=y)=0$ , a przez paradoks Borela – Kołmogorowa oczekiwanie jest nierozwiązywalne.

— John Rambo
źródło

@JeffJo, nie mogłem komentować Twojego postu z powodu braku wystarczającej reputacji. Dodałem tę odpowiedź, ponieważ uważam, że jest ona związana z Twoim postem.

— John Rambo,