Idealna równowaga bayesowska

Zadano mi pytanie, z którym mam problem:

Weź standardową grę Dylemat Więźnia i zastanów się, że gra się nią dwukrotnie. (Gracze obserwują wynik pierwszej gry przed rozpoczęciem drugiej). Rozważ przekonania, które węzły gracza 2 znajdują się w ich zestawie informacji.

Znajdź słabą idealną równowagę bayesowską (strategie i przekonania), gdzie strategie nie są idealną równowagą w grze.

Tak więc w Dylemacie Więźnia:

(Defect, Defect) to unikalny nash, a także unikalna idealna równowaga gry.

Ale w jaki sposób możemy uzyskać słabą idealną równowagę bayesowską, która nie obejmuje Wady? Z pewnością jest to ściśle dominujące. . .

Czy pytanie jest złe?

Następnie prosi o równowagę sekwencyjną (gdzie rozważamy sekwencję strategii mieszanych).

Czy to pytanie jest złe, czy też źle rozumiem te pojęcia?

game-theory bayesian-game

— Brian
źródło

To nie jest odpowiedź na pytanie, ale po prostu pedantyczny punkt. . . W rzeczywistości strategia musi składać się z 5 elementów.

— Brian,

Biorąc pod uwagę twój komentarz, myślę teraz, że twój problem leży gdzie indziej: jeśli wybierzesz dominującą strategię w podgrodzie, która jest poza ścieżką równowagi (czyli taką, która tak naprawdę nie występuje), twoja wypłata nie maleje.

— Giskard

Rozumiem więc, że wierzenia poza równowagą mogą być arbitralne (a zatem nie muszą być zgodne z aktualizacją Bayesa), ale mam wrażenie, że sekwencyjna racjonalność musi się utrzymywać (tj. Biorąc pod uwagę te przekonania, jednostka musi grać ich najlepsza strategia). Czy więc w odpowiedzi na twoją sugestię, czy zdominowana strategia nie naruszy sekwencyjnej racjonalności?

— Brian

@denesp: Słaba PBE jest „słaba” nie dlatego, że nie wymaga sekwencyjnej racjonalności poza ścieżką równowagi, ale ponieważ nie wymaga przekonań, aby być spójnym z regułą Bayesa wyłączającą ścieżkę równowagi. Chociaż zgadzam się, że w przypadku podwójnie powtarzanego dylematu więźnia (PD) nie ma WPBE z doskonałymi strategiami innymi niż podgrupa, wniosek ten ogólnie nie ma miejsca. Powodem jest to, że defekt jest strategią ściśle dominującą w PD, a zatem dla każdego przekonania poza ścieżką równowagi (nawet jeśli jest niezgodne z regułą Bayesa), defekt jest nadal sekwencyjnie racjonalny.

— Herr K.

Jednak w przypadku gier bez dominującej strategii moglibyśmy manipulować przekonaniami o równowadze w taki sposób, aby strategie inne niż podgrupy były sekwencyjnie racjonalne. Jeśli wzmocnimy wymóg dotyczący przekonań (taki jak wymagany w sekwencyjnej równowadze) poprzez wymuszenie, aby reguła Bayesa utrzymywała nawet równowagę, możemy wykluczyć doskonałe strategie inne niż podgrupa. Mamy zatem wynik, że równowaga sekwencyjna implikuje zarówno WPBE, jak i SPE.

— Herr K.

Niech strategia gracza 1 będzie reprezentowana przez $(x1_1,xDD_1,xDC_1,xCD_1,xCC_1)$ gdzie $x1$ to akcja pierwszej rundy gracza 1, $xDD_1$ to działanie podjęte przy zbiorze informacji, w którym obaj gracze uciekli w pierwszej rundzie, $xDC_1$ jest działaniem podanym w zbiorze informacji, w którym zawodnik 1 popełnił błąd, a zawodnik 2 współpracował w rundzie 1 itd. Pamiętaj, że coś takiego $(x1_1,x2_1)$ (z $x2_1$ działanie podejmowane w rundzie 2) nigdy nie jest pełną specyfikacją strategii gracza 1, ponieważ musimy określić zachowanie dla każdego zestawu informacji osobno. Podobnie zdefiniuj strategie gracza 2. Jednak idealna równowaga bayesowska musi także określać przekonania gracza, $\mu_1,\mu_2$ . Jest to ważna część specyfikacji równowagi. Jak zobaczymy poniżej, pytanie ma na celu zrozumienie, że inna równowaga nie wymaga różnych strategii. Różnica przekonań jest wystarczająca, aby liczyć się jako inna równowaga.

Idealną równowagę zapewniają: $((D,D,D,D,D),\mu_1)$ dla gracza 1 i $((D,D,D,D,D),\mu_2)$ dla gracza 2, gdzie $\mu_1$ i $\mu_2$ są spójnymi przekonaniami we wszystkich zestawach informacji.

Jak zauważono w komentarzach, ponieważ „defekt” jest strategią zdominowaną niezależnie od przekonań, nawet w słabej idealnej równowadze Bayesa profile strategii muszą być $(D,D,D,D,D)$ dla obu graczy. Jednak teraz jest także słaba idealna równowaga Bayesowskiego Nasha: $((D,D,D,D,D),\mu_1')$ i $((D,D,D,D,D),\mu_2')$ z $\mu_1'$ , $\mu_2'$ spójny na ścieżce równowagi.

Zatem pytanie nie jest błędne, po prostu pokazuje, że dwie słabe doskonałe równowagi Bayesa Nasha mogą mieć identyczne strategie, o ile różnią się przekonaniami poza ścieżką równowagi.

— HRSE
źródło