PBE typu „weź lub zostaw”


9

Znalazłem interesujące pytanie dotyczące idealnej równowagi bayesowskiej. Nie widziałem pytania, w którym przekonania nie są dyskretne.

Istnieje jeden potencjalny nabywca przedmiotu, który ma zerową wartość dla sprzedającego. Wycena v tego nabywcy jest równomiernie rozłożona na [0, 1] i jest informacją prywatną. Sprzedawca podaje cenęp1 które kupujący akceptuje lub odrzuca.

Jeśli zaakceptuje, przedmiot jest sprzedawany po ustalonej cenie, a wypłata kupującego wynosi vp1 a sprzedawca jest p1.

Jeśli odrzuci, sprzedawca składa kolejną ofertę cenową, p2. Jeśli kupujący to zaakceptuje, jego wypłata wynosiδ(vp2) a sprzedawca jest δp2, gdzie δ=0.5.

Jeśli odrzuci, obaj gracze otrzymają zero (nie ma żadnych dalszych ofert).

Znajdź idealną równowagę bayesowską.

Moje zwykłe podejście polega na utrwalaniu przekonań, ale nie do końca wiem, jak to robić z ciągłymi przekonaniami. Jakakolwiek rada?


Przepraszam, nie mogłem wymyślić łatwego sposobu udzielenia częściowej porady. To miłe ćwiczenie. Czy mógłbyś (lub twórca) pomyśleć, gdybym użył go w klasie?
Giskard

Oczywiście nie krępuj się!
Brian

Odpowiedzi:


6

Po opublikowaniu wczoraj złego rozwiązania, wydaje mi się, że mam lepsze:

Strategia kupującego składa się z dwóch funkcji, (f1(v,p1),f2(v,p1,p2)) gdzie obie funkcje odwzorowują {A,R} (gdzie A oznacza Akceptuj, Rdo odrzucenia). Strategia sprzedawcy to(p1,p2(f1(v,p1))). Otrzymujesz rozwiązanie poprzez indukcję wsteczną. W PBEf2(v,p1,p2) mapy do A wtedy i tylko wtedy gdy vp2. (Równość jest nieistotna.) W PBE sprzedawca uważa, że ​​istnieje zbiórH rodzajów, dla których kupujący odrzucił jej ofertę p1. Następnie

p2=argmaxp2p2Prob(f2(v,p1,p2)=A|f1(v,p1)=R).
Kupujący zaakceptuje ofertę wtedy i tylko wtedy, gdy Otrzymasz z tego Lewa strona tego równania rośnie w , więc typy o wysokiej wycenie zaakceptują. Oznacza to, że w PBE zestaw jest taki, że Z tego otrzymujemy optymalne podane : W PBE jest funkcją : p1
vp1δ(vp2).
v(1δ)p1δp2.
vH
H=[0,v¯).
p2v¯
p2=argmaxp2p2Prob(vp2|v[0,v¯))=v¯2.
v¯p1
v¯(1δ)=p1δv¯2,
więc Ustaliliśmy wszystkie strategie PBE, ale . Oczekiwana wypłata sprzedawcy to gdzie Zastępujemy to
v¯=p11δ2.
p1
p1(1p1δp2(v¯(p1))1δ)+12p2(v¯(p1))(p1δp2(v¯(p1))1δp2(v¯(p1))),
p2(v¯(p1))=v¯(p1)2=p11δ22=p12δ.
p1(1p1δp12δ1δ)+12p12δ(p1δp12δ1δp12δ),

Musisz zmaksymalizować to wrt . Przy dostałem p1δ=0.5

p1=920,v¯=35,p2=310.

Wydaje mi się, że to pytanie można również interpretować jako firmę próbującą sprawdzić konsumentów różnych wycen reprezentowanych jako zamknięty przedział jednostkowy. Optymalny system cenowy polega na ustaleniu dwóch cen, tak aby klienci o wysokich wycenach zapłacili po wyższej cenie na pierwszym etapie, a niektórzy o niskich wycenach zapłacą po niższej cenie na drugim etapie.
Pokój światowy Metta

Musisz wyjaśnić, dlaczego narzędzia różnią się w drugiej rundzie. Dla sprzedającego może to być zwykła zniżka, ale dla kupującego? Gdyby dobro było trwałe, to typy, które je kupią, otrzymałyby pewne korzyści w obu rundach.
Giskard

1
Nie do końca podążam. Dlaczego kupujący nie mogą zdyskontować użyteczności uzyskanej w drugiej rundzie? Można to interpretować jako dwuletni przegląd cen, prawda?
Metta World Peace

Żenujące, ale do tej pory nigdy nie słyszałem o tym modelu. Masz rację, to ładnie opisuje powyższą grę.
Giskard

Powiedziałeś, że kupujący zaakceptuje wtedy i tylko wtedy, gdy ale czy nie odrzuci, jeśli zarówno jak i są większe niż , niezależnie od tego, czy powyższa nierówność jest spełniona? p1
vp1δ(vp2)
p1p2v
Franklin Pezzuti Dyer
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.