Powiedzmy, że znajdujemy się w dyskretnej przestrzeni prawdopodobieństwa, więc . Intuicyjnie potrzebujesz funkcji , abyś mógł zoptymalizować . Możesz zoptymalizować tylko jeden cel! U : R n → R U ( f ( x ) )f(x)∈RnU:Rn→RU(f(x))
Optymalizacja funkcji jednego celu może wydawać się dość ograniczająca, ale tak nie jest ! Pojedynczy cel może reprezentować niewiarygodnie różnorodne preferencje, które możesz mieć względem tego, co jest lepsze lub gorsze.
Przeskakując do przodu, prostym miejscem do rozpoczęcia może być wybranie zmiennej losowej a następnie rozwiązanie:λ
E[f(x)]
minimize (over x)subject toE[λf(x)]x∈X
Jest to prosta liniowa zmiana wagi . Tak czy inaczej, oto argument, dlaczego zwijanie wielu celów do jednego celu jest zazwyczaj w porządku.
E[f(x)]
Podstawowe ustawienia:
- Masz wybór zmiennej i wykonalnego zbiór .XxX
- Twój wybór prowadzi do losowego wyniku˜ y = f ( x )xy~=f(x)
- Masz racjonalne preferencje stosunku do losowego wyniku. (Zasadniczo możesz powiedzieć, czy wolisz jeden losowy wynik od drugiego.)~ r≺y~
Twoim problemem jest wybranie tak aby:x∗∈X
∄x∈Xf(x∗)≺f(x)
W języku angielskim wybierasz , aby żaden możliwy wybór prowadził do wyniku preferowanego zamiast .
x∗xf(x∗)
Równoważność z maksymalizacją użyteczności (w określonych warunkach technicznych)
Dla uproszczenia technicznego powiem, że znajdujemy się w dyskretnej przestrzeni prawdopodobieństwa z wynikami, więc mogę reprezentować losowy wynik za pomocą wektora .ny~y∈Rn
W pewnych warunkach technicznych (które nie są ograniczeniem w sensie praktycznym) powyższy problem jest równoważny maksymalizacji funkcji użyteczności . (Funkcja użyteczności przypisuje bardziej preferowane wyniki większej liczbie).U(y)
Ta logika miałaby zastosowanie do każdego problemu, w którym twój wybór prowadzi do wielu zmiennych wyniku.
maximize (over x)subject toU(f(x))x∈X
Nadanie większej struktury funkcji użytecznej : Oczekiwana hipoteza użyteczności :U
Jeśli znajdujemy się w otoczeniu probabilistycznym i akceptujemy aksjomaty Neumanna-Morgernsterna , ogólna funkcja użyteczności musi przyjąć specjalną formę:U
U(y)=E[u(yi)]=∑ipiu(yi)
Gdzie jest prawdopodobieństwem stanu a jest wklęsłą funkcją użyteczności. Krzywizna mierzy awersję do ryzyka. Po prostu zastępując tę specjalistyczną formę , otrzymujesz:
piiuuU
maximize (over x)subject to∑ipiu(yi)x∈Xy=f(x)
Zauważ, że prosty przypadek maksymalizuje wartość oczekiwaną (tj. Brak awersji do ryzyka).u(yi)=yi
Innym podejściem: ciężaryλ
Inną rzeczą do zrobienia jest:
maximize (over x)subject to∑iλiyix∈Xy=f(x)
Intuicyjnie możesz wybrać wagi które są większe lub mniejsze niż prawdopodobieństwo wystąpienia stanu, a to oddaje znaczenie stanu.p iλipi
Głębsze uzasadnienie tego podejścia jest takie, że w pewnych warunkach technicznych istnieją wagi lambda takie, że powyższy problem i wcześniejsze problemy (np. Maksymalizacja ) mają to samo rozwiązanie.U ( f ( x ) )λU(f(x))