OK - moja oryginalna wiadomość nie wywołała odpowiedzi; pozwólcie, że postawię pytanie inaczej. Zacznę od wyjaśnienia mojego rozumienia estymacji z teoretycznego punktu widzenia decyzji. Nie mam formalnego szkolenia i nie zaskoczyłoby mnie, gdyby moje myślenie było w jakiś sposób błędne.
Załóżmy, że mamy jakąś funkcję straty . Oczekiwana strata to ryzyko (częste):
gdzie jest prawdopodobieństwo; a ryzyko Bayesa to oczekiwane ryzyko częstych:
gdzie jest naszym przeorem.
Ogólnie rzecz biorąc, znajdujemy które minimalizują i to wszystko ładnie działa; ponadto obowiązuje twierdzenie Fubiniego i możemy odwrócić kolejność całkowania tak, aby dowolna to minimalizuje jest niezależny od wszystkich innych. W ten sposób zasada prawdopodobieństwa nie zostanie naruszona i możemy czuć się dobrze z byciem Bayesianem i tak dalej.
Na przykład, biorąc pod uwagę znaną kwadratową utratę błędów, nasze częste ryzyko jest średnim kwadratowym błędem lub sumą kwadratowego błędu i wariancji, a nasze ryzyko Bayesa jest oczekiwaną sumą kwadratowego błędu i wariancji, biorąc pod uwagę naszą wcześniejszą - tj. oczekiwaną stratę a posteriori.
Jak dotąd wydaje mi się to rozsądne (chociaż mogę się mylić); ale w każdym razie rzeczy mają dla mnie znacznie mniej sensu inne cele. Załóżmy na przykład, że zamiast minimalizować sumę równomiernie wyrównanego odchylenia i wariancji, chcę zminimalizować nierówną sumę - to znaczy chcę które minimalizują:
gdzie jest pewną dodatnią rzeczywistą stałą (inną niż 1).
Zwykle nazywam taką sumę „funkcją celu”, chociaż może być tak, że używam tego terminu niepoprawnie. Moje pytanie nie dotyczy tego, jak znaleźć rozwiązanie - znalezienie że minimalizacja tej funkcji celu jest wykonalna numerycznie - moje pytanie jest dwojakie:
Czy taka funkcja celu może pasować do paradygmatu teorii decyzji? Jeśli nie, to czy istnieją inne ramy, w których to pasuje? Jeśli tak, to w jaki sposób? Wygląda na to, że powiązana funkcja straty byłaby funkcją, , i , co - z powodu oczekiwań - jest (moim zdaniem) niewłaściwe.
Taka funkcja obiektywna narusza zasadę prawdopodobieństwa, ponieważ jakiekolwiek dane szacunkowe zależy od wszystkich innych szacunków (nawet hipotetyczne). Niemniej jednak zdarzają się sytuacje, w których pożądany jest handel wzrostem wariancji błędu w celu zmniejszenia uprzedzeń. Biorąc pod uwagę taki cel, czy istnieje sposób na konceptualizację problemu w taki sposób, aby był zgodny z zasadą prawdopodobieństwa?
Zakładam, że nie zrozumiałem podstawowych pojęć dotyczących teorii / szacowania / optymalizacji decyzji. Z góry dziękuję za wszelkie odpowiedzi i proszę założyć, że nic nie wiem, ponieważ nie mam szkolenia w tej dziedzinie ani ogólnie matematyki. Dodatkowo doceniane są wszelkie sugerowane odniesienia (dla naiwnego czytelnika).