(Aby zobaczyć, dlaczego to napisałem, sprawdź komentarze poniżej mojej odpowiedzi na to pytanie ).
Błędy typu III i teoria decyzji statystycznych
Udzielenie prawidłowej odpowiedzi na złe pytanie jest czasem nazywane błędem typu III. Statystyczna teoria decyzji jest formalizacją procesu decyzyjnego w warunkach niepewności; zapewnia ramy koncepcyjne, które mogą pomóc w uniknięciu błędów typu III. Kluczowym elementem frameworka jest funkcja straty . Przyjmuje dwa argumenty: pierwszy to (odpowiedni podzbiór) prawdziwy stan świata (np. W problemach z szacowaniem parametrów prawdziwa wartość parametru ); drugi jest elementem w zestawie możliwych działań (np. w problemach z oszacowaniem parametrów, estimateθ ). Wyjście modeluje stratę związaną z każdym możliwym działaniem w odniesieniu do każdego możliwego prawdziwego stanu świata. Na przykład w problemach z oszacowaniem parametrów niektóre dobrze znane funkcje strat to:
- bezwzględna utrata błędów
- kwadratowa utrata błędów
- Hal Varian 's LINEX loss
Analiza odpowiedzi w celu znalezienia pytania
Istnieje przypadek, w którym można próbować uniknąć błędów typu III, koncentrując się na sformułowaniu prawidłowej funkcji straty i przejściu przez resztę podejścia opartego na teorii decyzji (nie wyszczególnione tutaj). To nie jest moje krótkie - w końcu statystycy są dobrze wyposażeni w wiele technik i metod, które działają dobrze, nawet jeśli nie wywodzą się z takiego podejścia. Wydaje mi się jednak, że końcowy wynik jest taki, że zdecydowana większość statystyk nie wie i nie przejmuje się teorią decyzji statystycznych i myślę, że ich brakuje. Tym statystykom argumentowałbym, że powodem, dla którego mogą uznać teorię decyzji statystycznych za wartościową pod względem uniknięcia błędu typu III, jest to, że zapewnia ona ramy, w których można zapytać o każdą proponowaną procedurę analizy danych:z jaką funkcją straty (jeśli występuje) optymalnie radzi sobie procedura? Czyli w jakiej konkretnie sytuacji decyzyjnej stanowi najlepszą odpowiedź?
Spodziewana strata tylna
Z perspektywy bayesowskiej wystarczy funkcja straty. Możemy bardzo dużo pominąć resztę teorii decyzji - niemal z definicji, najlepszą rzeczą do zrobienia jest, aby zminimalizować posterior oczekiwana strata, to znaczy znaleźć akcję który minimalizuje .
(A jeśli chodzi o perspektywy nie Bayesowskie? Cóż, twierdzenie częstokroć teorii decyzji - a konkretnie Twierdzenia Kompletnej Klasy Walda - że optymalnym działaniem zawsze będzie minimalizowanie bocznej oczekiwanej straty Bayesa względem niektórych (być może niewłaściwych) Trudność z tym wynikiem polega na tym, że jest to twierdzenie o istnieniu, które nie daje wskazówek co do tego, przed użyciem, ale owocnie ogranicza klasę procedur, które możemy „odwrócić”, aby dowiedzieć się, jakie dokładnie jest to pytanie, że jesteśmy w szczególności, pierwszym krokiem w odwróceniu dowolnej procedury nie bayesowskiej jest ustalenie, która (jeśli w ogóle) procedura bayesowska powiela lub przybliża.)
Hej Cyan, wiesz, że to jest strona z pytaniami i odpowiedziami, prawda?
Co prowadzi mnie - wreszcie - do pytania statystycznego. W statystyce bayesowskiej, gdy podaje się oszacowania przedziałów dla parametrów jednowymiarowych, dwie popularne procedury przedziałów wiarygodności to wiarygodny przedział oparty na kwantach i wiarygodny przedział o największej gęstości tylnej. Jakie funkcje utraty powodują te procedury?