Ta odpowiedź opisuje realistyczny problem, w którym dominuje naturalny spójny estymator (przewyższający wszystkie możliwe wartości parametrów dla wszystkich wielkości próby) przez niespójnego estymatora. Jest motywowany ideą, że spójność najlepiej nadaje się do strat kwadratowych, więc użycie straty silnie odbiegającej od tej (takiej jak strata asymetryczna) powinno uczynić spójność prawie bezużyteczną przy ocenie wydajności estymatorów.
Załóżmy, że twój klient chce oszacować średnią zmiennej (zakładając, że ma rozkład symetryczny) z próbki iid , ale niechętnie albo (a) nie docenia jej, albo (b) rażąco ją przecenia .( x1, ... , Xn)
Aby zobaczyć, jak to się sprawdzi, przyjmijmy prostą funkcję straty, rozumiejąc, że w praktyce strata może różnić się od tej ilościowo (ale nie jakościowo). Wybierz jednostki miary, aby był największym dopuszczalnym przeszacowaniem i ustaw utratę oszacowania gdy prawdziwa średnia wynosi równa ilekroć i równa przeciwnym razie.t μ 0 μ ≤ t ≤ μ + 1 11tμ0μ ≤ t ≤ μ + 11
Obliczenia są szczególnie proste dla rodziny rozkładów Normalnych ze średnią i wariancją , ponieważ wtedy średnia próbki ma normalną Rozkład . Średnia próbki jest spójnym estymatorem , co jest dobrze znane (i oczywiste). Przy zapisywaniu dla standardowego normalnego CDF, oczekiwana utrata średniej próbki wynosi : pochodzi z 50% szansy, że średnia próbki będzie niedoszacowana prawdziwa średnia i pochodzi z szansy przeszacowania prawdziwej średniej o więcej niżσ 2 > 0 ˉ x = 1μσ2)> 0(μ,Ď2/n)μcp1/2+cp(-√x¯= 1n∑jaxja( μ , σ2)/ n)μΦ1/2Φ(- √1 / 2 + Φ ( - n--√/ σ)1 / 21Φ ( - n--√/ σ)1.
Oczekiwana utrata jest równa niebieskiemu obszarowi w tym standardowym normalnym pliku PDF. Czerwony obszar przedstawia poniżej oczekiwaną stratę alternatywnego estymatora. Różnią się one poprzez zastąpienie jednolitego niebieskiego obszaru między i przez mniejszy jednolity czerwony obszar między i . Ta różnica rośnie wraz ze wzrostem . -√x¯0 √- n--√/ (2σ)0 √n--√/ (2σ)nn--√/ σn
Alternatywny estymator podany przez ma oczekiwaną stratę . Symetria i nieimodalność rozkładów normalnych implikuje, że oczekiwana strata jest zawsze lepsza niż średnia próbki. (To sprawia, że średnia próbki jest niedopuszczalna dla tej straty.) Rzeczywiście, oczekiwana utrata średniej próbki ma dolną granicę podczas gdy strata alternatywy zbliża się do miarę wzrostu . Jednak alternatywa wyraźnie jest niespójna: w miarę wzrostu prawdopodobieństwo zbliża się do .2Φ(-√x¯+ 1 / 21/20nnμ+1/2≠μ2 Φ ( - n--√/ (2σ) )1 / 20nnμ + 1 / 2 ≠ μ
Niebieskie kropki pokazują straty dla a czerwone kropki pokazują straty dla w zależności od wielkości próbki .ˉ x +1/2nx¯x¯+ 1 / 2n