Odpowiedź na to pytanie została wyraźnie udzielona w klasycznej serii artykułów na temat estymatora Jamesa-Steina w kontekście Empirical Bayes napisanych w latach 70. przez Efrona i Morrisa. Mam na myśli głównie:
Efron i Morris, 1973, Reguła estymacji Stein'a i jej konkurenci - podejście empiryczne Bayesa
Efron i Morris, 1975, Analiza danych z estymatorem Stein'a i jego uogólnienia
Efron i Morris, 1977, Paradoks Steina w statystyce
Artykuł z 1977 r. Jest nietechniczną ekspozycją, którą należy przeczytać. Tam przedstawiają przykład mrugnięcia bejsbolem (omówiony w wątku, do którego linkujesz); w tym przykładzie wariancje obserwacji rzeczywiście powinny być równe dla wszystkich zmiennych, a współczynnik skurczu do jest stały.
Podają jednak kolejny przykład, który ocenia wskaźniki toksoplazmozy w wielu miastach w Salwadorze. W każdym mieście ankietowano inną liczbę osób, dlatego można myśleć o indywidualnych obserwacjach (wskaźnik toksoplazmozy w każdym mieście) o różnych wariancjach (im niższa liczba ankietowanych osób, tym wyższa wariancja). Intuicja jest z pewnością taka, że punkty danych o niskiej wariancji (niska niepewność) nie muszą być tak mocno skurczone, jak punkty danych o dużej wariancji (wysoka niepewność). Wynik ich analizy pokazano na poniższym rysunku, na którym rzeczywiście można to zaobserwować:
Te same dane i analizy przedstawiono również w dużo bardziej technicznym artykule z 1975 r., Na znacznie bardziej eleganckiej figurze (niestety nie pokazując poszczególnych odchyleń), patrz sekcja 3:
Xja| θja∼ N.( θja, Dja)θja∼ N.( 0 , A )
ZAreja= 11 / ( 1 + A )( k - 2 ) / ∑ X2)jotθjaθ^ja= ( 1 - 11 + A) Xja= ( 1 - k - 2∑ X2)jot) Xja,
reja≠ 1θ^ja= ( 1 - Djareja+ A) Xja
ZAZA^
rejotZA^jak
Odpowiednią sekcją w artykule z 1973 r. Jest sekcja 8 i jest ona nieco trudniejsza do przeczytania. Co ciekawe, mają tam wyraźny komentarz do sugestii @guy w powyższych komentarzach:
x~ja= D.- 1 / 2jaxja, θ~ja= D.- 1 / 2jaθjax~ja∼ N.( θ~ja, 1 )θjaθ^ja= ( 1 - k - 2∑ [ X2)jot/ Djot]) Xja.
Xja
ZA^ja