Paradoks Stein'a pokazuje, że gdy jednocześnie szacuje się trzy lub więcej parametrów, istnieją połączone estymatory średnio bardziej dokładne (to znaczy mające niższy oczekiwany średni błąd kwadratu) niż jakakolwiek metoda osobno obsługująca parametry.
To bardzo sprzeczny z intuicją wynik. Czy ten sam wynik obowiązuje, jeśli zamiast stosowania normy (oczekiwany średni błąd kwadratowy), stosujemy normę l 1 (oczekiwany średni błąd bezwzględny)?