W Kahneman i Deaton (2010) autorzy piszą:
Ta regresja wyjaśnia 37% wariancji, z pierwiastkowym średnim błędem kwadratowym (RMSE) wynoszącym 0,67852. Aby wyeliminować wartości odstające i nieprawdopodobne dochody, porzuciliśmy obserwacje, w których wartość bezwzględna różnicy między przychodem z dziennika a jego prognozą przekroczyła 2,5-krotność RMSE.
Czy to powszechna praktyka? Jaka jest intuicja? Wydaje się nieco dziwne zdefiniowanie wartości odstającej na podstawie modelu, który może nie być dokładnie określony. Czy wyznaczanie wartości odstających nie powinno opierać się na teoretycznych podstawach tego, co stanowi prawdopodobną wartość, a nie na tym, jak dobrze twój model przewiduje wartości rzeczywiste?
: Daniel Kahneman, Angus Deaton (2010): Wysokie dochody poprawiają ocenę życia, ale nie samopoczucie emocjonalne. Postępowania z National Academy of Sciences wrzesień 2010, 107 (38) 16489-16493; DOI: 10.1073 / pnas.1011492107