Niech y1,…,yn będą danymi obserwowanymi, co do których zakłada się, że jest realizacją sekwencji iid zmiennych losowych Y1,…,Yn ze wspólną funkcją gęstości prawdopodobieństwa pe zdefiniowaną w odniesieniu do miary sigma-skończonej ν . Gęstość pe nazywa się gęstością procesu generowania danych (DGP).
W modelu prawdopodobieństwa badacza
M≡{p(y;θ):θ∈Θ} to zbiór funkcji gęstości prawdopodobieństwa, które są indeksowane przez wektor parametrów
θ . Załóżmy, że każda gęstość w M jest określona w odniesieniu do wspólnej miary sigma-skończonej ν (np. Każda gęstość może być funkcją masy prawdopodobieństwa z tą samą przestrzenią próbki S ).
Ważne jest, aby zachować gęstość pe która faktycznie wygenerowała dane, koncepcyjnie odrębna od modelu prawdopodobieństwa danych. W klasycznych metodach statystycznych staranne oddzielenie tych pojęć jest ignorowane, a nie dokonywane lub od samego początku zakłada się, że model prawdopodobieństwa jest poprawnie określony.
Prawidłowo określony model M w odniesieniu do pe jest zdefiniowany jako model, w którym pe∈M ν - prawie wszędzie. Gdy
M jest źle określone w odniesieniu do pe odpowiada to przypadkowi, w którym model prawdopodobieństwa nie jest poprawnie określony.
Jeśli model prawdopodobieństwo jest prawidłowo ustawiona, to istnieje θ∗ w przestrzeń parametru Θ tak, że
pe(y)=p(y;θ∗) ν -almost wszędzie. Taki wektor parametrów nazywany jest „prawdziwym wektorem parametrów”. Jeśli model prawdopodobieństwa jest błędnie określony, prawdziwy wektor parametrów nie istnieje.
Model być błąd w obrębie ram White'a celem jest znalezienie oszacowanie parametru θ n który minimalizuje
£ -l n ( θ ) ≡ ( 1 / n ) Ď n i = 1 log p ( y ja ; θ ) nad pewnym zwartej przestrzeni parametrów Θ . Zakłada się, że wyjątkowy surowe światowe Minimizer, θ * , oczekiwanej wartości £ -l n na Θ znajduje się we wnętrzu Θθ^nℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ)Θθ∗ℓ^nΘΘ. W szczęśliwym przypadku, gdy model prawdopodobieństwa jest poprawnie określony, θ∗ może być interpretowane jako „prawdziwa wartość parametru”.
W szczególnym przypadku, w którym model jest prawdopodobieństwo prawidłowo określony, θ n jest znane oszacowanie maksymalnej wiarygodności. Jeśli nie wiemy, mają absolutną wiedzę, że model prawdopodobieństwo jest poprawnie określona, wtedy θ n nazywana jest oszacowanie prawdopodobieństwa quasi-maksymalny, a celem jest oszacowanie θ * . Jeśli nam się poszczęści i model prawdopodobieństwa zostanie poprawnie określony, wówczas quasi-maksymalne oszacowanie prawdopodobieństwa zmniejsza się jako szczególny przypadek do znanego oszacowania maksymalnego prawdopodobieństwa i
θ ∗ staje się prawdziwą wartością parametru.θ^nθ^nθ∗θ∗
Spójność w ramach White'a (1982) odpowiada zbieżności z θ∗ bez wymagania, że θ∗ jest koniecznie prawdziwym wektorem parametrów. W ramach White'a nigdy nie oszacowalibyśmy prawdopodobieństwa zdarzenia, że zbiory wytworzone przez δ zawierają rozkład PRAWDA P *. Zamiast tego zawsze szacowalibyśmy rozkład prawdopodobieństwa P **, który jest prawdopodobieństwem zdarzenia, że zbiory wytworzone przez δ zawierają rozkład określony przez gęstość
p(y;θ∗) .
Na koniec kilka komentarzy na temat błędnej specyfikacji modelu. Łatwo jest znaleźć przykłady, w których źle określony model jest niezwykle przydatny i bardzo przewidywalny. Rozważmy na przykład model regresji nieliniowej (a nawet liniowej) z terminem błędu resztkowego Gaussa, którego wariancja jest wyjątkowo mała, ale rzeczywisty błąd resztkowy w środowisku nie jest gaussowski.
Łatwo jest również znaleźć przykłady, w których poprawnie określony model nie jest użyteczny i nieprzewidywalny. Weźmy na przykład model losowego przejścia do przewidywania cen akcji, który przewiduje, że jutrzejsza cena zamknięcia jest ważoną sumą dzisiejszych cen zamknięcia i pewnego szumu gaussowskiego z bardzo dużą wariancją.
Celem ramowej specyfikacji błędów modelu nie jest zapewnienie ważności modelu, ale raczej zapewnienie niezawodności. Oznacza to, że błąd próbkowania związany z oszacowaniami parametrów, przedziałami ufności, testami hipotez i tak dalej jest poprawnie oszacowany, pomimo obecności małej lub dużej ilości błędnej specyfikacji modelu. Quasi-maksymalne oszacowania prawdopodobieństwa są asymptotycznie normalne wyśrodkowane na θ∗ za pomocą estymatora macierzy kowariancji, który zależy zarówno od pierwszej, jak i drugiej pochodnej funkcji logarytmu ujemnego-prawdopodobieństwa. W szczególnym przypadku, gdy masz szczęście i model jest poprawny, wszystkie formuły redukują się do znanego klasycznego schematu statystycznego, w którym celem jest oszacowanie „prawdziwych” wartości parametrów.