(Jest to adaptacja Granger & Newbold (1986) „Forecasting Economic Time Series”).
Z funkcja kosztu błędu to . Obejmuje to krytyczne założenie (że funkcja kosztu błędu jest symetryczna wokół zera) - inna funkcja kosztu błędu niekoniecznie miałaby warunkową wartość oczekiwaną jako jego wartości oczekiwanej. Nie można zminimalizować funkcji kosztu błędu, ponieważ zawiera ona nieznane ilości. Dlatego zdecydujesz się zminimalizować jego oczekiwaną wartość. Wtedy twoja funkcja celu staje się argmin[ Y- g( X) ]2)argmin
mi[ Y- g( X)]2)=∫∞- ∞[ y-g(X)]2)faY| X(y| x ) dy
który moim zdaniem odpowiada również na twoje drugie pytanie. Jest intuicyjny, że wartość oczekiwana będzie uwarunkowane , ponieważ staramy się oszacować prognozy / na podstawie . Rozłóż kwadrat, aby uzyskaćX Y XYXYX
mi[Y-g(X)]2)= ∫∞- ∞y2)faY| X(y| x ) dy- 2 g(X) ∫∞- ∞yfaY| X( y| x)dy+ [ g(X) ]2)∫∞- ∞faY| X( y| x)dy
Pierwszy termin nie zawiera więc nie wpływa na minimalizację i można go zignorować. Całka w drugim członie jest równa warunkowej oczekiwanej wartości dla , a całka w ostatnim członie jest równa jedności. WięcY Xsol(X)YX
argminsol( x )mi[Y-g(X) ]2)= argminsol( x ){ -2 g(X) E(Y∣X) + [ g(X) ]2)}
Pierwsza pochodna wrt to co prowadzi do warunku pierwszego rzędu dla minimalizacji podczas gdy druga pochodna jest równa co wystarcza na minimum.- 2 E ( Y ∣ X ) + 2 g ( X ) g ( X ) = E ( Y ∣ X )sol(X)- 2 E(Y∣X) + 2g( X)sol( X) = E( Y∣ X)2 > 0
DODATEK: Logika podejścia potwierdzającego „dodawanie i odejmowanie”.
OP jest zaskoczony podejściem podanym w pytaniu, ponieważ wydaje się tautologiczne. Nie jest tak, ponieważ podczas korzystania z taktyki dodawania i odejmowania określona część funkcji celu wynosi zero dla dowolnego wyboru terminu, który jest dodawany i odejmowany, NIE wyrównuje funkcji wartości , a mianowicie wartości celu funkcja oceniana na minimalizatorze kandydata.
Do wyboru mamy funkcję wartości
Dla dowolnego wyboru mamy wartość funkcji .V ( E ( Y ∣ X ) ) = E [ ( Y - E ( Y ∣ X ) ) 2 ∣ X ] g ( X ) = h ( X ) V ( h ( X ) ) = E [ ( Y - h (sol( X) = E( Y∣ X)V.( E( Y∣ X) ) = E[ ( Y- E( Y∣ X) )2)∣ X]sol( X) = h ( X)V.( h ( X) ) = E[ ( Y- h ( X) )2)∣ X]
Twierdzę to
⇒ E ( Y 2 ∣ X ) - 2 E [ ( Y E ( Y ∣ X ) ) ∣ X ] + E [ ( E
V.( E( Y∣ X))≤V(h(X))
⇒E(Y2∣X)−2E[(YE(Y∣X))∣X]+E[(E(Y∣X))2∣X]≤E(Y2∣X)−2E[(Yh(X))∣X]+E[(h(X))2∣X]
Pierwsza kadencja LHS i RHS anuluje się. Należy również pamiętać, że zewnętrzna oczekiwanie jest uzależnione od . Na podstawie właściwości warunkowych oczekiwań się kończyX
. . . ⇒ - 2 E( Y∣ X) ⋅ E( Y∣ X) + [ E( Y∣ X) ]2)≤ - 2 E( Y∣ X) h ( X) + [ h ( X) ]2)
⇒ 0 ≤ [ E( Y∣ X) ]2)- 2 E( Y∣ X) h ( X) + [ h ( X) ]2)
h ( x ) ≠ E ( Y ∣ X ) E ( Y ∣ X )
⇒ 0 ≤ [ E( Y∣ X) - h ( x ) ]2)
który zachowuje ścisłą nierówność, jeśli . Tak więc jest globalnym i unikalnym minimalizatorem.
h ( x ) ≠ E.( Y∣ X)mi( Y∣ X)
Ale to także mówi, że podejście polegające na dodawaniu i odejmowaniu nie jest tutaj najbardziej pouczającym dowodem.