Wyniki regresji transformacji wstecznej podczas modelowania dziennika (y)


11

Dopasowuję regresję do . Czy poprawne jest obliczanie szacunkowych punktów przekształcenia (i przedziałów ufności / prognozowania) przez potęgowanie? Nie wierzę tak, ponieważ E [ f ( X ) ] f ( E [ X ] ), ale chciał opinii innych.log(y)E[f(X)]f(E[X])

Mój przykład poniżej pokazuje konflikty z transformacją wsteczną (.239 vs .219).

set.seed(123)

a=-5
b=2

x=runif(100,0,1)
y=exp(a*x+b+rnorm(100,0,.2))
# plot(x,y)

### NLS Fit
f <- function(x,a,b) {exp(a*x+b)} 
fit <- nls(y ~ exp(a*x+b),  start = c(a=-10, b=15)) 
co=coef(fit)
# curve(f(x=x, a=co[1], b=co[2]), add = TRUE,col=2,lwd=1.2) 
predict(fit,newdata=data.frame(x=.7))
[1] 0.2393773

### LM Fit
# plot(x,log(y))
# abline(lm(log(y)~x),col=2)
fit=lm(log(y)~x)
temp=predict(fit,newdata=data.frame(x=.7),interval='prediction')
exp(temp)
        fit       lwr       upr
1 0.2199471 0.1492762 0.3240752

1
Czy to nie jest jeden z problemów, który rozwiązują połączone z logami gaussowskie GLM?
generic_user

@ARM Tak, wierzę w to. Dzięki za zwrócenie na to uwagi. Jednak przy użyciu GLM trudniej jest uzyskać przedziały prognozowania, ale myślę, że mogę to wypracować.
Glen

1
@Glen Wykonaj wyszukiwanie mazania Duana na tej stronie.
Dimitriy V. Masterov

Odpowiedzi:


13

To zależy od tego, co chcesz uzyskać na drugim końcu.

Przedział ufności dla przekształconego parametru transformuje się dobrze. Jeśli ma nominalne pokrycie w skali logarytmicznej, będzie miało to samo pokrycie z powrotem w pierwotnej skali, ze względu na monotoniczność transformacji.

Przedział przewidywania dla przyszłych obserwacji również dobrze się zmienia.

Przedział dla średniej na skali logarytmicznej zazwyczaj nie będzie odpowiednim przedziałem dla średniej na pierwotnej skali.

Czasami jednak można dokładnie lub w przybliżeniu uzyskać rozsądne oszacowanie średniej na oryginalnej skali z modelu na skali logarytmicznej.

Konieczna jest jednak ostrożność, w przeciwnym razie może dojść do sporządzenia oszacowań, które mają nieco zaskakujące właściwości (możliwe jest wytworzenie oszacowań, które same nie mają na przykład średniej populacyjnej; nie jest to pomysł każdego dobrego).

exp(μi)exp(μi+12σ2)exp(μi^)exp(12σ2)

σ2

σ^2σ2exp(μi^)exp(12σ^2)exp(μi^)exp(12σ2)μi^μiexp(μi^)exp(μi)

Zobacz tutaj .

Niektóre powiązane posty:

Wsteczna transformacja modelu MLR

Wsteczna transformacja

Odwrócone przedziały ufności


1
Dzięki, spojrzałem na poprzednie posty i chociaż oświecając, wciąż byłem nieco zdezorientowany, stąd moje pytanie.
Glen

12σ2^

1
E(Y)=0yf(y)dyfE(eX)X=logYXYt1,2,...

1
exetxe...x12

1
teμt+12σ2t2
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.