νt
νt
set.seed(1234)
n <- 10
x <- rt(n, df=2.5)
make_loglik <- function(x)
Vectorize( function(nu) sum(dt(x, df=nu, log=TRUE)) )
loglik <- make_loglik(x)
plot(loglik, from=1, to=100, main="loglikelihood function for df parameter", xlab="degrees of freedom")
abline(v=2.5, col="red2")
n
Wypróbujmy niektóre symulacje:
t_nu_mle <- function(x) {
loglik <- make_loglik(x)
res <- optimize(loglik, interval=c(0.01, 200), maximum=TRUE)$maximum
res
}
nus <- replicate(1000, {x <- rt(10, df=2.5)
t_nu_mle(x) }, simplify=TRUE)
> mean(nus)
[1] 45.20767
> sd(nus)
[1] 78.77813
Wyświetlanie oszacowania jest bardzo niestabilne (patrząc na histogram, znaczna część oszacowanych wartości znajduje się w górnej granicy podanej w celu optymalizacji 200).
Powtarzanie z większą próbką:
nus <- replicate(1000, {x <- rt(50, df=2.5)
t_nu_mle(x) }, simplify=TRUE)
> mean(nus)
[1] 4.342724
> sd(nus)
[1] 14.40137
co jest znacznie lepsze, ale średnia wciąż znacznie przewyższa prawdziwą wartość 2,5.
Pamiętaj, że jest to uproszczona wersja prawdziwego problemu, w którym należy również oszacować parametry lokalizacji i skali.
tν