Aby zrozumieć, dlaczego używamy rozkład t, trzeba wiedzieć, co jest podstawową rozkład beta i reszta sumy kwadratów ( R S S ), ponieważ te dwa razem wzięte daje rozkład t.βˆRSS
Łatwiej jest to rozkład P , który jest rozkład normalny - oczekuje Należy zauważyć, że β = ( X , T X ) - 1 x T Y jest więc funkcją liniową Y , gdzie Y ~ N ( X β , σ 2)βˆβˆ(XTX)−1XTYY . W wyniku tego jest również rozkład normalny, β ~ N ( p , σ 2 ( X , T X ) -Y∼N(Xβ,σ2In)- daj mi znać, jeśli potrzebujesz pomocy wyprowadzenia rozkładu beta .βˆ∼N(β,σ2(XTX)−1)βˆ
Dodatkowo, , gdzie n jest liczbą obserwacji, a p jest liczbą parametrów zastosowanych w regresji. Dowód tego jest nieco bardziej zaangażowany, ale także prosty do uzyskania (patrz dowód tutaj Dlaczego RSS jest dystrybuowany chi razy razy np? ).RSS∼σ2χ2n−pnp
Do tego momentu Rozważałam wszystko w macierz / wektor notacja, ale niech do wykorzystania prostoty β I i używać jej rozkład normalny, który da
nam: β i - β iβˆi
βˆi−βiσ(XTX)−1ii−−−−−−−−√∼N(0,1)
Dodatkowo z rozkładu chi- wynika, że:
( n - p ) s 2RSS
(n−p)s2σ2∼χ2n−p
Było to po prostu przegrupowanie pierwszego wyrażenia chi-kwadrat i jest niezależne od . Dodatkowo definiujemy s 2 = R S SN(0,1) , który jest obiektywnym estymatorem dlaσ2. Zgodnie z definicjątn-pdzielenie rozkładu normalnego przez niezależny kwadrat chi (ponad jego stopnie swobody) daje rozkład t (dla dowodu patrz:norma podzielona przez√s2=RSSn−pσ2tn−p daje T-dowód - dowódχ2(s)/s−−−−−−√) otrzymujesz:
βˆi−βis(XTX)−1ii−−−−−−−−√∼tn−p
Gdzie .s(XTX)−1ii−−−−−−−−√=SE(βˆi)
Daj mi znać, czy to ma sens.