Test Walda w regresji (OLS i GLM): rozkład t- vs.

22

Rozumiem, że test Walda dla współczynników regresji oparta jest na następujących nieruchomości, które posiada asymptotycznie (np Wasserman (2006): Wszystko statystyk , stron 153, 214-215): gdzieoznacza oszacowany współczynnik regresji,oznacza błąd standardowy współczynnik regresji ijest wartością zainteresowania (zazwyczaj wynosi 0 aby sprawdzić, czy współczynnik różni się znacznie od 0). ZatemtestWaldwielkości: odrzucajgdy

\frac{(\hat{β} - β_{0})}{\hat{se} (\hat{β})} \sim N (0, 1)

$\frac{(\hat{\beta}-\beta_{0})}{\widehat{\operatorname{se}}(\hat{\beta})}\sim \mathcal{N}(0,1)$

\hat{β}

$\hat{\beta}$

\hat{se} (\hat{β})

$\widehat{\operatorname{se}}(\hat{\beta})$

β_{0}

$\beta_{0}$

β_{0}

$\beta_{0}$

α

$\alpha$

H_{0}

$H_{0}$

gdzie

| W | > z_{α / 2}

$|W|> z_{\alpha/2}$

W = \frac{\hat{β}}{\hat{se} (\hat{β})} .

$W=\frac{\hat{\beta}}{\widehat{\operatorname{se}}(\hat{\beta})}.$

Ale kiedy wykonujesz regresję liniową zw lmR, wartość zamiast wartości jest używana do testowania, czy współczynniki regresji różnią się znacznie od 0 (z ). Co więcej, wynik w R czasami daje - a czasami wartości jako statystyki testowe. Najwyraźniej wartości są używane, gdy zakłada się, że parametr dyspersji jest znany, a wartości są używane, gdy szacowany jest parametr dyspersji (patrz ten link ). $t$ $z$ summary.lmglm $z$ $t$ $z$ $t$

Czy ktoś mógłby wyjaśnić, dlaczego rozkład jest czasem stosowany w teście Walda, mimo że zakłada się, że stosunek współczynnika do jego błędu standardowego rozkłada się jako standardowa normalna? $t$

Edytuj po odpowiedzi na pytanie

Ten post zawiera również przydatne informacje do pytania.

r regression hypothesis-testing generalized-linear-model

— COOLSerdash
źródło

2

Co sprawia, że myślisz, że raportowana statystyka testu jest koniecznie testem Walda?

— Glen_b

3

Ponieważ wartości

lub

są zawsze współczynnikiem podzielonym przez błąd standardowy w i .

z

$z$

t

$t$ lmglm

— COOLSerdash

20

glm $z$ $\lambda$ glm $t$ rozkład .

$t$ $z$ zamiast tego statystyki test.

$t$

— wcampbell
źródło

3

Ogólnie rzecz biorąc, w strukturze GLM wspomniana statystyka testu W jest asymptotycznie rozkładem normalnym , dlatego widzisz w R wartości z .

Poza tym, gdy mamy do czynienia z modelem liniowym, czyli GLM z zmiennej Normal rozprowadzane odpowiedzi, rozkład statystyczny badania jest danej t Studenta , więc w R masz t wartości.

— EdoLu
źródło