Wielowymiarowy rozkład normalny współczynnika regresji?


12

Czytając podręcznik regresji napotkałem następujący akapit:

Oszacowanie najmniejszych kwadratów wektora współczynników regresji liniowej ( ) toβ

β^=(XtX)-1Xty

która, widziana jako funkcja danych (z uwzględnieniem predyktorów X jako stałych), jest liniową kombinacją danych. Korzystając z centralnego twierdzenia granicznego, można wykazać, że rozkład β będzie w przybliżeniu wielowymiarowy normalny, jeśli wielkość próbki jest duża.yXβ

Zdecydowanie brakuje mi czegoś w tekście, ale nie rozumiem, w jaki sposób pojedyncza wartość mieć rozkład? W jaki sposób generowanych jest wiele wartości β w celu uzyskania rozkładu, o którym mowa w tekście?ββ


4
jest wektorem współczynników regresji - czy to wyjaśnia zamieszanie? β
Makro

5
Korzystając z metody najmniejszych kwadratów, zakładasz, że jest stałe, ale nieznane. Jednakże, β , ponieważ jest to funkcja (losowej) danych, ma rozkład. Asymptotycznie rozkład jest rozkładem normalnym. Nie asymptotycznie indywidualny współczynnik będzie miał rozkład. ββ^
Taylor

7
Pomocne może być zaobserwowanie, że jest uważana za stałą macierz w ustawieniu regresji i że y jest realizacją zmiennej losowej (wektorowej). Że nieco o CLT, choć nie jest całkiem poprawny: jest ona polegać albo na H mający pewną strukturę, która czasami faktycznie nie występują nawet przy ogromnych zbiorów danych, albo na rw sama istota wielowymiarowa normalny (ale wtedy nie ma potrzeby wywołać CLT). H.=(XtX)-1XtyH.y
whuber

@Taylor Ale skąd znasz rozkład B, jeśli jedyne, co wiem, to to, że „wielkość próbki jest duża”?
powyżej

2
@Taylor Poszczególny składnik czynnika beta będzie miał rozkład tylko wtedy, gdy składnikiem błędu w modelu regresji jest gaussowski ze średnią 0 i stałą wariancją. W nietypowym przypadku niekoniecznie znasz jego rozkład pod hipotezą zerową, ale nadal może być asymptotycznie normalny. Jednak, jak stwierdza Whuber, centralne twierdzenie o granicy może nie być ważne, ponieważ jest to średnia ważona i musimy wiedzieć, że wagi nie zmieniają się przy wielkości próbki w sposób, który pozwala na kilka terminów zdominować sumę.
Michael R. Chernick

Odpowiedzi:


5

Nie ma rozkład, ale p , wskazanego przez Taylora. Rozkład beta wynika z faktu, że pojawi się inny p dla różnych próbek .--- Można oszacować tę dystrybucję opartą na pojedynczym p otrzymanej z pojedynczej próbki, pod warunkiem, że masz jakieś informacje dotyczące dystrybucji podstawowe dane.ββ^β^β^β^

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.