Dlaczego rozkład wariancji próbkowania jest rozkładem kwadratowym chi?

Wyrok

Rozkład próbkowania wariancji próbki jest rozkładem kwadratowym chi ze stopniem swobody równym , gdzie jest rozmiarem próbki (biorąc pod uwagę, że losowa zmienna będąca przedmiotem zainteresowania jest zwykle rozkładana). $n-1$ $n$

Źródło

Moja intuicja

Ma to dla mnie intuicyjny sens 1), ponieważ test chi-kwadrat wygląda jak suma kwadratu i 2) ponieważ rozkład chi-kwadrat jest po prostu sumą kwadratowego rozkładu normalnego. Ale nadal nie rozumiem tego dobrze.

Pytanie

Czy to stwierdzenie jest prawdziwe? Czemu?

— Remi.b
źródło

Wstępne oświadczenie jest ogólnie fałszywe (jest fałszywe z dwóch różnych powodów). Jakie jest twoje źródło (brakuje twojego linku) i co tak naprawdę mówi?

— Glen_b

Moje pytanie dotyczy także reakcji na pytanie-odpowiedź w klasie statystyk wprowadzających, dla której dostęp jest chroniony. Pytanie brzmi: „Jakim rozkładem jest rozkład próbkowania wariancji długości skrzydeł u much?” a odpowiedź brzmi „Rozkład chi-kwadrat”

— Remi.b

Cytowane oświadczenie w pierwszym komentarzu jest ogólnie nadal fałszywe. Komentarz na końcu źródła jest prawdziwy (przy niezbędnych założeniach): „ gdy próbki wielkości n są pobierane z rozkładu normalnego o wariancji , rozkład próbkowania ma rozkład chi-kwadrat z n-1 stopniami swobody. $\sigma^2$ $(n-1)s^2/\sigma^2$ ”... Odpowiedź na pytanie w twoim drugim komentarzu również będzie fałszywa - chyba, że, jak sądzę, ktoś wykazał, że długość skrzydła jest zwykle rozkładana. (Jaka może być podstawa do stwierdzenia, że to prawda?)

— Glen_b

Załóżmy więc, że skrzydła są normalnie rozłożone, to rozkład próbkowania

byłby rozkładem chi-kwadrat. Dlaczego tak jest

(n - 1) s^{2} / σ^{2}

$(n-1)s^2/\sigma^2$

— Remi.b

Czy wiesz, że suma kwadratów zmiennych losowych

iid N (0,1) jest chi-kwadrat z

df? Czy jest to część, której szukasz?

k

$k$

k

$k$

— Glen_b

[Przyjmę z dyskusji w twoim pytaniu, że z przyjemnością przyjmiesz fakt, że jeśli są niezależnymi identycznie rozmieszczonymi zmiennymi losowymi, to .] $Z_i, i=1,2,\ldots,k$ $N(0,1)$ $\sum_{i=1}^{k}Z_i^2\sim \chi^2_k$

Formalnie wynik, którego potrzebujesz, wynika z twierdzenia Cochrana . (Chociaż można to pokazać na inne sposoby)

Mniej formalnie, należy wziąć pod uwagę, że gdybyśmy znali średnią populacji i oszacowali wariancję na jej temat (a nie na temat średniej próby): , a następnie $s_0^2 = \frac{1}{n} \sum_{i=1}^{n}(X_i-\mu)^2$ , (), który będzie wynosił $s_0^2/\sigma^2 = \frac{1}{n} \sum_{i=1}^{n}\left(\frac{X_i-\mu}{\sigma}\right)^2=\frac{1}{n} \sum_{i=1}^{n}Z_i^2$ $Z_i=(X_i-\mu)/\sigma$ razy zmiennych losowych. $\frac{1}{n}$ $\chi^2_n$

Fakt, że zastosowano średnią z próby, zamiast średniej populacji ( ), zmniejsza sumę kwadratów odchyleń, ale w taki sposób, że $Z_i^*=(X_i-\bar{X})/\sigma$ (o których patrz twierdzenie Cochrana). Dlatego zamiast mamy teraz . $\sum_{i=1}^{n}(Z_i^*)^2\,\sim\chi^2_{n-1}$ $ns_0^2/\sigma^2\sim \chi^2_n$ $(n-1)s^2/\sigma^2\sim\chi^2_{n-1}$

— Glen_b - Przywróć Monikę
źródło

@Glen_b Czy możesz podać odniesienia do innych dowodów na ten fakt? Naprawdę chcę to wiedzieć.

— Henry.L

Który z kilku faktów jesteś po dowodzie?

— Glen_b

@Glen_b Jedynymi dwiema metodami oprócz twierdzenia Cochrana-Madow'a o udowodnieniu tego faktu, że wariancja próbki i średnia próbki są statystycznie niezależne z rozkładem chi-kwadrat to: (1) Podstawa kanoniczna Scheffe'a (Scheffe, 1959) (2) Metody kumulatywne (Lub mgfs, co jest równoważne). Jeśli znasz więcej metod, naprawdę chcę je poznać.

— Henry.L,

Jeszcze jeden komentarz, który chcę dodać, jest taki, że używana jest średnia próbki, ale czasami chcemy stałej mocy niezależnej od ustalonej wariancji, tę metodę zastępuje się dwustopniową metodą Steina (1949).

— Henry.L,

\bar{X}

$\bar X$

X_{i}^{'} s

$X_i's$