Oprócz licznych (poprawnych) komentarzy innych użytkowników wskazujących, że wartość dla jest identyczna z wartością dla globalnego testu , należy zauważyć, że można również uzyskać wartość p powiązaną z r 2 „bezpośrednio” wykorzystując fakt, że r 2 pod hipotezą zerową jest dystrybuowany jako Beta ( v npr2pFpr2r2Beta(vn2,vd2), w którymvnivdsą licznik i mianownik stopnia swobody, odpowiednio, do związanegoF-statistic.
Trzeci punkt w podsekcji Pochodzenie z innych dystrybucji wpisu Wikipedii w wersji beta mówi nam, że:
Jeśli X∼χ2(α) i Y∼χ2(β) są niezależne, to XX+Y∼Beta(α2,β2).
Cóż, możemy napisać r2 w tym XX+YFormularz X + Y.
Niech SSY będzie sumą kwadratów dla zmiennej Y , SSE będzie sumą błędów kwadratu dla regresji Y dla niektórych innych zmiennych, a SSR będzie „sumą kwadratów zredukowanych”, to znaczy SSR=SSY−SSE . Następnie
I oczywiście, jako sumy kwadratów,SSRiSSEsą podzielone jakoχ2 odpowiedniozvnivdstopniami swobody. Dlatego
r2∼Beta(vn
r2=1−SSESSY=SSY−SSESSY=SSRSSR+SSE
SSRSSEχ2vnvd
(Oczywiście nie pokazałem, że dwa kwadraty chi są niezależne. Może komentator może coś o tym powiedzieć.)
r2∼Beta(vn2,vd2)
Demonstracja w języku R (kod wypożyczenia z @gung):
set.seed(111)
x = runif(20)
y = 5 + rnorm(20)
cor.test(x,y)
# Pearson's product-moment correlation
#
# data: x and y
# t = 1.151, df = 18, p-value = 0.2648
# alternative hypothesis: true correlation is not equal to 0
# 95 percent confidence interval:
# -0.2043606 0.6312210
# sample estimates:
# cor
# 0.2618393
summary(lm(y~x))
# Call:
# lm(formula = y ~ x)
#
# Residuals:
# Min 1Q Median 3Q Max
# -1.6399 -0.6246 0.1968 0.5168 2.0355
#
# Coefficients:
# Estimate Std. Error t value Pr(>|t|)
# (Intercept) 4.6077 0.4534 10.163 6.96e-09 ***
# x 1.1121 0.9662 1.151 0.265
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
# Residual standard error: 1.061 on 18 degrees of freedom
# Multiple R-squared: 0.06856, Adjusted R-squared: 0.01681
# F-statistic: 1.325 on 1 and 18 DF, p-value: 0.2648
1 - pbeta(0.06856, 1/2, 18/2)
# [1] 0.2647731