Współczynnik determinacji w wielokrotnej regresji liniowej: W wielokrotnej regresji liniowej współczynnik determinacji można zapisać w kategoriach korelacji par dla zmiennych za pomocą postaci kwadratowej:
R2=rTy,xr−1x,xry,x,
gdzie to wektor korelacji między wektorem odpowiedzi a każdym z wektorów objaśniających, a jest macierzą korelacji między wektorami objaśniającymi (więcej informacji na ten temat można znaleźć w powiązanym pytaniu ). W przypadku regresji dwuwymiarowej masz:ry,xrx,x
R2=[rY,X1rY,X2]T[1rX1,X2rX1,X21]−1[rY,X1rY,X2]=11−r2X1,X2[rY,X1rY,X2]T[1−rX1,X2−rX1,X21][rY,X1rY,X2]=11−r2X1,X2(r2Y,X1+r2Y,X2−2rX1,X2rY,X1rY,X2).
W swoim pytaniu nie określiłeś kierunków korelacji jednowymiarowych, więc bez utraty ogólności oznaczymy . Podstawienie wartości oraz daje:D≡sgn(rY,X1)⋅sgn(rY,X2)∈{−1,+1}r2Y,X1=0.3r2Y,X2=0.4
R2=0.7−20.12−−−−√⋅D⋅rX1,X21−r2X1,X2.
Możliwe jest, że , ponieważ możliwe jest, że łączna informacja z dwóch zmiennych jest większa niż suma jej części. To interesujące zjawisko nazywa się „ulepszeniem” (patrz np. Lewis i Escobar 1986 ).R2>0.7