Interesuje mnie geometryczne znaczenie wielokrotnej korelacji i współczynnik determinacji w regresji lub w notacji wektorowej,
Tutaj macierz projektowa ma wierszy kolumn, z których pierwszą jest , wektor 1s, który odpowiada przecięciu .
Geometria jest bardziej interesująca w wymiarowej przestrzeni przedmiotowej niż w wymiarowej przestrzeni zmiennej. Zdefiniuj macierz kapelusza:
Jest to rzut ortogonalny na przestrzeń kolumny , tj. Mieszkanie przez początek rozpięte przez wektorów reprezentujących każdą zmienną , z których pierwszy to \ mathbf {1} _n . Następnie \ mathbf {H} rzutuje wektor zaobserwowanych odpowiedzi \ mathbf {y} na swój „cień” na mieszkanie, wektor dopasowanych wartości \ mathbf {\ hat {y}} = \ mathbf {Hy} , a jeśli patrząc wzdłuż ścieżki projekcji widzimy wektor reszt \ mathbf {e} = \ mathbf {y} - \ mathbf {\ hat {y}} tworzy trzecią stronę trójkąta. To powinno zapewnić nam dwie drogi do geometrycznej interpretacji R ^ 2x I 1 ń H Y Y = H r e = y - y R 2:
- Kwadrat wielokrotnego współczynnika korelacji, , który jest zdefiniowany jako korelacja między i . Będzie to wyglądało geometrycznie jako cosinus kąta.
- Pod względem długości wektorów: na przykład .
Z przyjemnością zobaczyłem krótkie sprawozdanie, które wyjaśnia:
- Drobne szczegóły dla (1) i (2),
- Dlaczego (1) i (2) są równoważne,
- W skrócie, w jaki sposób wgląd geometryczny pozwala nam wizualizować podstawowe właściwości , na przykład dlaczego zmienia się na 1, gdy wariancja szumu spada do 0. (W końcu, jeśli nie możemy intuicyjnie z naszej wizualizacji, to jest to tylko ładne zdjęcie.)
Rozumiem, że jest to prostsze, jeśli zmienne są najpierw wyśrodkowane, co usuwa punkt przecięcia z pytania. Jednak w większości kont podręczników, które wprowadzają regresję wielokrotną, macierz projektowa jest taka, jak to ułożyłem. Oczywiście dobrze jest, jeśli ekspozycja zagłębia się w przestrzeń rozpiętą przez wyśrodkowane zmienne, ale dla wglądu w podręcznikową algebrę liniową bardzo pomocne byłoby odniesienie tego do tego, co dzieje się geometrycznie w nieośrodkowej sytuacji. Naprawdę wnikliwe odpowiedź może wyjaśnić , co dokładnie się uszkodzi geometrycznie gdy termin osią jest odrzucany1 n - czyli gdy wektorjest usuwany z zestawu rozpinającego. Nie sądzę, aby ten ostatni punkt można rozwiązać, biorąc pod uwagę tylko wyśrodkowane zmienne.