Rozważ prostą regresję (nie zakłada się normalności): gdzie jest ze średnią i odchyleniem standardowym . Są najmniej kwadratowe Szacunki i nieskorelowane?
Rozważ prostą regresję (nie zakłada się normalności): gdzie jest ze średnią i odchyleniem standardowym . Są najmniej kwadratowe Szacunki i nieskorelowane?
Odpowiedzi:
Jest to ważna kwestia przy projektowaniu eksperymentów, w których pożądane może być brak (lub bardzo mała) korelacja między szacunkami i . Taki brak korelacji można osiągnąć kontrolując wartości .
Aby przeanalizować wpływ na oszacowania, wartości (które są wektorami rzędów o długości ) są montowane pionowo w macierzy , macierzy projektowej, mają tyle wierszy, ile jest danych i (oczywiście ) dwie kolumny. Odpowiednie są złożone w jeden długi (kolumnowy) wektor . W tych kategoriach, pisząc dla zmontowanych współczynników, model jest
jest (zazwyczaj) zakłada się niezależnymi zmiennymi losowymi których odchylenia są stałe z nieznanych . Za obserwacje zależne uważa się jedną realizację losowej zmiennej o wartości wektorowej .
Rozwiązaniem OLS jest
zakładając, że istnieje odwrotność macierzy. Zatem stosując podstawowe właściwości mnożenia macierzy i kowariancji,
Macierz ma tylko dwa wiersze i dwie kolumny, odpowiadające parametrom modelu . Korelacja z jest proporcjonalny do elementów niediagonalnych które z reguły Cramera są proporcjonalne do iloczyn skalarny dwóch kolumnach . Ponieważ jedna z kolumn ma wszystkie s, a iloczyn iloczynu z drugą kolumną (składającą się z ) jest ich sumą, znajdujemy
i są nieskorelowane, jeśli tylko suma (lub równoważnie średnia) wynosi zero.
Ten warunek ortogonalności często osiąga się przez recentering się (poprzez odjęcie ich średnią od siebie). Chociaż nie zmieni to szacowanego nachylenia , zmienia szacowany przecięcie . To, czy jest to ważne, zależy od aplikacji.
Ta analiza dotyczy regresji wielokrotnej: macierz projektowa będzie mieć kolumn dla zmiennych niezależnych (dodatkowa kolumna składa się z s), a będzie wektorem długości , ale w przeciwnym razie wszystko przebiega tak jak poprzednio.
W języku konwencjonalnym dwie kolumny są nazywane ortogonalnymi, gdy ich iloczyn iloczynu wynosi zero. Gdy jedna kolumna (powiedzmy kolumnie ) jest prostopadła do pozostałych kolumnach, to łatwo wykazać algebraiczne, że wszystkie wpisy niediagonalnych w rzędzie i kolumny z są zerowe (to znaczy, komponenty i dla wszystkich są zerowe). W konsekwencji,
Dwa oszacowania współczynnika regresji wielokrotnej i są nieskorelowane, ilekroć jedna (lub obie) odpowiednich kolumn macierzy projektowej są ortogonalne względem wszystkich innych kolumn.
Wiele standardowych projektów eksperymentalnych polega na wyborze wartości zmiennych niezależnych, aby kolumny były wzajemnie prostopadłe. To „oddziela” otrzymane szacunki, gwarantując - zanim jakiekolwiek dane zostaną zebrane! - że oszacowania będą nieskorelowane. (Gdy odpowiedzi mają rozkład normalny, oznacza to, że szacunki będą niezależne, co znacznie upraszcza ich interpretację).