Biorąc pod uwagę dwie zmienne losowe i \ eta , możemy obliczyć ich „współczynnik korelacji” c i utworzyć linię najlepszego dopasowania między tymi dwiema zmiennymi losowymi. Moje pytanie brzmi: dlaczego?η c
1) Istnieją zmienne losowe, i które są zależne w najgorszy możliwy sposób, tj. i pomimo tego . Gdyby pomyśleć tylko o regresji liniowej, byłby na to całkowicie zaślepiony.
2) Dlaczego konkretnie liniowy? Istnieją inne rodzaje relacji, które mogą istnieć między zmiennymi losowymi. Po co wyróżniać tę spośród wszystkich innych?