Załóżmy, że korzystam z regresji liniowej, która ma postać .
Jeśli jest dodatnia, czy oznacza to dodatnią korelację między i ? (Odwrotnie, korelacja ujemna, jeśli jest ujemna?)
Załóżmy, że korzystam z regresji liniowej, która ma postać .
Jeśli jest dodatnia, czy oznacza to dodatnią korelację między i ? (Odwrotnie, korelacja ujemna, jeśli jest ujemna?)
Odpowiedzi:
Nie, niezerowa nie oznacza, że i są skorelowane. Oznacza to, że jest skorelowany z .
Wyobraź sobie, że mamy dane o wizytach osób na stacji benzynowej.
jest kosztem napełnienia zbiornika paliwa danej osoby. prawie na pewno jest skorelowane z , wydatkami na gaz podczas tej wizyty.
Dodatni w tym trywialnym przykładzie nie oznacza, że wielkość czyjegoś zbiornika gazu jest skorelowana z ceną gazu. Dodatnia oznaczałaby, że wydatki są dodatnie związane z pojemnością czyjś zbiornika gazu mierzoną w dolarach (tj. ).
Oto potencjalnie zastosowany kontrprzykład: załóżmy, że to płeć, to lata nauki, a to zarobki na rynku pracy. Po 12 latach szkoły podstawowej i średniej i trzyletnim licencjacie ukończyłbyś 15 lat nauki.
Zatem nie jest całkowicie wykluczone, że i są nieskorelowane - w przeszłości mężczyźni mieli wyższe stopnie, a obecnie kobiety. Prawdopodobnie był (nie tak odległy) moment, w którym płeć i lata nauki były nieskorelowane, a korelacja z pewnością nie jest dziś silna.
A jednak nie jest trudno uzasadnić, że , jako dodatkowy rok nauki, może mieć różny wpływ na zarobki mężczyzn niż kobiet.
Tak byłoby na przykład w przypadku „dyskryminacji płacowej” (w cudzysłowie, ponieważ jest to bardzo gorąca kwestia), głównie w przypadku miejsc pracy dla lepiej wykształconych pracowników. Anegdotyczne dowody sugerują, że może tak być, ponieważ mężczyźni na stanowiskach kierowniczych są zwykle lepiej wynagradzani niż kobiety. Z drugiej strony, wynagrodzenia na stanowiskach wymagających mniejszego wykształcenia mogą być częściej określane przez szerokie porozumienia między związkami zawodowymi i stowarzyszeniami pracodawców (przynajmniej na przykład w Europie kontynentalnej), pozostawiając mniej miejsca na dyskryminację płacową.
(Znaki cudzysłowu można na przykład uzasadnić faktem, że ta prosta historia nie uwzględnia sektorów, doświadczenia itp.)