Czy korelacja jest równoważna asocjacji?


27

Mój profesor statystyki twierdzi, że słowo „korelacja” odnosi się ściśle do relacji liniowych między zmiennymi, podczas gdy słowo „powiązanie” odnosi się szeroko do każdego rodzaju relacji. Innymi słowy, twierdzi, że termin „korelacja nieliniowa” jest oksymoronem.

Z tego, co mogę zrobić z tego rozdziału w artykule w Wikipedii na temat „ Korelacja i zależność ”, współczynnik korelacji Pearsona opisuje stopień „liniowości” w relacji między dwoma zmiennymi. Sugeruje to, że termin „korelacja” w rzeczywistości dotyczy wyłącznie relacji liniowych.

Z drugiej strony szybkie wyszukiwanie w Google „ korelacji nieliniowej ” ujawnia wiele opublikowanych prac, które używają tego terminu.

Czy mój profesor ma rację, czy też „korelacja” jest po prostu synonimem „stowarzyszenia”?


1
Z drugiej strony istnieje również „asocjacja liniowa”.
Bogdanovist

Odpowiedzi:


37

Nie; korelacja nie jest równoważna skojarzeniu. Jednak znaczenie korelacji zależy od kontekstu.

Klasyczna definicja statystyki polega na zacytowaniu w Encyklopedii nauk statystycznych Kotza i Johnsona „miary siły liniowej zależności między dwiema zmiennymi losowymi”. W statystyce matematycznej „korelacja” wydaje się mieć tę interpretację.

W zastosowanych obszarach, w których dane są zwykle porządkowe, a nie numeryczne (np. Psychometria i badania rynku), definicja ta nie jest tak pomocna, ponieważ pojęcie liniowości zakłada dane o właściwościach w skali interwałowej. W konsekwencji, w tych polach korelacja jest interpretowana jako wskazująca na monotonicznie rosnący lub malejący wzorzec dwuwymiarowy lub korelację rang. Opracowano wiele nieparametrycznych statystyk korelacji (np. Korelacja Spearmana i tau-b Kendalla). Są one czasami nazywane „korelacjami nieliniowymi”, ponieważ są to statystyki korelacji, które nie zakładają liniowości.

Wśród niestatystów korelacja często oznacza związek (czasem z konotacją przyczynową, a czasem bez niej). Niezależnie od etymologii korelacji, rzeczywistość jest taka, że ​​wśród niestatystów ma to szersze znaczenie i żadna ilość karania ich za niewłaściwe użycie prawdopodobnie tego nie zmieni. Zrobiłem „google” i wydaje się, że niektóre zastosowania korelacji nieliniowej wydają się być tego rodzaju (w szczególności wydaje się, że niektórzy ludzie używają tego terminu do oznaczania gładkiej nieliniowej zależności między zmiennymi numerycznymi) .

Zależny od kontekstu charakter terminu „korelacja nieliniowa” może być może niejednoznaczny i nie powinien być stosowany. Jeśli chodzi o „korelację”, musisz poznać kontekst osoby używającej tego terminu, aby wiedzieć, co one oznaczają.


6
+1 Przemyślana i kompetentna odpowiedź. Proszę rozważyć zakwalifikowanie początkowego „nie”, ponieważ zajmuje to trochę czytania i zastanowiłem się, czy oznacza to „nie, profesor nie ma racji” lub „nie”, „korelacja” nie jest synonimem „związku przyczynowego” lub połączenie tych dwóch.
whuber

Dziękuję za komentarz; Odpowiednio zredagowałem swoją odpowiedź.
Tim

1
To doskonała odpowiedź (i pytanie), która zawiera kilka szerszych zagadnień dotyczących terminologii, języka i ogólnie komunikacji, o które wszyscy musimy się zadbać.
Peter Ellis

3
Czym więc jest skojarzenie?
Owca,

5

Nie widzę sensu w rozplątywaniu terminów „korelacja” i „skojarzenie”. W końcu sam Pearson (i inni) opracował miarę relacji nieliniowej, którą nazwali „ współczynnikiem korelacji ”.


1
Tak, wydaje się w tym momencie, że trudno je rozdzielić, zwłaszcza biorąc pod uwagę historię (np. Jak wspominasz) i postrzeganie społeczne.
Behacad

2

Wydaje się, że istnieje nieporozumienie dotyczące skojarzenia. Miary asocjacji (wielkość efektu) są nieodłącznie związane z analizą ilościową, a nie jakościową.


1
Może powinieneś pomyśleć o przekształceniu tego w komentarz. Odpowiedzi są zwykle nieco bardziej rozbudowane
doktorat

@Alessandro Tak, bardziej potrzebny na odpowiedź, ale OP nie ma wystarczającej reputacji (> +50), aby móc komentować. Może moderator może przekształcić go w komentarz dla niego.
Carl

0

Powiedziałbym, że korelacja dotyczy danych ilościowych i powiązania z danymi jakościowymi i oba nie mają obowiązkowego związku przyczynowego.


Co rozumiesz przez „powiązanie z danymi jakościowymi”?
Randel

0

Pomysł, że ciężar (mężczyzny) nie jest skorelowany z wysokością (ponieważ odpowiadająca mu funkcja jest trzeciego stopnia, a nie liniowa) wydaje mi się bardzo dziwny. Korelację liniową należy traktować jako szczególny przypadek skojarzenia.


1
Ale z którym (lub czyim) pomysłem się sprzeciwiasz? Korelację można tu obliczyć jako (b) korelacja między obserwowanymi i przewidywanymi wartościami z dowolnej kombinacji terminów, a także (przypuszczalnie) (a) niezerowa korelacja między wagą a wzrostem.
Nick Cox,

-1

Korelacja i asocjacja są różne. Korelacja opisuje trzy typy relacji: pozytywną, negatywną i nieskorelowaną. Opisuje również wielkość korelacji od 0 do 1, od -1 do 0. Powiązanie nie ujawnia, jakie typy powiązań i ile powiązań.


Jakie jest tutaj pytanie?
Christoph Hanck

Ponieważ nie definiujesz powiązania ani nie wyjaśniasz, czym się ono różni, trudno jest zrozumieć, dlaczego Twoim zdaniem odpowiedziałeś na pytanie. To nie dodaje się do poprzednich odpowiedzi.
Nick Cox,

-2

Jeśli chodzi o liniowość, reakcja Tima i Nicka Coxa całkowicie ją objęła. Pomyślałem, że mogę wnieść swój wkład, to czysty sposób na zastanowienie się nad różnicą między skojarzeniem a korelacją.

Skojarzenie --- mierzy, jak blisko powiązane są dwie zmienne (tj. Czy są zależne czy niezależne).

Korelacja --- mierzy, w jaki sposób powiązane są dwie zmienne (tj. Dodatnie lub ujemne).


Na koniec argumentowałbym, że nigdy nie można się pomylić, traktując je wyraźnie, co pomoże w interpretacji i analizach na dłuższą metę. Mam nadzieję że to pomoże.


2
Nie głosowałem za tym i dziękuję za pozytywny komentarz (właśnie zastosowałem edycję). Niestety, rozmazuje dyskusję. Miary asocjacji często nie mają nic wspólnego z tym, która zmienna jest zależna. Korelacja mierzy także „jak blisko”: każda definicja korelacji opiera się na konkretnej definicji sposobu, w jaki zmienne są (idealnie) powiązane (liniowo, monotonicznie itp.). Przykłady rodziny naprawdę nie pomagają, nawet jako analogie: np. matka, ojciec, wujek nie są zmiennymi ilościowymi w tym przykładzie. Przykro mi, ale dokonane przez ciebie rozróżnienie wcale nie jest czyste.
Nick Cox,

Także „wspólna krew” i „wyobcowanie” są zupełnie inne!
Nick Cox,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.