Czy istnieje związek między podobieństwem cosinusa, korelacją Pearsona i wynikiem Z?


17

Zastanawiam się, czy istnieje jakikolwiek związek między tymi 3 miarami. Nie mogę nawiązać między nimi połączenia, odwołując się do definicji (być może dlatego, że jestem nowy w tych definicjach i mam trudności z ich złapaniem).

Wiem, że zakres podobieństwa cosinus może wynosić od 0 do 1, i że korelacja Pearsona może wynosić od -1 do 1, i nie jestem pewien co do zakresu wyniku Z.

Nie wiem jednak, w jaki sposób pewna wartość podobieństwa kosinusowego może ci coś powiedzieć o korelacji Pearsona lub wyniku Z i na odwrót?


1
z czego ? wyniki z niektórych rzeczy mogą być powiązane z korelacją Pearsona, wyniki z innych rzeczy mogą nie być. Na przykład, jeśli wewnętrznie ustandaryzujesz swoje oryginalne zmienne, to korelacja Pearsona między xiy jest oczekiwanym iloczynem ich wyników Z. Lub możesz mówić o wynikach Z korelacji Pearsona (korelacje Pearsona minus ich oczekiwanie pod pewnymi warunkami, wszystkie podzielone przez standardowy błąd korelacji Pearsona), co z pewnością byłoby powiązane z korelacją Pearsona.
Glen_b

1

Odpowiedzi:


30

Podobieństwo cosinus dwóch wektorów i b, jest to kąt między nimi cos θ = bab W wielu aplikacjach, które wykorzystują podobieństwo cosinus, wektory są nieujemne (np. Terminowy wektor częstotliwości dla dokumentu), aw tym przypadku podobieństwo cosinus również będzie nieujemne.

cosθ=abab

W przypadku wektora wektor „ z- score” zwykle definiuje się jako z = x - ˉ xxz gdzie ˉ x =1

z=xx¯sx
is 2 x = Ż ( x - ˉ x ) 2 stanowią średnią i odchylenie standardowex. Zatemzma średnią 0 i odchylenie standardowe 1, tzn.Zxjestznormalizowanąwersjąx.x¯=1nixisx2=(xx¯)2¯xzzxx

xy

ρx,y=(zxzy)¯

asa2=1na2

a^=aa=zan

ab

n


+1. komentarz latexnazi: \|często wygląda lepiej niż ||i \lVert ... \rVertjest najlepszym sposobem na napisanie go.
ameba mówi Przywróć Monikę
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.