Może to pytanie jest naiwne, ale:
Jeśli regresja liniowa jest ściśle związana ze współczynnikiem korelacji Pearsona, czy istnieją jakieś techniki regresji ściśle związane ze współczynnikami korelacji Kendalla i Spearmana?
Może to pytanie jest naiwne, ale:
Jeśli regresja liniowa jest ściśle związana ze współczynnikiem korelacji Pearsona, czy istnieją jakieś techniki regresji ściśle związane ze współczynnikami korelacji Kendalla i Spearmana?
Odpowiedzi:
Istnieje bardzo prosty sposób użycia prawie dowolnej miary korelacji w celu dopasowania do regresji liniowych i który odtwarza najmniejsze kwadraty, gdy używasz korelacji Pearsona.
Ta definicja działa na przykład z wszystkimi rodzajami korelacji opartych na rangach. Można go również wykorzystać do uzyskania odstępu dla nachylenia (w zwykły sposób - poprzez znalezienie nachyleń, które wyznaczają granicę między tylko znaczącymi korelacjami a tylko nieistotnymi korelacjami).
Oto wykreślona korelacja względem nachylenia car
danych w R:
Korelacja Pearsona przecina 0 na zboczu co najmniej kwadratów, 3,932
Korelacja Kendalla przecina 0 na zboczu Theil-Sen, 3,667
Korelacja Spearmana przecina 0, dając nachylenie „linii włóczni” 3,714
Są to trzy szacunkowe wartości nachylenia dla naszego przykładu. Teraz potrzebujemy przechwyceń. Dla uproszczenia użyję średniej resztkowej dla pierwszego przechwytywania i mediany dla pozostałych dwóch (w tym przypadku nie ma to większego znaczenia):
intercept
Pearson: -17.573 *
Kendall: -15.667
Spearman: -16.285
* (niewielka różnica od najmniejszych kwadratów wynika z błędu zaokrąglania w oszacowaniu nachylenia; bez wątpienia w innych oszacowaniach występuje podobny błąd zaokrąglania)
Odpowiednie dopasowane linie (przy użyciu tego samego schematu kolorów co powyżej) to:
Edycja: Dla porównania nachylenie kwadrantu-korelacji wynosi 3,333
Zarówno korelacja Kendalla, jak i nachylenie Spearmana są znacznie bardziej odporne na wpływowe wartości odstające niż najmniejsze kwadraty. Zobacz tutaj dramatyczny przykład w przypadku Kendall.
Model PO jest szczególnym przypadkiem bardziej ogólnej rodziny modeli skumulowanego prawdopodobieństwa (niektóre połączenia skumulowane połączenie), w tym probit, proporcjonalnych zagrożeń i uzupełniających modeli log-log. Studium przypadku znajduje się w rozdziale 15 moich materiałów informacyjnych .
Aaron Han (1987 w ekonometrii) zaproponował estymator maksymalnej korelacji rang, który pasuje do modeli regresji poprzez maksymalizację tau. Dougherty i Thomas (2012 w literaturze psychologicznej) zaproponowali ostatnio bardzo podobny algorytm. Istnieje wiele prac nad MRC ilustrujących jego właściwości.
Aaron K. Han, Analiza nieparametryczna uogólnionego modelu regresji: estymator maksymalnej korelacji rang, Journal of Econometrics, tom 35, wydania 2–3, lipiec 1987, strony 303-316, ISSN 0304-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 . ( http://www.sciencedirect.com/science/article/pii/0304407687900303 )
Dougherty, MR i Thomas, RP (2012). Solidne podejmowanie decyzji w świecie nieliniowym. Przegląd psychologiczny, 119 (2), 321. Źródło: http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf .