Mam dane, dla których obliczyłem korelację Spearmana i chcę ją wizualizować dla publikacji. Zmienna zależna jest uszeregowana, zmienna niezależna nie jest. To, co chcę zwizualizować, to bardziej ogólny trend niż faktyczne nachylenie, więc uszeregowałem niezależność i zastosowałem korelację / regresję Spearmana. Ale kiedy sporządziłem swoje dane i miałem zamiar wstawić je do mojego rękopisu, natknąłem się na to oświadczenie (na tej stronie internetowej ):
Prawie nigdy nie użyjesz linii regresji ani do opisu, ani do prognozy podczas korelacji rang Spearmana, więc nie obliczaj ekwiwalentu linii regresji .
i później
Możesz wykreślić dane korelacji rang Spearmana w taki sam sposób, jak w przypadku regresji liniowej lub korelacji. Nie należy jednak umieszczać linii regresji na wykresie ; wprowadzanie liniowej linii regresji na wykresie byłoby mylące, gdy analizowałbyś ją za pomocą korelacji rang.
Chodzi o to, że linie regresji nie różnią się tak bardzo, jak kiedy nie oceniam niezależności i nie obliczam korelacji Pearsona. Trend jest taki sam, ale z powodu wygórowanych opłat za kolorową grafikę w czasopismach poszedłem z monochromatyczną reprezentacją, a rzeczywiste punkty danych nakładają się tak bardzo, że nie można ich rozpoznać.
Mógłbym oczywiście obejść ten problem, tworząc dwa różne wykresy: jeden dla punktów danych (w rankingu) i jeden dla linii regresji (nierankingowany), ale jeśli okaże się, że podane przeze mnie źródło jest nieprawidłowe lub problem w moim przypadku nie jest to problematyczne, ułatwiłoby mi to życie. (Widziałem też to pytanie , ale to mi nie pomogło).
Edytuj, aby uzyskać dodatkowe informacje:
Zmienna niezależna na osi x reprezentuje liczbę cech, a zmienna zależna na osi y reprezentuje pozycję algorytmów klasyfikacji w porównaniu z ich wydajnością. Teraz mam kilka algorytmów, które są porównywalne średnio, ale chcę powiedzieć z moją fabułą: „Podczas gdy klasyfikator A staje się lepszy, tym więcej funkcji jest obecnych, klasyfikator B jest lepszy, gdy obecnych jest mniej funkcji”
Edytuj 2, aby uwzględnić moje wykresy:
Przedstawiono rangi algorytmów w zależności od liczby cech
Przedstawiono rangi algorytmów w stosunku do liczby funkcji w rankingu
Tak więc, aby powtórzyć pytanie z tytułu:
Czy można sporządzić linię regresji dla danych rankingowych korelacji / regresji Spearmana?