Czy ktoś może mi wyjaśnić prawdziwą różnicę między analizą regresji a dopasowaniem krzywej (liniową i nieliniową), podając przykład, jeśli to możliwe?
Wydaje się, że obie próbują znaleźć związek między dwiema zmiennymi (zależne vs niezależne), a następnie określić parametr (lub współczynnik) związany z proponowanymi modelami. Na przykład, jeśli mam zestaw danych, takich jak:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
Czy ktoś może zasugerować wzór korelacji między tymi dwiema zmiennymi? Mam problem ze zrozumieniem różnicy między tymi dwoma podejściami. Jeśli wolisz wesprzeć swoją odpowiedź innymi zestawami danych, to jest OK, ponieważ wydaje się, że trudno jest je dopasować (być może tylko dla mnie).
Powyższy zestaw danych przedstawia i y osi o charakterystyki roboczej odbiorcy (ROC), gdzie Y jest rzeczywisty wskaźnik pozytywny (TPR), a x jest fałszywie dodatnich (FPR).
Próbuję dopasować krzywą lub przeprowadzić analizę regresji zgodnie z moim pierwotnym pytaniem, jeszcze nie jestem pewien, spośród tych punktów, aby oszacować TPR dla dowolnego konkretnego FPR (lub odwrotnie).
Po pierwsze, czy naukowo dopuszczalne jest znalezienie takiej funkcji dopasowania krzywej między dwiema zmiennymi niezależnymi (TPR i FPR)?
Po drugie, czy naukowo dopuszczalne jest znalezienie takiej funkcji, jeśli wiem, że rozkłady rzeczywistych przypadków ujemnych i rzeczywistych przypadków dodatnich nie są normalne?