Chcę wykonać wielokrotną regresję liniową, a następnie przewidzieć nowe wartości przy niewielkiej ekstrapolacji. Mam zmienną odpowiedzi w zakresie od -2 do +7 oraz trzy predyktory (zakresy od +10 do +200). Rozkład jest prawie normalny. Ale związek między odpowiedzią a predyktorami nie jest liniowy, widzę krzywe na wykresach. Na przykład jak to: http://cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg
Chciałbym zastosować transformację, aby osiągnąć liniowość. Próbowałem przekształcić zmienną odpowiedzi, sprawdzając różne funkcje i patrząc na uzyskane wykresy, aby zobaczyć liniową zależność między odpowiedzią a predyktorami. Odkryłem, że istnieje wiele funkcji, które mogą dać mi widoczną zależność liniową. Na przykład funkcje
itd. dają podobne wyniki: http://cs10418.userapi.com/u17020874/153949434/x_06f13dbf.jpg
Po tym, jak zamierzam przekształcić przewidywane wartości (dla jako i tak dalej). Rozkłady są mniej więcej podobne do normalnych. r'=1
Jak mogę wybrać najlepszą transformację dla moich danych? Czy istnieje ilościowy (i niezbyt skomplikowany) sposób oceny liniowości? Aby udowodnić, że wybrana transformacja jest najlepsza lub znaleźć ją automatycznie, jeśli to możliwe.
Czy jedynym sposobem jest wykonanie nieliniowej regresji wielokrotnej?
plot(lm(1/(y+5)~r))