Rozumiem pojęcie skalowania macierzy danych do zastosowania w modelu regresji liniowej. Na przykład w R możesz użyć:
scaled.data <- scale(data, scale=TRUE)
Moje jedyne pytanie brzmi: w przypadku nowych obserwacji, dla których chcę przewidzieć wartości wyjściowe, w jaki sposób są one odpowiednio skalowane? Czy to by było scaled.new <- (new - mean(data)) / std(data)
?
y = y_esc * sd(y) + mean(y)
, ale myślę, że to zepsułoby właściwości modelu, więc czekam też na bardziej techniczną odpowiedź!