Zamieszanie związane z normalizacją danych


9

Próbuję nauczyć się modelu regresji liniowej. Mam jednak pewne zamieszanie związane z normalizacją danych. Znormalizowałem cechy / predyktory do zera średniej i wariancji jednostkowej. Czy muszę zrobić to samo dla celu. Jeśli tak to dlaczego?


1
Dlaczego znormalizowałeś funkcje / predyktory?
Peter Flom

4
BTW myślę, że „standaryzacja” jest na to lepszym określeniem.
Scortchi - Przywróć Monikę

Odpowiedzi:


6

Normalizacja celu w regresji liniowej nie ma znaczenia. W regresji liniowej dopasowanie będzie miało postać Kiedy predyktory są wyśrodkowane, stały składnik zawsze będzie średnią . Więc jeśli wyśrodkujesz przed uruchomieniem regresji, otrzymasz po prostu , ale wszystkie pozostałe współczynniki pozostaną niezmienione.

y^i=a0+axi.
xiza0yjayjaza0=0

(To powiedziawszy, normalizacja predyktorów --- tak jak obecnie robisz --- jest dobrym pomysłem.)


1
Dlaczego normalizacja predyktorów to dobry pomysł?
Scortchi - Przywróć Monikę

@Stefan. Tak, kiedy centruję predyktory, otrzymuję stały który oznacza średnią y. Ale nie wiedziałem, dlaczego to się stało. Czy możesz mi powiedzieć matematykę? za0
user34790 21.04.13

2
@Scortchi Normalizacja predyktorów nie jest konieczna, ale może ułatwić interpretację współczynników regresji: Po normalizacji duże współczynniki odpowiadają ważnym predyktorom. Ponadto bez normalizacji współczynniki warunków interakcji mogą być bardzo mylące. To powiedziawszy, normalizacja nie wpłynie na prognozy uzyskane z modelu, więc normalizacja ma znaczenie tylko wtedy, gdy zamierzasz interpretować współczynniki w regresji.
Stefan Wager

1
@ user34790 Matematyka jest opracowywana na pmean.com/10/LeastSquares.html
Stefan Wager

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.