Czy kiedykolwiek istnieje powód, aby nie stosować ortogonalnych wielomianów podczas dopasowywania regresji?


13

Ogólnie zastanawiam się, czy kiedykolwiek lepiej nie używać ortogonalnych wielomianów podczas dopasowywania regresji do zmiennych wyższego rzędu. W szczególności zastanawiam się nad użyciem R:

Jeśli poly()z raw = FALSEprodukuje te same wartości, montowany poly()z raw = TRUEoraz polyz raw = FALSErozwiązuje niektóre z problemów związanych z wielomianowej regresji, to należy poly()z raw = FALSE zawsze być stosowany do montażu wielomianowych regresji? W jakich okolicznościach lepiej nie używać poly()?

Odpowiedzi:


16

Czy był kiedykolwiek powód? Pewnie; prawdopodobnie kilka.

Rozważmy na przykład, gdzie interesują mnie wartości surowych współczynników (powiedzmy, aby porównać je z wartościami hipotetycznymi), a kolinearność nie jest szczególnym problemem. Jest to prawie ten sam powód, dla którego często nie mam na myśli centrum w zwykłej regresji liniowej (która jest liniowym wielomianem ortogonalnym)

Nie są to rzeczy, z którymi nie można sobie poradzić za pomocą wielomianów ortogonalnych; to bardziej kwestia wygody, ale wygoda jest głównym powodem, dla którego robię wiele rzeczy.

To powiedziawszy, skłaniam się w kierunku ortogonalnych wielomianów w wielu przypadkach, dopasowując wielomiany, ponieważ mają one pewne wyraźne zalety.


czy możliwe jest porównanie współczynników wynikających z regresji wielomianowej ortogonalnej do wartości hipotetycznych?
user2374133

2
Tak. Możesz je przekształcić z powrotem do implikowanych współczynników i standardowych błędów na przykład z „surowych” wielomianów.
Glen_b

2
Częściej niż nie, przekształcenie z ortogonalnej podstawy wielomianowej na podstawę jednomianową jest procesem źle uwarunkowanym (dla wysokich stopni; konwersja niskiego stopnia nie jest tak zła), więc jeśli ktoś jest a priori zainteresowany współczynnikami podstawy monomialnej, wszelkie stabilność liczbowa uzyskana dzięki zastosowaniu wielomianów ortogonalnych jest wyrzucana przez okno podczas konwersji, więc równie dobrze możesz na początku używać monomialów. Oczywiście zastrzeżenie emptor .
JM nie jest statystykiem

1
@JM Dzięki, to doskonały punkt. Na szczęście w dzisiejszych aplikacjach statystycznych bardzo rzadko zdarza się, aby pasować do wielomianu dość niskiego rzędu (moja zwykła rada jest taka, że ​​chyba że istnieje silny teoretyczny powód, aby przejść powyżej stopnia trzeciego lub czwartego, należy spojrzeć na różne podejścia - która alternatywa może być najlepszy, zależy od okoliczności, ale na przykład, takie jak splajny, mogą być odpowiednie w niektórych sytuacjach).
Glen_b

13

Ponieważ jeśli Twój model opuszcza R, gdy dorośnie, musisz pamiętać o spakowaniu stałych centrowania i normalizacji, a następnie musi je ciągnąć przez cały czas. Wyobraź sobie, że pewnego dnia natkniesz się na to, zakodowane w SQL, i przerażenie, że zrozumiałem, że to ich źle wprowadziło!

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.