Oświadczenie: To jest praca domowa.
Próbuję znaleźć najlepszy model dla cen diamentów, w zależności od kilku zmiennych i wydaje mi się, że mam do tej pory całkiem niezły model. Natknąłem się jednak na dwie zmienne, które są oczywiście współliniowe:
>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
Table Depth Carat.Weight
Table 1.00000000 -0.41035485 0.05237998
Depth -0.41035485 1.00000000 0.01779489
Carat.Weight 0.05237998 0.01779489 1.00000000
Tabela i głębokość zależą od siebie, ale nadal chcę je uwzględnić w moim modelu predykcyjnym. Zrobiłem kilka badań na temat diamentów i odkryłem, że Tabela i Głębokość to długość w poprzek i odległość od górnej do dolnej końcówki diamentu. Ponieważ te ceny diamentów wydają się być związane z pięknem, a piękno wydaje się być proporcjonalnymi proporcjami, zamierzałem uwzględnić ich stosunek, powiedzmy , aby przewidzieć ceny. Czy to standardowa procedura postępowania ze zmiennymi współliniowymi? Jeśli nie, co to jest?
Edycja: Oto wykres głębokości ~ tabela: