Podstawowa idea regresji kwantowej wynika z faktu, że analityk jest zainteresowany dystrybucją danych, a nie tylko środkiem danych. Zacznijmy od średniej.
y= Xβmi( Y| X= x ) = x βargminβ(y−xβ)′(y−Xβ)
Z drugiej strony regresja mediany szuka linii, która oczekuje, że połowa danych jest po bokach. W tym przypadku funkcją docelową jestgdziejest pierwszą normą.| . |argminβ|y−Xβ||.|
Rozszerzenie idei mediany na kwantyle powoduje regresję kwantyli. Chodzi o to, aby znaleźć linię, która procent danych jest poza tym.α
Tutaj popełniłeś niewielki błąd, regresja Q nie jest jak znalezienie kwantyla danych, a następnie dopasowanie linii do tego podzbioru (lub nawet trudniejszych granic).
Regresja Q szuka linii dzielącej dane na q kwantyl i resztę . Funkcja docelowa, mówiąc, że funkcją sprawdzającą regresji Q jest
β a- = Arg min β { a- | y - X β | I ( y > X β ) + ( 1 - α ) | y - X β | I ( y < X β ) } .α
β^α=argminβ{α|y−Xβ|I(y>Xβ)+(1−α)|y−Xβ|I(y<Xβ)}.
Jak widzisz, ta sprytna funkcja celu to nic innego jak przełożenie kwantyla na problem optymalizacji.
Ponadto, jak widać, regresja Q jest zdefiniowana dla określonego kwantu ( ), a następnie może zostać rozszerzona, aby znaleźć wszystkie kwantyle. Innymi słowy, regresja Q może odtwarzać (warunkowy) rozkład odpowiedzi.βα