Na czym polega problem ze stosowaniem modeli R-kwadrat w szeregach czasowych?

Czytałem, że użycie kwadratu R do szeregów czasowych nie jest właściwe, ponieważ w kontekście szeregów czasowych (wiem, że istnieją inne konteksty) kwadrat R nie jest już unikalny. Dlaczego to? Próbowałem to sprawdzić, ale nic nie znalazłem. Zazwyczaj nie przykładam dużej wartości do kwadratu R (lub skorygowanego kwadratu R), kiedy oceniam swoje modele, ale wielu moich kolegów (tj. Głównych firm) jest absolutnie zakochanych w kwadracie R i chcę mieć możliwość wyjaśnij im, dlaczego R-Kwadrat nie jest odpowiedni w kontekście szeregów czasowych.

regression time-series r-squared

— mmmmmmmmmm
źródło

Wyszukiwarka Google: „fałszywa regresja w ekonometrii”. Lub sprawdź artykuł Granger i Newbold . Inni mogą podać więcej szczegółów w odpowiedziach.

— Graeme Walsh,

@Richard Hardy, czy mógłbyś rozwinąć kwestię: „Jeśli weźmiemy próbkę R2 jako miarę jej populacji, rozkłada się ona w ramach zintegrowanych szeregów czasowych”.

— Siddharth Krishnamurthy

Niektóre aspekty problemu:

Jeśli ktoś podaje nam wektor liczb i dopasowującą się macierz liczb , nie musimy wiedzieć, jaka jest relacja między nimi, aby wykonać algebrę estymacji, traktując jako zmienną zależną. Algebra powstanie, niezależnie od tego, czy te liczby reprezentują dane w przekroju, szeregi czasowe lub dane panelu, czy od tego, czy macierz zawiera opóźnione wartości itd. $\mathbf y$ $\mathbf X$ $y$ $\mathbf X$ $y$

Podstawową definicją współczynnika determinacji jest $R^2$

R^{2} = 1 - \frac{S S_{r e s}}{S S_{t o t}}

$R^2 = 1 - \frac {SS_{res}}{SS_{tot}}$

gdzie to suma kwadratów reszt z pewnej procedury szacowania, a to suma kwadratowych odchyleń zmiennej zależnej od średniej z próbki. $SS_{res}$ $SS_{tot}$

Łącząc, będzie zawsze obliczane jednoznacznie, dla konkretnej próbki danych, określonego sformułowania relacji między zmiennymi oraz określonej procedury szacowania, pod warunkiem tylko, że procedura szacowania jest taka, że zapewnia oszacowania punktowe nieznanych wielkości (a zatem oszacowań punktowych zmiennej zależnej, a zatem oszacowań punktowych reszt). Jeśli którykolwiek z tych trzech aspektów ulegnie zmianie, wartość arytmetyczna ogólnie ulegnie zmianie - ale dotyczy to dowolnego rodzaju danych, nie tylko szeregów czasowych. $R^2$ $R^2$

Zatem problemem z i szeregami czasowymi nie jest to, czy jest ono „unikalne”, czy nie (ponieważ większość procedur szacowania dla danych szeregów czasowych zapewnia oszacowania punktowe). Problem polega na tym, czy „zwykłe” ramy specyfikacji szeregów czasowych są technicznie przyjazne dla i czy dostarcza użytecznych informacji. $R^2$ $R^2$ $R^2$

Interpretacja jako „wyjaśnionego odsetka wariancji zmiennej zależnej” zależy krytycznie od reszty sumującej się do zera. W kontekście regresji liniowej (na dowolnym rodzaju danych) i estymacji zwykłych najmniejszych kwadratów jest to gwarantowane tylko wtedy, gdy specyfikacja zawiera stały składnik w macierzy regresora („dryf” w terminologii szeregów czasowych). W autoregresyjnych modelach szeregów czasowych dryfowanie w wielu przypadkach nie jest uwzględnione. $R^2$

Mówiąc bardziej ogólnie, kiedy mamy do czynienia z danymi szeregów czasowych, „automatycznie” zaczynamy myśleć o tym, jak szeregi czasowe zmienią się w przyszłość. Mamy więc tendencję do oceniania modelu szeregów czasowych na podstawie tego, jak dobrze prognozuje przyszłe wartości , niż jak dobrze pasuje do wartości przeszłych . Ale odzwierciedla głównie to drugie, a nie pierwsze. Dobrze znany fakt, że nie zmniejsza liczby regresorów, oznacza, że możemy uzyskać idealne dopasowanie poprzez ciągłe dodawanie regresorów ( dowolne regresory, tj. Dowolna seria liczb, być może całkowicie niezwiązana koncepcyjnie ze zmienną zależną) . Doświadczenie pokazuje, że otrzymane w ten sposób idealne dopasowanie da również otchłań $R^2$ $R^2$ prognozy poza próbą.

Intuicyjnie ten być może sprzeczny z intuicją kompromis ma miejsce, ponieważ ujmując całą zmienność zmiennej zależnej w równanie szacunkowe, przekształcamy zmienność niesystematyczną w zmienną systematyczną w zakresie przewidywania (tutaj „niesystematyczne” należy rozumieć w stosunku do naszej wiedzy - z czysto deterministycznego filozoficznego punktu widzenia nie ma czegoś takiego jak „niesystematyczna zmienność”. Ale w takim stopniu, w jakim nasza ograniczona wiedza zmusza nas do traktowania pewnej zmienności jako „niesystematycznej”, to próba przekształcenia jej w systematyczne składnik, przynosi katastrofę przewidywania).

W rzeczywistości jest to być może najbardziej przekonujący sposób, aby pokazać komuś, dlaczego nie powinien być głównym narzędziem diagnostycznym / oceniającym w przypadku szeregów czasowych: zwiększ liczbę regresorów do punktu, w którym . . Następnie weź oszacowane równanie i spróbuj przewidzieć przyszłe wartości zmiennej zależnej. $R^2$ $R^2\approx 1$

— Alecos Papadopoulos
źródło

Dobre wyjaśnienie, ale dlaczego jest to dodawane jako standardowe wyjście oprogramowania w pakiecie statystycznym

@brijesh Regresja-tradycja, powiedziałbym.

— Alecos Papadopoulos,

Świetna odpowiedź! Zawiera jednak niewiele informacji dotyczących szeregów czasowych. Prognozowanie w porównaniu z dopasowaniem w próbie dotyczy prawdopodobnie innych typów danych, podobnie jak szeregów czasowych. Z drugiej strony brakuje jednego kluczowego aspektu, który jest szczególny dla szeregów czasowych. Mam na myśli cofanie zmiennych zintegrowanych. Jeśli weźmiemy próbkę jako miarę jej odpowiednika populacji, rozkłada się ona w ramach zintegrowanych szeregów czasowych. (Mógłbym napisać to jako odpowiedź, ale nie mam teraz czasu.)

R^{2}

$R^2$

— Richard Hardy