Jaka jest / jest „mechaniczna” różnica między wielokrotną regresją liniową z opóźnieniami i szeregami czasowymi?


14

Jestem absolwentem biznesu i ekonomii, który obecnie studiuje magister inżynierii danych. Podczas badania regresji liniowej (LR), a następnie analizy szeregów czasowych (TS), przyszło mi do głowy pytanie. Po co tworzyć zupełnie nową metodę, tj. Szeregi czasowe (ARIMA), zamiast stosować wielokrotną regresję liniową i dodawać do niej zmienne opóźnione (z kolejnością opóźnień określonych za pomocą ACF i PACF)? Nauczyciel zasugerował więc, żebym napisał krótki esej na ten temat. Nie szukałem pomocy z pustymi rękami, więc przeprowadziłem badania na ten temat.

Wiedziałem już, że przy stosowaniu LR, jeśli naruszone zostaną założenia Gaussa-Markowa, regresja OLS jest niepoprawna i że dzieje się tak przy użyciu danych szeregów czasowych (autokorelacja itp.). (inne pytanie na ten temat, jedno założenie GM jest takie, że zmienne niezależne powinny być normalnie rozmieszczone? lub tylko zmienna zależna zależna od zmiennych niezależnych?)

Wiem także, że kiedy używam rozproszonej regresji opóźnienia, co myślę, że proponuję tutaj, i używając OLS do oszacowania parametrów, może (oczywiście) powstać wielokoliniowość między zmiennymi, więc oszacowania byłyby błędne.

W podobnym poście o TS i LR tutaj @ IrishStat powiedział:

... model regresji jest szczególnym przypadkiem modelu funkcji przenoszenia, znanego również jako model regresji dynamicznej lub model XARMAX. Istotnym punktem jest identyfikacja modelu w szeregach czasowych, tj. Odpowiednie różnice, odpowiednie opóźnienia X, odpowiednia struktura ARIMA, odpowiednia identyfikacja nieokreślonej struktury deterministycznej, takiej jak impulsy, przesunięcia poziomu, lokalne trendy czasowe, impulsy sezonowe i włączenie zmian parametrów lub wariancji błędów należy wziąć pod uwagę.

(Przeczytałem także jego artykuł w Autoboxie o Box Jenkins vs. LR.) Ale to wciąż nie rozwiązuje mojego pytania (a przynajmniej nie wyjaśnia mi różnych mechanizmów RL i TS).

Oczywiste jest, że nawet w przypadku zmiennych opóźnionych pojawiają się problemy OLS i nie jest ono wydajne ani poprawne, ale czy przy maksymalnym prawdopodobieństwie problemy te występują? Czytałem, że ARIMA jest szacowana na podstawie maksymalnego prawdopodobieństwa, więc jeśli LR z opóźnieniami jest szacowana za pomocą ML zamiast OLS, to czy daje ona „prawidłowe” współczynniki (załóżmy, że uwzględniamy również terminy opóźnionego błędu, takie jak MA zamówienia q).

Krótko mówiąc, czy jest problem OLS? Czy problem został rozwiązany przy użyciu ML?


4
Niesamowite podobieństwo do Johna Maynarda Keynesa.
Nick Cox,

Cześć @NickCox, tak, on jest moim ulubionym ekonomistą, myślę, że był niesamowitym człowiekiem i niezwykle utalentowanym pod wieloma względami ... jakaś pomoc w moim pytaniu? Próbuję ustalić, dlaczego model opóźniony nie będzie działał z oszacowaniem OLS, a jeśli oszacowałby poprawnie z oszacowaniem maksymalnego prawdopodobieństwa. Rozumiem, że najlepszym modelem jest funkcja przenoszenia i obecnie ją badam. Ale teoretyczne pytanie wciąż pozostaje o OLS. Jeśli żadna autokorelacja nie była obecna, ponieważ opóźnienia ją eliminują (zakładając również, że multikolacja nie jest obecna), czy to zadziałałoby? lub jest nadal i leży u podstaw
Miguel M.

@NickCox ... efekt / naruszenie założeń gaussowskich, z którymi OLS nie może współpracować i których nie można dopasować tą metodą? Jak widzisz, jestem trochę zagubiony w tym, jeśli jest zbyt długo, aby odpowiedzieć, proszę, jeśli możesz dać wykład, który mógłby oświecić, też bym docenił
Miguel M.

1
Jeśli chodzi o mechanikę, pozwólcie, że zasugeruję, że model ARMA dla sugerowanej przez użytkownika (odpowiednio różnicowanej) zmiennej X odzwierciedla niestacjonarność. Jeśli ten filtr zostanie zastosowany do OBA odpowiednio odpowiednio zróżnicowanych szeregów, powstałą parę szeregów można często badać za pomocą procedur korelacji krzyżowej dając sugerowaną strukturę opóźnienia (zrozumienie). Tę strukturę opóźnienia można następnie zastosować do odpowiednio zróżnicowanej serii oryginalnej, aby uzyskać sugestię dotyczącą nieokreślonej serii / tła (proces wstępnego błędu). Ten proces błędu można następnie zbadać, aby uzyskać odpowiednią ARiMR.
IrishStat,

@IrishStat, więc proszę, pozwól mi sformułować to, co właśnie powiedziałeś. Miejmy zmienną zależną Yt i zmienną niezależną Xt, różnicujemy zarówno Yt, jak i Xt, dopóki nie będziemy mieć stacjonarności w obu, a następnie możemy zastosować funkcję korelacji krzyżowej, aby znaleźć strukturę opóźnienia. Następnie regresujemy Yt do Xt i badamy termin błędu. Jeśli znajdziemy strukturę ARMA w składniku błędu, zastosujemy ją w modelu, dopóki nie wystąpi biały szum, prawda? Ale wciąż mam pytanie, czy ten ostatni model jest wyposażony w OLS? Jeśli nie, dlaczego nie i jakiej metody używamy?
Miguel M.,

Odpowiedzi:


9

Po co tworzyć zupełnie nową metodę, tj. Szeregi czasowe (ARIMA), zamiast stosować wielokrotną regresję liniową i dodawać do niej zmienne opóźnione (z kolejnością opóźnień określonych za pomocą ACF i PACF)?

β^OL.S.=(XX)-1XyX, a zatem estymator OLS jest niewykonalny.

jednym założeniem GM jest to, że zmienne niezależne powinny być normalnie rozmieszczone? czy tylko zmienna zależna zależna od zmiennych niezależnych?

Założenie normalności jest czasami wywoływane w przypadku błędów modelu, a nie w przypadku zmiennych niezależnych. Jednak normalność nie jest wymagana ani dla spójności i wydajności estymatora OLS, ani dla twierdzenia Gaussa-Markowa. Artykuł w Wikipedii na temat twierdzenia Gaussa-Markowa wyraźnie stwierdza, że ​​„Błędy nie muszą być normalne”.

wielokoliniowość między zmiennymi może (oczywiście) powstać, więc oszacowania byłyby błędne.

Wysoki stopień wielokoliniowości oznacza zawyżoną wariancję estymatora OLS. Jednak estymator OLS jest nadal NIEBIESKI, o ile wielokoliniowość nie jest idealna. Dlatego twoje oświadczenie nie wygląda dobrze.

Oczywiste jest, że nawet w przypadku zmiennych opóźnionych pojawiają się problemy OLS i nie jest ono wydajne ani poprawne, ale czy przy maksymalnym prawdopodobieństwie problemy te występują?

Model AR można oszacować przy użyciu zarówno OLS, jak i ML; obie te metody dają spójne estymatory. Modele MA i ARMA nie mogą być oszacowane przez OLS, więc ML jest głównym wyborem; znowu jest spójny. Inną interesującą właściwością jest wydajność i tutaj nie jestem całkowicie pewien (ale wyraźnie informacja powinna być gdzieś dostępna, ponieważ pytanie jest dość standardowe). Chciałbym skomentować „poprawność”, ale nie jestem pewien, co przez to rozumiesz.


Cześć, panie Hardy, bardzo dziękuję za odpowiedź. Podsumowując, w odniesieniu do obserwowanych i nieobserwowanych wartości. W ARIMA i szeregach czasowych (dokładniej XARIMAX) stosujemy podejście „dynamiczne”, ponieważ używamy błędu prognozowania, aw regresji liniowej nie używamy ich - ale mimo to moglibyśmy je wykorzystać. Nie rozumiem więc problemu tutaj. Lub, jak mówi @IrishStat, jedyną różnicą jest ścieżka do identyfikacji i strategii rewizji modelu?
Miguel M.

A co z szacunkami, czy OLS (ponownie) jest poprawny, gdy uwzględnia opóźnione błędy w modelu? Jeśli chodzi o wielokolonowość, miałem na myśli, że oszacowane współczynniki mogą być niepoprawne, ponieważ ich oszacowanie ma dużą zmienność. Przez prawidłową metodę miałem na myśli, że użycie OLS daje obiektywne i wydajne oszacowania w porównaniu do ML przy zastosowaniu proponowanych modeli opóźnionych.
Miguel M.

@MueluelM, podróżuję teraz, postaram się wrócić później.
Richard Hardy

1
Jeśli chodzi o „w regresji liniowej nie używamy ich - ale mimo to moglibyśmy ich użyć”: nie obserwujemy tych zmiennych, a zatem nie można ich stosować w ramach regresji liniowej ze względu na występującą tam mechanikę (jak zauważyłem w odpowiedzi, estymator jest niewykonalny); mogą jednak być używane w środowisku ARIMA. Jeśli chodzi o „czy OLS (ponownie) jest poprawny, jeśli uwzględniamy opóźnione błędy w modelu?”, Tak, to powinno być prawdziwe. Jeśli chodzi o „poprawność”, jeśli model jest poprawnie określony, a zarówno OLS, jak i ML są wykonalne, oba powinny działać dobrze. W przypadku błędnej specyfikacji rzeczy zwykle się psują.
Richard Hardy

1
y=β0+β1x+εxy=β0+β1x+εx

5

To świetne pytanie. Prawdziwa różnica między modelami ARIMA a wielokrotną regresją liniową polega na strukturze błędów. Możesz manipulować zmiennymi niezależnymi w modelu wielokrotnej regresji liniowej, aby pasowały do ​​danych szeregów czasowych, co mówi @IrishStat. Jednak po tym trzeba wprowadzić błędy ARIMA do modelu regresji wielokrotnej, aby uzyskać prawidłowy współczynnik i wyniki testu. Świetna darmowa książka na ten temat to: https://www.otexts.org/fpp/9/1 . Połączyłem sekcję omawiającą łączenie modeli ARIMA i wielu modeli regresji.


1

Dobre pytanie, właściwie zbudowałem oba w mojej codziennej pracy jako Data Scientist. Modele szeregów czasowych są łatwe do zbudowania (pakiet prognozy w R pozwala zbudować jeden w mniej w ciągu 5 sekund), taki sam lub dokładniejszy niż modele regresji itp. Zasadniczo zawsze należy budować szeregi czasowe, a następnie regresję. Istnieją również filozoficzne implikacje szeregów czasowych, jeśli możesz przewidzieć, nie wiedząc niczego, co to oznacza?

Moje spojrzenie na Darlington. 1) „Regresja jest znacznie bardziej elastyczna i wydajna, tworząc lepsze modele. Ten punkt jest rozwijany w wielu miejscach w trakcie pracy”.

Nie, wręcz przeciwnie. Modele regresji przyjmują znacznie więcej założeń niż modele szeregów czasowych. Im mniej założeń, tym większe prawdopodobieństwo odporności na trzęsienie ziemi (zmiana reżimu). Ponadto modele szeregów czasowych reagują szybciej na nagłe zmiany.

2) „Regresję można znacznie łatwiej opanować niż ARIMA, przynajmniej dla tych, którzy znają już regresję w innych obszarach”. To jest okrągłe rozumowanie.

3) „Regresja korzysta z„ zamkniętego ”algorytmu obliczeniowego, który zasadniczo gwarantuje uzyskanie wyników, o ile jest to w ogóle możliwe, podczas gdy ARIMA i wiele innych metod korzysta z algorytmów iteracyjnych, które często nie są w stanie znaleźć rozwiązania. Często widziałem, że metoda ARIMA„ rozłącza się ” „na danych, które nie dały problemu z metodą regresji”.

Regresja daje odpowiedź, ale czy to właściwa odpowiedź? Jeśli zbuduję modele regresji liniowej i uczenia maszynowego i wszystkie one dojdą do tego samego wniosku, co to oznacza?

Podsumowując, regresja tak i szeregi czasowe mogą zarówno odpowiedzieć na to samo pytanie, a technicznie szereg czasowy jest regresją techniczną (aczkolwiek regresją automatyczną). Modele szeregów czasowych są mniej złożone, a zatem bardziej niezawodne niż modele regresji. Jeśli myślisz o specjalizacji, modele TS specjalizują się w prognozowaniu, podczas gdy regresja - w zrozumieniu. Sprowadza się to do tego, czy chcesz wyjaśnić, czy przewidzieć.


1
„Modele szeregów czasowych są mniej złożone, a zatem bardziej niezawodne niż modele regresyjne” .... Chcieliście powiedzieć: „Modele ARIMA są mniej złożone, a zatem bardziej niezawodne niż modele regresyjne”. Włączenie ARIMA i regresji nazywane jest Transferowymi Modelami Funkcyjnymi ..., co jest zatem mądrym wyborem, łącząc w ten sposób zarówno zrozumienie (regresję), jak i nieznane / nieokreślone czynniki tła (ARIMA).
IrishStat,

2
@IrishStat Witam Panie Reilly, czytałem wasze odpowiedzi na kilka postów tutaj w stackexchange, a także przeczytałem wiele artykułów w Autobox, a także linki do kursu szeregów czasowych PSU, ale nadal nie zrozumieć, dlaczego (lub jeśli) regresja liniowa (przy użyciu OLS), z użyciem opóźnionych zmiennych i opóźnionych terminów błędów, jeśli to konieczne, nie zadziała
Miguel M.

@IrishStat, czy metoda OLS nie działa?
Miguel M.,

1
IrishStat, aby rozwinąć twój punkt widzenia, celem byłaby przyczynowość Grangera. Na przykład, nawet jeśli współczynnik jest statystycznie istotny, niekoniecznie musi być istotny w poprawianiu dokładności prognozy. W moich badaniach odkryłem, że modele regresji (liniowe, lasso itp.) Zwykle mówią, że rzeczy są ważne, niż są w rzeczywistości, podczas gdy losowy las ma tendencję do obniżania ich wartości i identyfikowania prawdziwych dźwigni. Ponadto losowy las ma tę samą dokładność poza próbą, co modele liniowe. Jedyną wadą jest to, że nie można powiedzieć, jakie są współczynniki.
Ukryty model Markowa

2
@MiguelM. To z pewnością może zadziałać, ponieważ funkcja przenoszenia jest modelem wielomianu rozproszonego opóźnienia, być może obejmującym empirycznie wykryte przesunięcia poziomu / trendy czasowe / pulsacje sezonowe przy jednoczesnym dostosowaniu do impulsów (anomalie jednorazowe). Myślę, że podstawową różnicą jest ścieżka do identyfikacji i strategii zmiany modelu
IrishStat

0

Uważa się, że najgłębsza różnica między funkcjami przenoszenia a regresją liniową wieloraką (w zwykłym użyciu) leży w ich celach, regresje wielokrotne są ukierunkowane na znalezienie głównych obserwowalnych przyczynowych zmiennych zależnych, podczas gdy funkcje przenoszenia chcą jedynie prognozować wpływ na zależną zmienna odmiany konkretnej zmiennej egzogenicznej ... Podsumowując, regresja wielokrotna jest ukierunkowana na wyczerpujące wyjaśnienie, a funkcja przeniesienia na prognozowanie bardzo specyficznych efektów ...


Nie sądzę, aby było to całkiem dokładne, ponieważ obie metody dają współczynniki, które można w rzeczywistości interpretować. Również funkcje przenoszenia opierają się w dużej mierze na analizie przyczynowej i faktycznie są lepsze w odróżnianiu niż regresja liniowa wielokrotna. Również ten post pyta o mechaniczne / metodologiczne różnice między tymi dwiema metodami
Miguel M.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.