Niektóre zastrzeżenia przed kontynuowaniem. Jak często sugeruję moim uczniom, używaj auto.arima()
rzeczy tylko jako pierwsze przybliżenie twojego końcowego wyniku lub jeśli chcesz mieć model oszczędnościowy, gdy sprawdzasz, czy twój rywalizujący model oparty na teorii radzi sobie lepiej.
Dane
Oczywiście musisz zacząć od opisu danych szeregów czasowych, z którymi pracujesz. W makroekonometrii zwykle pracujesz z danymi zagregowanymi, a środki geometryczne (o dziwo) mają więcej dowodów empirycznych dla danych makro szeregów czasowych, prawdopodobnie dlatego, że większość z nich rozkłada się w wykładniczy trend wzrostowy .
Nawiasem mówiąc, sugestia Roba „wizualnie” działa dla szeregów czasowych z wyraźną częścią sezonową , ponieważ powoli zmieniające się dane roczne są mniej jasne dla wzrostu zmienności. Na szczęście zwykle obserwuje się wykładniczo rosnący trend (jeśli wydaje się liniowy, to nie ma potrzeby rejestrowania dzienników).
Model
Jeśli twoja analiza opiera się na teorii, która stwierdza, że pewna ważona średnia geometryczna bardziej znany jako model regresji multiplikatywnej jest tym, z którym musisz pracować. Następnie zwykle przechodzisz do modelu regresji log-log , który ma parametry liniowe i większość twoich zmiennych, ale niektóre stopy wzrostu są przekształcane.Y( t ) = Xα11( t ) . . . Xαkk( t ) ε ( t )
W ekonometrii finansowej dzienniki są powszechne ze względu na popularność zwrotów dzienników, ponieważ ...
Przekształcenia dziennika mają ładne właściwości
W modelu regresji log-log jest interpretacja badanego parametru, np jak elastyczność w na . Y ( t ) X i ( t )αjaY( t )Xja( t )
W modelach korekcji błędów mamy empirycznie silniejsze założenie, że proporcje są bardziej stabilne ( stacjonarne ) niż różnice bezwzględne.
W ekonometrii finansowej łatwo jest agregować zwroty dzienników w czasie .
Istnieje wiele innych powodów, które nie zostały tu wymienione.
Wreszcie
Zauważ, że transformacja log jest zwykle stosowana do zmiennych nieujemnych (poziomowych). Jeśli zaobserwujesz różnice między dwoma szeregami czasowymi (na przykład eksport netto), nie jest nawet możliwe zapisanie dziennika, musisz albo wyszukać oryginalne dane w poziomach, albo przyjąć formę wspólnego trendu, który został odjęty.
[ dodanie po edycji ] Jeśli nadal potrzebujesz statystycznego kryterium, kiedy przeprowadzać transformację logów, prostym rozwiązaniem byłby dowolny test na heteroscedastyczność. W przypadku rosnącej wariancji poleciłbym test Goldfelda-Quandta lub podobny. W R znajduje się w library(lmtest)
i jest oznaczony gqtest(y~1)
funkcją. Po prostu regresuj na zasadzie przechwytywania, jeśli nie masz żadnego modelu regresji, y
jest to twoja zmienna zależna.