Sieci neuronowe nie są magią. Jeśli traktujesz je takimi, jakimi są i po prostu rzucasz im dane, nie myśląc, że będziesz miał bardzo zły czas.
Musisz się zatrzymać i zadać sobie pytanie: „Czy milisekundy od 1970 r. Rzeczywiście będą przewidywać to, co mnie interesuje?” Odpowiedź, na którą powinieneś natychmiast dotrzeć, brzmi: nie. Dlaczego? W każdym przypadku, na którym naprawdę Ci zależy (wydarzenia w przyszłości, przeszłość już się wydarzyła) zmienna czasowa przyjmuje wartość większą niż dowolna wartość, którą zmienna czasowa przyjmuje w danych treningowych. Taka zmienna jest bardzo mało pomocna. Co gorsza, prawdopodobnie nie spowoduje to nadmiernego dopasowania (poważnego problemu dla potężnych modeli nieliniowych, takich jak sieci neuronowe), jeśli nie będziesz ostrożny.
Teraz sens może mieć zmienna, taka jak tydzień roku lub miesiąca, która może pomóc w modelowaniu efektów sezonowych lub rocznych. Zrobiłem trochę pracy w przewidywaniu chorób rolniczych, w których dzień Juliana okazał się bardzo ważną zmienną. Opierając się na tym doświadczeniu, podejrzewam, że lepiej byłoby zakodować ten typ zmiennej jako zmienną kategoryczną zamiast porządkowej, twoje doświadczenie może być bardzo. Zauważ, że miesiąc lub tydzień w roku są powtarzalnymi zdarzeniami, które prawdopodobnie zobaczysz wiele razy w twoich danych szkoleniowych i można wyjaśnić, dlaczego taka zmienna może wpłynąć na wynik finansowy. Porównaj to z milisekundami od 1970 roku, co jest monotonicznie rosnącą wartością.
Na koniec, ze stwierdzenia „Czy podawanie czasu jest niepotrzebne, dopóki chronię je resztą danych chronologicznie?” brzmi to tak, jakbyś nie miał pojęcia, jak działają sieci neuronowe. W przypadku standardowej sieci neuronowej ze sprzężeniem zwrotnym kolejność karmienia sieci twoimi danymi nie będzie miała wpływu na prognozy. Kolejność może wpływać na trening, jeśli używasz stochastycznego lub mini-gradientowego spadku, ale jest to tylko artefakt iteracyjnej (w przeciwieństwie do partii) metody treningu. Jeśli chcesz modelować zależność czasową za pomocą sieci neuronowej, musisz użyć czegoś w rodzaju przesuwanego okna lub cyklicznej sieci neuronowej.