Jaka jest różnica między prognozami „poza próbą” i „poza próbą”?


17

Nie rozumiem, jaka dokładnie jest różnica między prognozami „w próbie” i „poza próbą”? Prognoza w próbie wykorzystuje podzbiór dostępnych danych do prognozowania wartości poza okresem szacowania. Prognoza poza próbą wykorzystuje zamiast tego wszystkie dostępne dane. Czy są one prawidłowe ?

Bardzo dokładnie, czy następująca definicja jest poprawna?

Prognoza wewnątrz próby wykorzystuje podzbiór dostępnych danych do prognozowania wartości poza okresem szacowania i porównania ich z odpowiednimi znanymi lub rzeczywistymi wynikami. Odbywa się to w celu oceny zdolności modelu do prognozowania znanych wartości. Na przykład prognoza wewnątrz próby z lat 1980–2015 może wykorzystywać dane z lat 1980–2012 do oszacowania modelu. Korzystając z tego modelu, prognostyk przewidziałby następnie wartości na lata 2013-2015 i porównał wartości prognozowane z rzeczywistymi znanymi wartościami. Prognoza bez próby wykorzystuje zamiast tego wszystkie dostępne dane w próbie do oszacowania modeli. W poprzednim przykładzie oszacowania przeprowadzonoby w latach 1980–2015, a prognozy rozpoczęłyby się w 2016 r.


Czy możesz podać jakiś kontekst? Odpowiedzi na własne pytanie wydają się w porządku, ale terminologia może być specyficzna dla danego tematu.
IWS

Skąd masz te definicje?
Gung - Przywróć Monikę

W próbce są dane, które znasz w momencie budowania modelu i które wykorzystujesz do zbudowania tego modelu. Poza próbą są dane, które były niewidoczne, a prognozę / prognozę podajesz tylko na jej podstawie. W większości okoliczności model będzie działał gorzej poza próbą niż w próbce, w której wszystkie parametry zostały skalibrowane.
Ric,

@IWS Dodałem specjalne pytanie :)
Engin YILMAZ

@Richard Proszę przeczytać nowe specjalne pytanie ...
Engin YILMAZ

Odpowiedzi:


32

Przez „próbkę” rozumie się próbkę danych, której używasz do dopasowania modelu.

Po pierwsze - masz próbkę
Po drugie - dopasowujesz model do próbki
Po trzecie - możesz użyć modelu do prognozowania

Jeśli prognozujesz obserwację, która była częścią próbki danych - jest to prognoza wewnątrz próby.

Jeśli prognozujesz obserwację, która nie była częścią próbki danych - jest to prognoza poza próbą.

Pytanie, które musisz sobie zadać, brzmi: czy konkretna obserwacja została zastosowana do dopasowania modelu, czy nie? Jeśli został użyty do dopasowania modelu, prognoza obserwacji jest w próbie. W przeciwnym razie jest poza próbą.

jeśli użyjesz danych z lat 1990–2013, aby dopasować model, a następnie prognozujesz na lata 2011–2013, to będzie to próba prognostyczna. ale jeśli użyjesz tylko 1990-2010 do dopasowania modelu, a następnie prognozujesz 2011-2013, to jest to prognoza poza próbą.


Mamy próbkę od 1990 do 2013 roku, następnie dopasowujemy model do próby, a następnie prognozujemy 2011-2013, czy to próba? lub Mamy próbkę od 1990 do 2013 r., a następnie dopasowujemy model 1990 do 2010 na próbce, prognozujemy 2011-2013, czy to nie próba?
Engin YILMAZ

tak, jeśli użyjesz danych z lat 1990–2013, aby dopasować model, a następnie prognozujesz na lata 2011–2013, jest to prognoza w próbie. ale jeśli użyjesz tylko 1990-2010 do dopasowania modelu, a następnie prognozujesz 2011-2013, to jest to prognoza poza próbą.
Koń króla Salomona

3

Załóżmy, że w Twojej próbce masz sekwencję 10 punktów danych. Dane te można podzielić na dwie części - np. Pierwsze 7 punktów danych do oszacowania parametrów modelu i kolejne 3 punkty danych do przetestowania wydajności modelu. Przy użyciu dopasowanego modelu prognozy wykonane dla pierwszych 7 punktów danych będą nazywane prognozą w próbie, a te same dla ostatnich 3 punktów danych zostaną wywołane z prognozy próbki. Jest to takie samo, jak pomysł podzielenia danych na zestaw szkoleniowy i zestaw sprawdzania poprawności.


1

Prognoza w próbie to proces formalnej oceny możliwości prognozowania modeli opracowanych przy użyciu zaobserwowanych danych w celu sprawdzenia skuteczności algorytmów w odtwarzaniu danych. Jest to trochę podobne do zestawu szkoleniowego w algorytmie uczenia maszynowego, a próba próbna jest podobna do zestawu testowego.


podajesz zwięzłe wyjaśnienie prognozowania w próbie - czy możesz również podać to samo dla próby poza próbą (tj. krótkie wyjaśnienie nie tylko porównania do zestawów testowych)?
ReneBt,


-1

W prognozach szeregów czasowych „Insample” oznacza dane pociągu „Outsample” oznacza dane testowe

W szeregach czasowych możemy najpierw prognozować wyniki dla danych „Insample” (tj. Pociągu). Później możemy prognozować wyniki dla danych „outsample” (tj. Testowych).

model = ARIMA(order = (p,d,q), seasonal_order=(P,D,Q,S))
model.fit(train_data)

train_predictions = model.predict_in_sample()
test_predictions = model.predict(n_periods=len(test_data.index))

predictions = pd.concatenate((train_predictions, test_predictions),axis=0)

Wydaje mi się, że twoja odpowiedź jest słabo oceniana, ponieważ nie odpowiada na pytanie - w szczególności „Czy konkretnie następująca definicja jest poprawna?” nie jest adresowany.
Martin Modrák,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.