Próbuję zrozumieć, jak najlepiej modelować zmienną, w której z czasem uzyskiwałem coraz bardziej szczegółowe predyktory. Na przykład rozważ modelowanie stóp odzysku niespłaconych pożyczek. Załóżmy, że mamy zestaw danych z 20-letnimi danymi, a przez pierwsze 15 z tych lat wiemy tylko, czy pożyczka została zabezpieczona, czy nie, ale nic o cechach tego zabezpieczenia. Przez ostatnie pięć lat możemy jednak rozbić zabezpieczenia na szereg kategorii, które powinny być dobrym prognostykiem stopy odzysku.
Biorąc pod uwagę tę konfigurację, chcę dopasować model do danych, określić miary, takie jak istotność statystyczna predyktorów, a następnie prognozować za pomocą modelu.
Do jakiej brakującej struktury danych to pasuje? Czy są jakieś specjalne względy związane z faktem, że bardziej szczegółowe zmienne objaśniające stają się dostępne dopiero po określonym czasie, a nie rozproszone po całej próbie historycznej?