Z góry przepraszamy, jeśli jakakolwiek terminologia, której używam, jest niepoprawna. Z zadowoleniem przyjąłbym każdą korektę. Jeśli to, co opisuję jako „punkt odcięcia”, ma inną nazwę, daj mi znać, a mogę zaktualizować pytanie.
Interesuje mnie sytuacja: masz zmienne niezależne i jedną zmienną zależną y . Pozostawię to niejasne, ale zakładam, że uzyskanie modelu regresji dla tych zmiennych byłoby stosunkowo proste.
Jednak model, który zamierzasz stworzyć, jest dla zmiennych niezależnych i zmiennej zależnej , gdzie jest pewną stałą wartością z zakresu . Podobnie dane, do których masz dostęp, nie obejmują , tylko .
(Trochę nierealistycznym) przykładem tego może być próba modelowania, przez ile lat ludzie będą pobierać swoją emeryturę. W takim przypadku może być istotną informacją, taką jak płeć, waga, godziny ćwiczeń tygodniowo itp. Zmienną „podstawową” będzie oczekiwana długość życia. Jednak zmienną, do której miałbyś dostęp i którą próbujesz przewidzieć w swoim modelu, byłoby gdzie r jest wiekiem emerytalnym (zakładając dla uproszczenia, że jest ustalony).
Czy istnieje dobre podejście do radzenia sobie z tym w modelowaniu regresji?