Próbuję przewidzieć wynik równowagi i wypróbowałem kilka różnych metod regresji. Zauważyłem jedną rzecz, że przewidywane wartości wydają się mieć pewien górny limit. To znaczy, faktyczny bilans wynosi , ale moje przewidywania sięgają około . Poniższy wykres pokazuje rzeczywistą vs przewidywaną równowagę (przewidywaną za pomocą regresji liniowej):
A oto dwa wykresy dystrybucji tych samych danych:
Ponieważ moje predyktory są bardzo wypaczone (dane użytkownika z rozkładem prawa mocy), zastosowałem transformację Box-Cox, która zmienia wyniki na następujące:
Chociaż zmienia to rozkład prognoz, nadal istnieje górna granica. Więc moje pytania to:
- Jakie są możliwe przyczyny takich górnych granic wyników prognozowania?
- Jak mogę naprawić prognozy, aby odpowiadały rozkładowi rzeczywistych wartości?
Premia: skoro rozkład po transformacji Boxa-Coxa wydaje się podążać za rozkładami transformowanych predyktorów, czy jest możliwe, że jest to bezpośrednio powiązane? Jeśli tak, to czy mogę zastosować transformację, aby dopasować rozkład do rzeczywistych wartości?
Edycja: Użyłem prostej regresji liniowej z 5 predyktorami.