Gdy odpowiedź lub wynik Y jest ograniczony, pojawiają się różne pytania dotyczące dopasowania modelu, w tym następujące:
Każdy model, który mógłby przewidzieć wartości odpowiedzi poza tymi granicami, jest co do zasady wątpliwy. W związku z tym stosuje się model liniowy może być problematyczne, ponieważ nie ma granic na Y = X b predykcyjnych X i współczynników b każdym przypadku, gdy X jest nieograniczona się w jednym lub w obu kierunkach. Jednak związek może być na tyle słaby, aby nie gryźć i / lub przewidywania mogą pozostać w granicach przekraczających obserwowany lub prawdopodobny zakres predyktorów. Z jednej strony, jeśli odpowiedź jest jakaś średnia + hałas, nie ma znaczenia, który model pasuje.Y^= XbXbX+
Ponieważ odpowiedź nie może przekroczyć swoich granic, nieliniowy związek jest często bardziej prawdopodobny, a przewidywane odpowiedzi dostosowują się do asymptotycznego zbliżania się do granic. Krzywe sigmoidalne lub powierzchnie, takie jak te przewidywane przez modele logit lub probit, są atrakcyjne pod tym względem i obecnie nie są trudne do dopasowania. Odpowiedź taka jak umiejętność czytania i pisania (lub ułamek przyjmujący nowy pomysł) często pokazuje taką sigmoidalną krzywą w czasie i prawdopodobnie z prawie każdym innym predyktorem.
Ograniczona odpowiedź nie może mieć oczekiwanych właściwości wariancji w regresji zwykłej lub waniliowej. Koniecznie, gdy średnia odpowiedź zbliża się do dolnej i górnej granicy, wariancja zawsze zbliża się do zera.
Model powinien zostać wybrany zgodnie z tym, co działa i wiedza na temat podstawowego procesu generowania. To, czy klient lub odbiorca wie o konkretnych rodzinach modeli, może również stanowić wskazówkę w praktyce.
Pamiętaj, że celowo unikam ogólnych osądów, takich jak dobre / złe, odpowiednie / nieodpowiednie, właściwe / złe. Wszystkie modele są w najlepszym razie przybliżeniami, a które z apelacji są atrakcyjne lub wystarczające dla projektu, nie są tak łatwe do przewidzenia. Zazwyczaj osobiście preferuję modele logit jako pierwszy wybór dla ograniczonych odpowiedzi, ale nawet ta preferencja jest częściowo oparta na nawyku (np. Moim unikaniu modeli probitowych bez bardzo dobrego powodu), a częściowo na tym, gdzie przekażę wyniki, zwykle czytelnikom, które są, lub powinien być statystycznie dobrze poinformowany.
Twoje przykłady skal dyskretnych dotyczą wyników 1-100 (w zadaniach oznaczam 0, z pewnością jest możliwe!) Lub rankingów 1-17. W przypadku takich skal zwykle myślałem o dopasowaniu modeli ciągłych do odpowiedzi skalowanych do [0, 1]. Są jednak praktycy modeli regresji porządkowej, którzy chętnie dopasowaliby takie modele do skal o dość dużej liczbie dyskretnych wartości. Cieszę się, jeśli odpowiedzą, jeśli mają takie zdanie.