Mam pewne dane w [0,1], które chciałbym przeanalizować za pomocą regresji beta. Oczywiście należy coś zrobić, aby uwzględnić wartości 0,1. Nie lubię modyfikować danych, aby pasowały do modelu. również nie uważam, aby inflacja zero i 1 była dobrym pomysłem, ponieważ uważam, że w tym przypadku należy uznać wartości zerowe za bardzo małe wartości dodatnie (ale nie chcę powiedzieć dokładnie, jaka wartość jest odpowiednia. Rozsądny wybór Wierzę, że byłoby wybrać małe wartości, takie jak .001 i .999 i dopasować model przy użyciu skumulowanego dystansu dla wersji beta. Więc dla obserwacji y_i prawdopodobieństwo dziennika LL byłoby
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
W tym modelu podoba mi się to, że jeśli model regresji beta jest prawidłowy, model ten jest również prawidłowy, ale usuwa nieco wrażliwość na wartości ekstremalne. Wydaje się jednak, że jest to tak naturalne podejście, że zastanawiam się, dlaczego nie znalazłem żadnych oczywistych odniesień w literaturze. Więc moje pytanie dotyczy modyfikacji danych, dlaczego nie zmodyfikować modelu. Modyfikowanie danych wpływa negatywnie na wyniki (w oparciu o założenie, że oryginalny model jest prawidłowy), natomiast modyfikowanie modelu poprzez zbrojenie wartości ekstremalnych nie powoduje odchylenia wyników.
Może jest problem, który przeoczam?