Próbuję uruchomić model, aby oszacować, w jaki sposób katastrofalne choroby, takie jak gruźlica, AIDS itp. Wpływają na wydatki na hospitalizację. Mam „na koszt hospitalizacji” jako zmienną zależną i różne indywidualne markery jako zmienne niezależne, z których prawie wszystkie są obojętne, takie jak płeć, głowa gospodarstwa domowego, stan ubóstwa i oczywiście manekin na wypadek choroby (plus wiek i wiek do kwadratu) oraz kilka warunków interakcji.
Jak można się spodziewać, istnieje znaczna ilość - i mam na myśli dużo - danych zgromadzonych na poziomie zerowym (tj. Brak wydatków na hospitalizację w 12-miesięcznym okresie odniesienia). Jaki byłby najlepszy sposób radzenia sobie z takimi danymi?
Na razie postanowiłem przeliczyć koszt ln(1+cost)
, aby uwzględnić wszystkie obserwacje, a następnie uruchomić model liniowy. Czy jestem na dobrej drodze?