Próbuję zrozumieć zerowe zawyżone rozkłady. Czym oni są? Jaki jest sens?
Jeśli mam dane z wieloma zerami, to mógłbym dopasować regresję logistyczną, najpierw obliczyć prawdopodobieństwo zer, a następnie mógłbym usunąć wszystkie zera, a następnie dopasować regresję regularną, używając mojego wyboru rozkładu (np. Poissona).
Potem ktoś powiedział mi: „hej, użyj zerowej napompowanej dystrybucji”, ale patrząc na to, nie wydaje się, że robi to inaczej niż to, co zasugerowałem powyżej? Ma regularny parametr , a następnie inny parametr p, aby modelować prawdopodobieństwo zera? Po prostu robi obie rzeczy w tym samym czasie nie?