Pracuję nad opracowaniem modelu przewidywania ryzyka ubezpieczeniowego. Modele te mają „rzadkie zdarzenia”, takie jak przewidywanie braku linii lotniczych, wykrywanie usterek sprzętowych itp. Przygotowując zestaw danych, próbowałem zastosować klasyfikację, ale nie mogłem uzyskać przydatnych klasyfikatorów z powodu dużej liczby przypadków negatywnych .
Nie mam dużego doświadczenia w statystyce i modelowaniu danych poza szkolnym kursem statystycznym, więc jestem trochę zdezorientowany.
Zgodnie z pierwszą myślą, zastanawiałem się nad zastosowaniem niejednorodnego modelu procesu Poissona. Sklasyfikowałem je na podstawie danych o zdarzeniach (data, łac., Dł.), Aby uzyskać dobre oszacowanie szansy na ryzyko w określonym czasie w danym dniu w określonym miejscu.
Chciałbym wiedzieć, jakie są metodologie / algorytmy przewidywania rzadkich zdarzeń?
Co polecasz jako sposób na rozwiązanie tego problemu?