Obecnie pracuję z dużym zestawem danych dotyczących roszczeń z tytułu ubezpieczenia zdrowotnego, które obejmują niektóre roszczenia z laboratorium i apteki. Najbardziej spójne informacje w zestawie danych obejmują jednak diagnozę (ICD-9CM) i kody procedur (CPT, HCSPCS, ICD-9CM).
Moimi celami są:
- Zidentyfikuj najbardziej wpływowe stany prekursorowe (choroby współistniejące) dla stanu medycznego, takiego jak przewlekła choroba nerek;
- Zidentyfikuj prawdopodobieństwo (lub prawdopodobieństwo), że u pacjenta rozwinie się stan chorobowy na podstawie stanów, które miał w przeszłości;
- Zrób to samo co 1 i 2, ale z procedurami i / lub diagnozami.
- Korzystnie wyniki byłyby interpretowane przez lekarza
Patrzyłem na takie artykuły jak kamień milowy Heritage Health Prize i wiele się od nich nauczyłem, ale koncentrują się one na przewidywaniu hospitalizacji.
Oto moje pytania: Jak myślisz, jakie metody sprawdzają się w przypadku takich problemów? I jakie zasoby byłyby najbardziej przydatne do nauki o zastosowaniach nauki danych i metodach związanych z opieką zdrowotną i medycyną kliniczną?
EDYCJA 2, aby dodać tabelę tekstu jawnego:
CKD jest chorobą docelową, „przewlekłą chorobą nerek”, „.any” oznacza, że nabyli tę chorobę w dowolnym momencie, „.isbefore.ckd” oznacza, że mieli tę chorobę przed pierwszą diagnozą CKD. Pozostałe skróty odpowiadają innym warunkom zidentyfikowanym przez grupy kodów ICD-9CM. To grupowanie występuje w SQL podczas procesu importowania. Każda zmienna, z wyjątkiem pacjent_age, jest binarna.