Wiem, że tradycyjne modele statystyczne, takie jak regresja Cox Proportional Hazards i niektóre modele Kaplana-Meiera, można wykorzystać do przewidywania dni do następnego wystąpienia zdarzenia, np. Niepowodzenia itp., Czyli analizy przeżycia
pytania
- W jaki sposób można zastosować wersję regresji modeli uczenia maszynowego, takich jak GBM, sieci neuronowe itp., Aby przewidzieć dni do wystąpienia zdarzenia?
- Uważam, że używanie dni do wystąpienia jako zmiennej docelowej i po prostu uruchomienie modelu regresji nie zadziała? Dlaczego to nie działa i jak to naprawić?
- Czy możemy przekonwertować problem analizy przeżycia na klasyfikację, a następnie uzyskać prawdopodobieństwo przeżycia? Jeśli tak, jak utworzyć binarną zmienną docelową?
- Jakie są zalety i wady podejścia do uczenia maszynowego w porównaniu z regresją proporcjonalną hazardu Coxa i modelami Kaplana-Meiera itp.?
Wyobraź sobie, że przykładowe dane wejściowe mają poniższy format
Uwaga:
- Czujnik wysyła sygnały ping w odstępach co 10 minut, ale czasami dane mogą być niedostępne z powodu problemów z siecią itp., Co reprezentuje wiersz z NA.
- var1, var2, var3 są predyktorami, zmiennymi objaśniającymi.
- flaga_ awarii informuje, czy maszyna uległa awarii, czy nie.
- Mamy dane z ostatnich 6 miesięcy co 10 minut dla każdego identyfikatora maszyny
EDYTOWAĆ:
Oczekiwana prognoza wyników powinna mieć format poniżej
Uwaga: Chcę przewidzieć prawdopodobieństwo awarii dla każdej maszyny na kolejne 30 dni na poziomie dziennym.
failure_flag
.