Załóżmy, że mam klasyfikator (może to być dowolny ze standardowych klasyfikatorów, takich jak drzewo decyzyjne, losowy las, regresja logistyczna itp.) Do wykrywania oszustw za pomocą poniższego kodu
library(randomForest)
rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier
Say, Y is a binary outcome - Fraud/Not-Fraud
Teraz przewidziałem na niewidzialny zestaw danych.
pred = predict(rfFit, newData)
Następnie uzyskałem informacje zwrotne od zespołu dochodzeniowego na temat mojej klasyfikacji i stwierdziłem, że popełniłem błąd, klasyfikując oszustwo jako nieuczciwe (tj. Jeden fałszywy negatywny ) . Czy w każdym razie mogę pozwolić, aby mój algorytm zrozumiał, że popełnił błąd? czyli jakikolwiek sposób dodania pętli sprzężenia zwrotnego do algorytmu, aby mógł poprawić błędy?
Jedną z opcji, które mogę wymyślić z góry głowy, jest zbudowanie takiego, adaboost classifier
aby nowy klasyfikator naprawił błąd starego. lub słyszałem coś o Incremental Learning
lub Online learning
. Czy są jakieś istniejące implementacje (pakiety) w R
?
Czy to właściwe podejście? lub Czy istnieje inny sposób na ulepszenie modelu zamiast budowania go od zera?