Mamy więc potencjał aplikacji do uczenia maszynowego, która dość dobrze wpasowuje się w tradycyjną domenę problemową rozwiązaną przez klasyfikatorów, tj. Mamy zestaw atrybutów opisujących przedmiot i „wiadro”, w którym się kończą. Zamiast tworzyć modele prawdopodobieństw, takich jak w Naive Bayes lub podobnych klasyfikatorach, chcemy, aby nasze dane wyjściowe były zbiorem reguł w przybliżeniu czytelnych dla człowieka, które mogą być przeglądane i modyfikowane przez użytkownika końcowego.
Uczenie się reguł asocjacyjnych wygląda jak rodzina algorytmów, które rozwiązują ten typ problemu, ale wydaje się, że algorytmy te koncentrują się na identyfikowaniu typowych kombinacji cech i nie obejmują koncepcji ostatecznego segmentu, na który te cechy mogą wskazywać. Na przykład nasz zestaw danych wygląda mniej więcej tak:
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
Chcę tylko zasad, które mówią „jeśli jest duży i 2-drzwiowy, to ciężarówka”, a nie zasad, które mówią „jeśli to 4-drzwiowe, to także małe”.
Jednym z obejść, które mogę wymyślić, jest po prostu użycie algorytmów uczenia się reguł asocjacyjnych i zignorowanie reguł, które nie obejmują segmentu końcowego, ale wydaje się to nieco pospolite. Czy przegapiłem jakąś rodzinę algorytmów? A może na początek podchodzę do problemu nieprawidłowo?