Czy istnieje naprawdę prosty opis praktycznych różnic między tymi dwiema technikami?
Oba wydają się być używane do nadzorowanego uczenia się (chociaż reguły stowarzyszenia mogą również obsługiwać bez nadzoru).
Oba można wykorzystać do przewidywania
Znalazłem najbliżej „dobrego” opisu z podręcznika Statsoft . Mówią, że Reguły stowarzyszenia są używane do:
... wykrywają relacje lub powiązania między konkretnymi wartościami zmiennych jakościowych w dużych zestawach danych.
Podczas gdy klasyfikatory drzewa decyzyjnego są opisane jako używane do:
... przewidzieć przynależność przypadków lub obiektów do klas jakościowo zależnej zmiennej na podstawie ich pomiarów na jednej lub więcej zmiennych predykcyjnych.
Jednak w R Data Mining podają przykład reguł asocjacyjnych używanych z polem docelowym .
Oba można więc wykorzystać do przewidywania członkostwa w grupach. Czy kluczową różnicą jest to, że drzewa decyzyjne mogą obsługiwać niekategoryzowane dane wejściowe, podczas gdy reguły asocjacyjne nie? Czy jest coś bardziej fundamentalnego? Jedna strona ( sqlserverdatamining.com ) mówi, że kluczową różnicą jest:
Reguły drzew decyzyjnych są oparte na zdobywaniu informacji, podczas gdy reguły asocjacji oparte są na popularności i / lub zaufaniu.
Więc (ewentualnie odpowiadając na moje pytanie) czy to oznacza, że reguły asocjacyjne są oceniane wyłącznie na podstawie tego, jak często pojawiają się w zbiorze danych (i jak często są „prawdziwe”), podczas gdy drzewa decyzyjne faktycznie próbują zminimalizować wariancję?
Jeśli ktokolwiek zna dobry opis, chętnie by mnie wskazał, to byłoby świetnie.