Interakcje są jawnie potrzebne w modelach regresji, ponieważ formuła nie obejmuje żadnych interakcji per se. Mówiąc dokładniej, model regresji będzie zawsze liniowy na wejściu, podczas gdy interakcja jest nieliniową kombinacją cech.Xja∗ Xjot
Najprostszym sposobem, aby to sprawdzić, jest problem XOR, model regresji bez żadnych interakcji nie może tego rozwiązać, ponieważ wymaga nieliniowej kombinacji.
Z drugiej strony KNN i SVM (i wiele innych modeli) są uniwersalnymi aproksymatorami funkcji. Oznacza to, że nie mogą łączyć swoich danych wejściowych tylko w sposób liniowy, ale także w każdy możliwy nieliniowy sposób. Biorąc pod uwagę wystarczającą liczbę warstw lub odpowiednie jądro, mogą one zasadniczo „tworzyć” własne interakcje, dokładnie tak, jak ich potrzebują. Jeśli znasz lub spodziewasz się, że określone interakcje będą ważne, nadal możesz ich użyć jako danych wejściowych, aby poprowadzić modele we właściwym kierunku.
Podobnie modele oparte na drzewach można interpretować jako składające się wyłącznie z interakcji. Zasadniczo podział w modelu opartym na drzewie tworzy określoną interakcję ze wszystkimi poprzednimi zmiennymi.
Aby więc zdecydować, które interakcje użyć, w przypadku modeli o wystarczająco dużej mocy (tj. Takich, które są uniwersalnymi aproksymatorami funkcji), nie potrzebujesz ich i możesz pozwolić modelowi wykonać własną magię. W przypadku innych modeli to zależy. Istnieje kilka technik, które mogą pomóc w podjęciu decyzji, takich jak CHAID lub regresja stopniowa. CHAID działa również z wieloma funkcjami, w przypadku regresji krokowej może zagubić się w liczbie możliwych interakcji. Biorąc pod uwagę, że jeśli masz funkcji, możliwe są możliwe interakcje (licząc nie tylko interakcje dwukierunkowe, ale także interakcje wyższego rzędu).2 NN.2)N.