Jak wskazują komentarze do twojego pytania, wiele osób pracuje nad znalezieniem czegoś lepszego. Chciałbym odpowiedzieć na to pytanie, rozszerzając komentarz pozostawiony przez @josh
Wszystkie modele są złe, ale niektóre są przydatne (Wiki)
Powyższe stwierdzenie jest ogólną prawdą stosowaną do opisania natury modeli statystycznych. Korzystając z dostępnych danych, możemy tworzyć modele, które pozwalają nam robić użyteczne rzeczy, takie jak przybliżanie przewidywanej wartości.
Weźmy na przykład regresję liniową
Korzystając z wielu obserwacji, możemy dopasować model, aby dać nam przybliżoną wartość dla zmiennej zależnej, biorąc pod uwagę dowolne wartości dla zmiennych niezależnych.
Burnham, KP; Anderson, DR (2002), Model Selection and Multimodel> Inference: A Practical Information-Theoretic Approach (2nd ed.):
„Model jest uproszczeniem lub przybliżeniem rzeczywistości i dlatego nie odzwierciedla całej rzeczywistości.… Box zauważył, że„ wszystkie modele są złe, ale niektóre są przydatne. ”Chociaż model nigdy nie może być„ prawdą ”, model może być uszeregowane od bardzo przydatnego, przez przydatnego, do nieco przydatnego, a ostatecznie zasadniczo bezużytecznego ”.
Odchylenia od naszego modelu (jak widać na powyższym obrazku) wydają się losowe, niektóre obserwacje znajdują się poniżej linii, a niektóre powyżej, ale nasza linia regresji pokazuje ogólną korelację. Podczas gdy odchylenia w naszym modelu wydają się losowe, w realistycznych scenariuszach będą inne czynniki, które powodują to odchylenie. Na przykład wyobraź sobie, że oglądasz samochody jadące przez skrzyżowanie, gdzie muszą skręcić w lewo lub w prawo, aby kontynuować, samochody nie skręcają w żaden szczególny sposób. Chociaż możemy powiedzieć, że kierunek, w którym skręcają samochody, jest całkowicie losowy, czy każdy kierowca dociera do skrzyżowania i w tym momencie podejmuje losową decyzję, w którą stronę skręcić? W rzeczywistości prawdopodobnie kierują się gdzieś z konkretnego powodu i bez próby zatrzymania każdego samochodu, aby zapytać go o ich uzasadnienie, możemy jedynie opisać ich działania jako losowe.
Gdzie jesteśmy w stanie dopasować model z minimalnym odchyleniem, to jak możemy być pewni, że nieznana, niezauważalna lub niezmierzalna zmienna w pewnym momencie rzuci nasz model? Czy trzepot skrzydeł motyla w Brazylii wywołuje tornado w Teksasie?
Problem z używaniem modeli liniowych i SVN, o których wspominasz sam, polega na tym, że jesteśmy nieco zobowiązani do ręcznej obserwacji naszych zmiennych i ich wzajemnego wpływu. Następnie musimy zdecydować, które zmienne są ważne i napisać algorytm specyficzny dla zadania. Może to być proste, jeśli mamy tylko kilka zmiennych, ale co, jeśli mielibyśmy tysiące? Co jeśli chcielibyśmy stworzyć uogólniony model rozpoznawania obrazów, czy można to realistycznie osiągnąć dzięki takiemu podejściu?
Dogłębne uczenie się i sztuczne sieci neuronowe (ANN) mogą pomóc nam w tworzeniu użytecznych modeli dla ogromnych zestawów danych zawierających ogromne ilości zmiennych (np. Bibliotek obrazów). Jak wspomniałeś, istnieje niezrozumiała liczba rozwiązań, które mogłyby pasować do danych przy użyciu ANN, ale czy ta liczba naprawdę różni się od ilości rozwiązań, które musielibyśmy opracować na zasadzie prób i błędów?
Zastosowanie SSN wykonuje dla nas wiele pracy, możemy określić nasze dane wejściowe i pożądane wyniki (i dostosować je później, aby wprowadzić ulepszenia) i pozostawić SSN znalezienie rozwiązania. Właśnie dlatego ANN są często opisywane jako „czarne skrzynki” . Na podstawie danych wejściowych generują one przybliżenie, jednak (ogólnie) przybliżenia te nie zawierają szczegółów dotyczących ich przybliżenia.
I tak naprawdę sprowadza się to do tego, jaki problem próbujesz rozwiązać, ponieważ problem decyduje o tym, które podejście modelowe jest bardziej przydatne. Modele nie są absolutnie dokładne i dlatego zawsze występuje błąd, jednak im dokładniejsze wyniki, tym bardziej są użyteczne. Przydanie się bardziej szczegółowych informacji na temat sposobu przybliżenia może być również przydatne, w zależności od problemu może być nawet bardziej użyteczne niż zwiększona dokładność.
Jeśli na przykład obliczasz zdolność kredytową osób, użycie regresji i SVM zapewnia obliczenia, które można lepiej zbadać. Możliwość zarówno ulepszenia modelu bezpośrednio, jak i wyjaśnienia klientom, jaki wpływ na ich ogólny wynik mają oddzielne zmienne niezależne, jest bardzo przydatna. ANN może pomóc w przetwarzaniu większej ilości zmiennych w celu uzyskania dokładniejszego wyniku, ale czy ta dokładność byłaby bardziej przydatna?