Co się stało z Fuzzy Logic?


10

Rozmyta logika wydawała się być aktywnym obszarem badań w uczeniu maszynowym i eksploracji danych, kiedy byłem w szkole podstawowej (na początku 2000 roku). Rozmyte systemy wnioskowania, rozmyte c-średnie, rozmyte wersje różnych sieci neuronowych i architektury maszyn wektorów wspomagających były nauczane na kursach gradowych i omawiane na konferencjach.

Odkąd zacząłem ponownie zwracać uwagę na ML (~ 2013), wydaje się, że Fuzzy Logic całkowicie spadła z mapy, a jej brak w obecnym krajobrazie ML jest widoczny, biorąc pod uwagę cały szum AI.

Czy był to przypadek, w którym temat po prostu wypadł z mody, czy też było jakieś ograniczenie logiki rozmytej i wnioskowania rozmytego, które doprowadziło do porzucenia tego tematu przez badaczy?


Aby to wyjaśnić, na podstawie komentarza jbowmana: czy było jakieś wydarzenie lub odkrycie, które spowodowało, że FL wyszedł z mody, podobnie jak na przykład sieci neuronowe w latach 60., kiedy wyszli z mody, ponieważ udowodniono, że nie potrafią rozwiązać XOR ? A może Fuzzy Systems wyprzedził konkurencyjny paradygmat?


Nie odpowiedź, ale spekulacja: wydaje się tak bliska prawdopodobieństwa, że ​​być może badacze CS postanowili połączyć te dwie koncepcje?
Cliff AB

1
Wprawdzie będzie to w dużej mierze oparte na opiniach i prawdopodobnie jest nie na temat, ale teraz, kiedy o to pytasz, jestem ciekawy.
jbowman

1
@jbowmanNie wiem, czy jest to oparte na opiniach. Istnieje obiektywna odpowiedź naukowa, dlaczego sieci NNets wyszły z mody w latach 60. (brak rozwiązania XOR) - zastanawiam się, czy coś podobnego stało się z FL.
Skander H.

1
Nadal jest dość żywy w parkluzji mózgu i mapowaniu mózgu, po prostu ludzie nie potrzebują dużo operacji logicznej, ale niewyraźne zadanie wciąż żyje i kopie.
Firebug

Odpowiedzi:


3

Moja odpowiedź jest technicznie bardziej odpowiednia dla zbiorów rozmytych niż logiki rozmytej, ale te dwa pojęcia są praktycznie nierozłączne. Kilka lat temu zagłębiłem się w artykuły w czasopiśmie naukowym na temat logiki rozmytej, aby napisać serię samouczków na temat implementacji zbiorów rozmytych w SQL Server . Chociaż trudno mnie uznać za eksperta, dość dobrze znam literaturę i regularnie używam tych technik do rozwiązywania praktycznych problemów. Silne wrażenie, jakie zebrałem z opublikowanych badań, polega na tym, że praktyczny potencjał zbiorów rozmytych jest wciąż niewykorzystany, głównie ze względu na potop badań nad dziesiątkami innych rodzin technik, które mogą rozwiązać uzupełniające się zestawy pytań.

Zatłoczony rynek pomysłów w dziedzinie nauki o danych / uczenia maszynowego itp.

Nastąpił tak szybki postęp w maszynach wsparcia wektorowego, sieciach neuronowych, losowych lasach itp., Że specjaliści, analitycy, badacze danych, programiści lub konsumenci ich produktów nie mogą nadążyć za tym wszystkim. W mojej serii postów na blogu mówię obszernie o tym, jak rozwój algorytmów dla zbiorów rozmytych i logiki jest generalnie o ponad 20 lat większy niż dostępne oprogramowanie, ale to samo można powiedzieć o wielu powiązanych dziedzinach; Intensywnie czytam o sieciach neuronowych i potrafię wymyślić dziesiątki cennych architektur neuronowych, które zostały opracowane kilkadziesiąt lat temu, ale nigdy nie były szeroko stosowane, nie mówiąc już o kodowaniu w łatwo dostępnym oprogramowaniu. To powiedziawszy, rozmyta logika i zestawy mają dziwną wadę na tym zatłoczonym rynku pomysłów, głównie ze względu na ich pseudonim, który był kontrowersyjny, gdy Lofti A. Zadeh go stworzył. Celem technik rozmytych jest po prostu przybliżenie pewnych klas dyskretnie wycenianych danych w ciągłych skalach, ale pojęcia takie jak „przybliżona logika o ciągłej wartości” i „zestawy stopniowane” nie są do końca przyciągające wzrok. Zadeh przyznał, że użył terminu „rozmyte” po części dlatego, że przyciągał uwagę, ale patrząc wstecz, mógł subtelnie przyciągnąć niewłaściwy rodzaj uwagi.

Jak wypada termin „Fuzz”

Dla naukowca, analityka lub programisty jest to termin, który może wywołać atmosferę „cool tech”; dla osób zainteresowanych AI / data mining / etc. itd. tylko w takim zakresie, w jakim może rozwiązać problemy biznesowe, „rozmyte” brzmi jak niepraktyczny kłopot. Dla kierownika firmy, lekarza zajmującego się badaniami medycznymi lub każdego nieznanego konsumenta może to przywoływać zdjęcia wypchanych zwierząt, pokazy policyjne z lat 70. lub coś z lodówki George'a Carlina. Pomiędzy tymi dwiema grupami zawsze występowało napięcie, przy czym ta ostatnia często opierała się na pisaniu kodu i przeprowadzaniu badań wyłącznie w celu intelektualnej ciekawości, a nie zysku; chyba że pierwsza grupa może wyjaśnić, dlaczego te rozmyte techniki są opłacalne, to ostrożność pierwszej zapobiegnie ich przyjęciu.

Zarządzanie niepewnością i rodzina aplikacji Fuzzy Set

Celem technik rozmytego zestawu jest usunięcieFuzz, który jest już nieodłączny od danych, w postaci nieprecyzyjnych dyskretnych wartości, które można lepiej modelować w przybliżonych skalach ciągłych, w przeciwieństwie do powszechnego błędnego przekonania, że ​​„Fuzz” to coś, co dodajesz, jak specjalne polewy na pizzę. To rozróżnienie może być proste, ale obejmuje szeroką gamę potencjalnych zastosowań, od przetwarzania języka naturalnego do Teorii Decyzji po kontrolę systemów nieliniowych. Prawdopodobieństwo nie pochłonęło logiki rozmytej, jak sugerował Cliff AB, głównie dlatego, że jest to tylko niewielki podzbiór interpretacji, które można dołączyć do rozmytych wartości. Rozmyte funkcje członkostwa są dość proste, ponieważ oceniają tylko, ile rekord należy do określonego zestawu, przypisując jedną lub więcej ciągłych wartości, zwykle w skali od 0 do 1 (chociaż w niektórych aplikacjach „ okazało się, że -1 do 1 może być bardziej przydatne). Znaczenie, jakie przypisujemy tym liczbom, zależy od nas, ponieważ mogą oznaczać wszystko, co chcemy, takie jak bayesowskie stopnie wiary, pewność co do konkretnej decyzji, rozkłady możliwości, aktywacje sieci neuronowej, skalowana wariancja, korelacja itp. Itp., nie tylko wartości PDF, EDF lub CDF. Zagłębiam się bardziej szczegółowo w mojej serii blogów i na stronieten post z CV , z którego większość pochodzi z pracy z moim ulubionym rozmytym zasobem, George'em J. Klirem oraz Fuzzy Sets and Fuzzy Logic: Theory and Applications (1995) Bo Yuan. Zagłębiają się one w znacznie bardziej szczegółowe informacje na temat uzyskiwania całych programów „Zarządzanie niepewnością” z zbiorów rozmytych.

Gdyby logika i zestawy rozmyte były produktem konsumenckim, moglibyśmy powiedzieć, że nie udało się to z powodu braku marketingu i ewangelizacji produktu, a także paradoksalnego wyboru marki. Badając to, nie pamiętam, aby natknąć się na jeden artykuł w czasopiśmie akademickim, który próbował obalić którąkolwiek z tych aplikacji w sposób podobny do niesławnego artykułu Minksy i Paperta o perceptronach. Obecnie na rynku pomysłów jest duża konkurencja o uwagę deweloperów, teoretyków, naukowców zajmujących się danymi i tym podobne produkty o podobnych problemach, co stanowi pozytywny efekt uboczny szybkiego postępu technicznego. Minusem jest to, że jest tu wiele nisko wiszących owoców, które nie zostaną zebrane, szczególnie w dziedzinie modelowania danych, gdzie są najbardziej odpowiednie.


2

Powód, dla którego pomysły logiki rozmytej zniknęły z mody (w ML), jest dla mnie niejasny. Może być to z wielu powodów, czy to technicznych, socjologicznych itp. Jedno jest pewne, że matematyka ML w ostatnich latach była zdominowana przez prawdopodobieństwo / statystyki i optymalizację, dwie dziedziny, w których logika rozmyta (lub pomysły zaczerpnięte z literatury rozmytej) mogą się wypełnić, ale zwykle przynoszą więcej odpowiedzi niż pytań. Kolejną zaletą prawdopodobieństw i optymalizacji jest to, że chociaż mogą występować w nich różne trendy / interpretacje (np. Bayesowskie vs. częstokształtni), podstawowe ramy formalne / matematyczne są dla nich raczej stabilne (moim zdaniem mniej logiczne dla rozmytej logiki rozumiany w szerokim znaczeniu).

  • Hüllermeier, E. (2015). Czy uczenie maszynowe wymaga logiki rozmytej ?. Fuzzy Sets and Systems, 281, 292-299.

Myślę, że jedna z podstawowych idei logiki rozmytej, to znaczy modelowanie pojęć, które są stopniowe i dostarczają narzędzi do wnioskowania (głównie rozszerzających logikę, ale nie tylko) z nią związanych, jest wciąż obecna w niektórych pomysłach ML, w tym w najnowszych. Trzeba po prostu uważnie tego szukać, ponieważ jest to raczej rzadkie. Dwa przykłady obejmują:

  • Farnadi, G., Bach, SH, Moens, MF, Getoor, L., i De Cock, M. (2017). Miękka kwantyfikacja w statystycznym uczeniu relacyjnym. Machine Learning, 106 (12), 1971-1991. (gdzie odniesienia obejmują tezy logiki rozmytej, w tym publikację Zadeh)
  • Cheng, W., Rademaker, M., De Baets, B., i Hüllermeier, E. (2010, wrzesień). Prognozowanie zamówień częściowych: ranking z wstrzymującym się. Podczas wspólnej europejskiej konferencji na temat uczenia maszynowego i odkrywania wiedzy w bazach danych (s. 215–230). Springer, Berlin, Heidelberg.

Ogólnie rzecz biorąc, aby odpowiedzieć na twoje pytanie na bardziej osobistej podstawie, mam wrażenie, że nie ma jasnego postrzegania tego, co logika rozmyta mogłaby osiągnąć (w ostatnich poglądach ML), czego prawdopodobieństwa nie mogłyby, a ponieważ ta ostatnia jest znacznie starsza i wyraźnie pasuje lepiej, jeśli chodzi o ramy ML dotyczące wyświetlania danych pochodzących z populacji probabilistycznej, bardziej naturalne było stosowanie prawdopodobieństwa i statystyki niż logiki rozmytej. Oznacza to również, że jeśli chcesz używać logiki rozmytej w ML, musisz przedstawić przekonujący, dobry powód, aby to zrobić (np. Wykorzystując fakt, że rozszerzają one logikę, zapewniając różne funkcje, abyś mógł uwzględnić reguły logiczne w głębokim uczeniu się techniki).

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.