Właśnie zaczynam się uczyć, jak sieć neuronowa może działać, aby rozpoznawać wzorce i kategoryzować dane wejściowe, i widziałem, jak sztuczna sieć neuronowa może analizować dane obrazu i kategoryzować obrazy ( demo z convnetjs ) i klucz tam polega na próbkowaniu w dół obrazu, a każdy piksel stymuluje jeden neuron wejściowy do sieci.
Jednak próbuję owinąć głowę, jeśli można to zrobić za pomocą ciągów znaków? Przypadek użycia, który mam, to „silnik rekomendacji” do filmów oglądanych przez użytkownika. Filmy zawierają wiele ciągów znaków (tytuł, fabuła, tagi) i mogę sobie wyobrazić „próbkowanie” tekstu w dół do kilku kluczowych słów opisujących ten film, ale nawet jeśli przeanalizuję pięć pierwszych słów opisujących ten film, myślisz, że potrzebuję neuronów wejściowych dla każdego angielskiego słowa, aby porównać zestaw filmów? Mógłbym ograniczyć neurony wejściowe tylko do słów użytych w zestawie, ale czy mógłbym się urosnąć / uczyć przez dodanie nowych filmów (użytkownik ogląda nowy film, z nowymi słowami)? Większość bibliotek, które widziałem, nie pozwalają na dodawanie nowych neuronów po przeszkoleniu systemu?
Czy istnieje standardowy sposób mapowania danych ciąg / słowo / znak na dane wejściowe w sieci neuronowej? Czy też sieć neuronowa naprawdę nie jest odpowiednim narzędziem do analizowania takich ciągów danych (jakie jest lepsze narzędzie do dopasowywania wzorców w ciągach danych)?