Chciałbym użyć danych nieatomowych jako funkcji prognozy. Załóżmy, że mam tabelę z tymi funkcjami:
- Column 1: Categorical - House
- Column 2: Numerical - 23.22
- Column 3: A Vector - [ 12, 22, 32 ]
- Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ]
- Column 5: A List [ 122, Boolean ]
Chciałbym przewidzieć / sklasyfikować, na przykład, kolumnę 2.
Robię coś, aby automatycznie odpowiadać na pytania, wszelkiego rodzaju pytania, na przykład „Where Foo Born?” ...
Najpierw wykonuję zapytanie do wyszukiwarki, potem otrzymuję dane tekstowe, a następnie wykonuję wszystkie analizy (dodawanie tagów, udostępnianie, analizowanie, dzielenie ...)
Moje pierwsze podejście polegało na stworzeniu tabeli, w każdym wierszu z wierszem tekstu i wieloma funkcjami, takimi jak „Pierwsze słowo”, „Tag pierwszego słowa”, „Kawałki” itp.
Ale przy takim podejściu brakuje mi związków między zdaniami.
Chciałbym wiedzieć, czy istnieje algorytm, który przegląda struktury drzewiaste (lub wektory) i tworzy relacje oraz wyodrębnia wszystko, co jest istotne dla przewidywania / klasyfikacji. Wolałbym wiedzieć o bibliotece, która to robi, niż o algorytmie, który muszę zaimplementować.