Oto moje dane treningowe: 200 000 przykładów x 10 000 funkcji. Zatem moja macierz danych treningowych wynosi - 200 000 x 10 000.
Udało mi się zapisać to w płaskim pliku bez problemów z pamięcią, zapisując każdy zestaw danych jeden po drugim (jeden przykład po drugim) podczas generowania funkcji dla każdego przykładu.
Ale teraz, gdy używam Milk , SVM light lub dowolnego innego algorytmu uczenia maszynowego, wszystko próbuje załadować całe dane treningowe do pamięci zamiast trenować je jeden po drugim. Mam tylko 8 GB pamięci RAM, więc nie mogę tego zrobić.
Czy wiesz w każdym razie, że mógłbym wyszkolić algorytm jeden zestaw danych przez jeden zestaw danych? To znaczy, że w każdej chwili mam tylko jeden zestaw danych załadowany do pamięci podczas treningu.