Odpowiedzi:
Uczenie się w trybie online oznacza, że robisz to, gdy nadchodzą dane. Offline oznacza, że masz statyczny zestaw danych.
Tak więc do nauki online masz (zwykle) więcej danych, ale masz ograniczenia czasowe. Kolejnym zmarszczeniem, które może wpływać na naukę online, jest to, że twoje koncepcje mogą się zmieniać z czasem.
Powiedzmy, że chcesz zbudować klasyfikator do rozpoznawania spamu. Możesz zdobyć duży zbiór wiadomości e-mail, oznaczyć je etykietą i wyszkolić na nim klasyfikatora. To byłaby nauka offline. Lub możesz wziąć wszystkie wiadomości e-mail przychodzące do systemu i stale aktualizować klasyfikator (etykiety mogą być nieco trudne). To byłaby nauka online.
Termin „online” jest przeciążony i dlatego powoduje zamieszanie w dziedzinie uczenia maszynowego.
Przeciwieństwem „online” jest nauka partii. W uczeniu wsadowym algorytm uczący się aktualizuje parametry po zużyciu całej partii, podczas gdy w uczeniu online algorytm aktualizuje swoje parametry po uczeniu się z 1 instancji szkoleniowej. Uczenie się w trybie wsadowym to punkt pośredni między uczeniem się w trybie wsadowym z jednej strony a uczeniem się w trybie online z drugiej strony.
Również „kiedy” dane przychodzą lub czy można je przechowywać, czy nie, jest ortogonalne dla uczenia się online lub okresowego.
Uczenie się przez Internet uważa się za wolniejsze w osiągnięciu minimów, w porównaniu do uczenia się partiami. Jednak w przypadkach, gdy cały zestaw danych nie mieści się w pamięci, uczenie się online jest akceptowalnym kompromisem.
Uczenie się online (zwane także uczeniem przyrostowym ): rozważamy jedną prezentację przykładów. W takim przypadku każdy przykład jest używany kolejno w sposób zgodny z algorytmem uczenia się, a następnie wyrzucany. Zmiany ciężaru dokonane na danym etapie zależą konkretnie tylko od (obecnego) prezentowanego przykładu i być może od aktualnego stanu modelu. Jest to naturalna procedura dla różnych reguł czasowych, w których przykłady mogą nie być w ogóle dostępne od razu.
Uczenie się offline : zmiany masy zależą od całego zestawu danych (szkolenia), definiując globalną funkcję kosztów. Przykłady stosuje się wielokrotnie, aż do osiągnięcia minimalizacji tej funkcji kosztów.