Osoba z zewnątrz w polu ML / DL; rozpoczął kurs głębokiego uczenia Udacity oparty na Tensorflow; wykonanie zadania 4 zadanie 4; próba dostrojenia szybkości uczenia się za pomocą następującej konfiguracji:
- Wielkość partii 128
- Liczba kroków: wystarczy, aby wypełnić 2 epoki
- Rozmiary ukrytych warstw: 1024, 305, 75
- Inicjalizacja wagi: normalnie obcięta ze standardowym. odchylenie sqrt (2 / n), gdzie n jest rozmiarem poprzedniej warstwy
- Prawdopodobieństwo porzucenia: 0,75
- Regularyzacja: nie dotyczy
- Algorytm szybkości uczenia się: rozkład wykładniczy
bawił się parametrami szybkości uczenia się; w większości przypadków nie wydają się działać; kod tutaj ; wyniki:
Accuracy learning_rate decay_steps decay_rate staircase
93.7 .1 3000 .96 True
94.0 .3 3000 .86 False
94.0 .3 3000 .96 False
94.0 .3 3000 .96 True
94.0 .5 3000 .96 True
- Jak powinienem systematycznie dostosowywać tempo uczenia się?
- W jaki sposób współczynnik uczenia się jest powiązany z liczbą kroków?