Rozumiem, że szkolenie wstępne jest stosowane, aby uniknąć niektórych problemów z konwencjonalnym treningiem. Jeśli używam propagacji wstecznej z, powiedzmy autoencoderem, wiem, że napotkam problemy z czasem, ponieważ propagacja wsteczna jest powolna, a także że mogę utknąć w lokalnych optymach i nie nauczyć się niektórych funkcji.
To, czego nie rozumiem, to to, w jaki sposób wstępnie szkolimy sieć i co konkretnie robimy, aby wstępnie szkolić. Na przykład, jeśli otrzymamy stos ograniczonych maszyn Boltzmanna, w jaki sposób wstępnie przeszkolimy tę sieć?