Pytania otagowane jako lstm

3
Zrozumienie LSTM Keras
Próbuję pogodzić moje rozumienie LSTM i wskazałem tutaj w tym poście Christophera Olaha zaimplementowanego w Keras. Śledzę ten blog napisany przez Jason Brownlee za tutorial Keras. Głównie jestem zdezorientowany: Przekształcenie serii danych w [samples, time steps, features]i, Stanowe LSTM Skoncentrujmy się na dwóch powyższych pytaniach w odniesieniu do kodu wklejonego …

6
Jak zastosować obcinanie gradientu w TensorFlow?
Biorąc pod uwagę przykładowy kod . Chciałbym wiedzieć, jak zastosować obcinanie gradientu w tej sieci w sieci RNN, gdzie istnieje możliwość eksplozji gradientów. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) To jest przykład, który można wykorzystać, ale gdzie mam go wprowadzić? W obronie RNN lstm_cell = rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0) # Split data because rnn …

6
PyTorch - ciągły ()
Przeglądałem ten przykład modelu języka LSTM na github (link) . Ogólnie rzecz biorąc, jest dla mnie całkiem jasne. Ale wciąż staram się zrozumieć, co contiguous()robi wywołanie , co występuje kilka razy w kodzie. Na przykład w linii 74/75 kodu wejściowego i sekwencji docelowej LSTM są tworzone. Dane (przechowywane w ids) …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.