Używając wielowarstwowej LSTM
z usuwaniem, czy wskazane jest umieszczenie zrzutu na wszystkich ukrytych warstwach, a także na wyjściowych warstwach gęstych? W artykule Hintona (który zaproponował Dropout) umieścił Dropout tylko na gęstych warstwach, ale to dlatego, że ukryte wewnętrzne warstwy były splotowe.
Oczywiście mogę przetestować mój konkretny model, ale zastanawiałem się, czy istnieje konsensus w tej sprawie?