Odpowiedzi:
LSTM ma zestaw 2 matryc: U i W dla każdej z (3) bramek. (.) Na schemacie wskazuje pomnożenie tych macierzy przez wejście i wyjście .
Stąd suma # parametrów =
Jednak w przypadku, gdy Twój LSTM zawiera wektory odchylenia ( jest to domyślne na przykład w keras ), liczba staje się:
Zgodnie z tym :
Struktura komórki LSTM
Równania LSTM
Wprowadzanie nieliniowości
Jeśli wejściowy x_t ma rozmiar n × 1 i istnieją d komórki pamięci, to rozmiar każdego z W ∗ i U ∗ wynosi d × n , a d × d odpowiednio. Rozmiar W będzie wówczas wynosił 4d × (n + d) . Należy zauważyć, że każda z komórek pamięci dd ma własne wagi W ∗ i U ∗ oraz że jedyne wartości komórek pamięci czasu są współużytkowane z innymi jednostkami LSTM podczas produktu z U ∗ .
Dzięki Arun Mallya za świetną prezentację.