Czy istnieją jakieś praktyczne zasady (lub rzeczywiste zasady) dotyczące minimalnej, maksymalnej i „rozsądnej” liczby komórek LSTM, których powinienem użyć? W szczególności odnoszę się do BasicLSTMCell z TensorFlow i num_units
własności.
Załóżmy, że mam problem z klasyfikacją zdefiniowany przez:
t - number of time steps
n - length of input vector in each time step
m - length of output vector (number of classes)
i - number of training examples
Czy na przykład prawdą jest, że liczba przykładów szkoleń powinna być większa niż:
4*((n+1)*m + m*m)*c
gdzie c
jest liczba komórek? Oparłem to na tym: jak obliczyć liczbę parametrów sieci LSTM? Jak rozumiem, powinno to dać całkowitą liczbę parametrów, która powinna być mniejsza niż liczba przykładów treningowych.