Jestem początkującym, który próbuje stworzyć swój pierwszy projekt. Miałem na myśli projekt klasyfikacji piosenek, ale ponieważ będę ręcznie etykietować, mogłem tylko rozsądnie zebrać około 1000 piosenek lub 60 godzin muzyki.
Klasyfikowałbym się z kilkoma klasami, więc możliwe, że jedna klasa miałaby zaledwie 50-100 piosenek w zestawie treningowym - wydaje się, że to za mało! Czy istnieje ogólna ogólna zasada dotycząca ilości danych potrzebnych do wyszkolenia sieci neuronowej, aby dać jej szansę na działanie?
Edycja: Myślałem o użyciu waniliowej LSTM. Funkcje wejściowe będą miały wymiar 39, wymiar wyjściowy 6, moja pierwsza próba wymiaru warstwy ukrytej to 100.