Pytania otagowane jako deep-learning

nowy obszar badań Machine Learning dotyczący technologii wykorzystywanych do uczenia się hierarchicznych reprezentacji danych, wykonywanych głównie w głębokich sieciach neuronowych (tj. sieciach z dwiema lub więcej ukrytymi warstwami), ale także z pewnymi probabilistycznymi modelami graficznymi.





4
Jak uzyskać dokładność, F1, precyzję i wycofanie, dla modelu Keras?
Chcę obliczyć precyzję, pamięć i wynik F1 dla mojego binarnego modelu KerasClassifier, ale nie znajduję żadnego rozwiązania. Oto mój rzeczywisty kod: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) model.add(Dense(1, …




3
Wyodrębnianie słów kluczowych / fraz z tekstu przy użyciu bibliotek Deep Learning
Być może jest to zbyt ogólne, ale szukam referencji na temat korzystania z głębokiego uczenia się w zadaniu podsumowywania tekstu. Wdrożyłem już podsumowanie tekstu przy użyciu standardowych podejść do częstotliwości słów i rankingu zdań, ale chciałbym zbadać możliwość zastosowania technik głębokiego uczenia się do tego zadania. Przeszedłem również kilka implementacji …

2
Keras vs. tf.keras
Jestem trochę zagubiony w wyborze pomiędzy Keras (keras-team / keras) i tf.keras (tensorflow / tensorflow / python / keras /) dla mojego nowego projektu badawczego. Toczy się debata, w której Keras nie jest własnością nikogo, więc ludzie chętniej się do tego przyczyniają, a zarządzanie projektem będzie znacznie łatwiejsze w przyszłości. …

1
Prognozowanie szeregów czasowych za pomocą LSTM: Znaczenie unieruchomienia szeregów czasowych
W tym linku dotyczącym stacjonarności i różnicowania wspomniano, że modele takie jak ARIMA wymagają stacjonarnych szeregów czasowych do prognozowania, ponieważ jego właściwości statystyczne, takie jak średnia, wariancja, autokorelacja itp., Są stałe w czasie. Ponieważ sieci RNN mają lepszą zdolność do uczenia się relacji nieliniowych ( jak podano tutaj: Obietnica nawracających …

2
Dlaczego ReLU jest używane jako funkcja aktywacji?
Funkcje aktywacyjne służą do wprowadzenia nieliniowości w liniowym wyjściu typu w * x + bw sieci neuronowej. Które jestem w stanie zrozumieć intuicyjnie dla funkcji aktywacyjnych takich jak sigmoid. Rozumiem zalety ReLU, które pozwala uniknąć martwych neuronów podczas propagacji wstecznej. Jednak nie jestem w stanie zrozumieć, dlaczego ReLU jest używane …

4
Wyszukiwanie hiperparametrów dla LSTM-RNN za pomocą Keras (Python)
Z samouczka RNN firmy Keras: „RNN są trudne. Wybór wielkości partii jest ważny, wybór straty i optymalizatora ma kluczowe znaczenie itp. Niektóre konfiguracje nie będą zbieżne”. Jest to więc bardziej ogólne pytanie dotyczące dostrajania hiperparametrów LSTM-RNN w Keras. Chciałbym wiedzieć o podejściu do znalezienia najlepszych parametrów dla Twojego RNN. Zacząłem …

2
lokalne minima vs punkty siodłowe w głębokim uczeniu się
Słyszałem, jak Andrew Ng (w filmie, którego niestety już nie mogę znaleźć) opowiadał o tym, jak zmieniło się rozumienie lokalnych minimów w problemach głębokiego uczenia się w tym sensie, że są one obecnie uważane za mniej problematyczne, ponieważ w przestrzeniach wielowymiarowych (spotykanych w głębokie uczenie się) punkty krytyczne częściej są …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.