Pytania otagowane jako deep-learning

nowy obszar badań Machine Learning dotyczący technologii wykorzystywanych do uczenia się hierarchicznych reprezentacji danych, wykonywanych głównie w głębokich sieciach neuronowych (tj. sieciach z dwiema lub więcej ukrytymi warstwami), ale także z pewnymi probabilistycznymi modelami graficznymi.

1
Korzystanie z RNN (LSTM) w systemie rozpoznawania gestów
Usiłuję zbudować system rozpoznawania gestów do klasyfikowania gestów ASL (amerykański język migowy) , więc moje dane wejściowe powinny być sekwencją klatek z kamery lub pliku wideo, a następnie wykrywa tę sekwencję i odwzorowuje ją na odpowiednią klasa (spać, pomagać, jeść, biegać itp.) Chodzi o to, że zbudowałem już podobny system, …


1
Keras LSTM z szeregami czasowymi 1D
Uczę się, jak korzystać z Keras i osiągnąłem znaczny sukces z moim oznaczonym zestawem danych, korzystając z przykładów z głębokiego uczenia się dla Pythona przez Cholleta . Zestaw danych to ~ 1000 szeregów czasowych o długości 3125 z 3 potencjalnymi klasami. Chciałbym wyjść poza podstawowe warstwy Dense, które dają mi …

1
Przekształcanie danych do głębokiego uczenia się za pomocą Keras
Jestem początkującym w Keras i zacząłem od przykładu MNIST, aby zrozumieć, jak biblioteka faktycznie działa. Fragment kodu problemu MNIST w przykładowym folderze Keras podano jako: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, Flatten from keras.layers …

1
Przekształcanie AutoEncoderów
Właśnie przeczytałem artykuł Geoffa Hintona na temat transformacji autoencoderów Hinton, Krizhevsky i Wang: Transforming Auto- encoders . W sztucznych sieciach neuronowych i uczeniu maszynowym, 2011. i chciałbym się bawić z czymś takim. Ale po przeczytaniu nie mogłem uzyskać wystarczającej ilości szczegółów z gazety na temat tego, jak mogę to w …


2
Sortuj liczby, używając tylko 2 ukrytych warstw
Czytam kamień węgielny „ Sekwencja do nauki sekwencji za pomocą sieci neuronowych” Ilyi Sutskever i Quoc Le. Na pierwszej stronie krótko wspomina, że: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Czy ktoś może …




1
JAK: Inicjalizacja wagi głębokiej sieci neuronowej
Biorąc pod uwagę trudne zadanie uczenia się (np. Wysoką wymiarowość, naturalną złożoność danych), głębokie sieci neuronowe stają się trudne do wyszkolenia. Aby złagodzić wiele problemów, można: Normalizuj dane && handpick jakości wybierz inny algorytm treningowy (np. RMSprop zamiast Gradient Descent) wybierz bardziej stromy gradient funkcji kosztu (np. Cross Entropy zamiast …

1
Jak obliczyć wartość delta dla warstwy konwergentnej, biorąc pod uwagę warunki delta i wagi poprzedniej warstwy konwergentnej?
Próbuję trenować sztuczną sieć neuronową z dwiema warstwami splotowymi (c1, c2) i dwiema warstwami ukrytymi (c1, c2). Używam standardowego podejścia do propagacji wstecznej. W przejściu wstecznym obliczam wartość błędu warstwy (delta) na podstawie błędu poprzedniej warstwy, wag poprzedniej warstwy i gradientu aktywacji w odniesieniu do funkcji aktywacji bieżącej warstwy. Mówiąc …

2
Czy normalizacja partii oznacza, że ​​sigmoidy działają lepiej niż ReLU?
Normalizacja partii i ReLU są rozwiązaniami problemu znikającego gradientu. Jeśli używamy normalizacji wsadowej, czy powinniśmy używać sigmoidów? A może istnieją funkcje ReLU, które sprawiają, że są one opłacalne nawet podczas korzystania z batchnorm? Przypuszczam, że normalizacja przeprowadzona w trybie wsadowym wyśle ​​zero aktywacji ujemnych. Czy to oznacza, że ​​batchnorm rozwiązuje …

1
Dlaczego mój model Keras uczy się rozpoznawać tło?
Próbuję wyszkolić tę implementację Keras Deeplabv3 + na Pascal VOC2012, używając wstępnie przeszkolonego modelu (który został również przeszkolony w tym zestawie danych). Mam dziwne wyniki z dokładnością szybko zbliżającą się do 1.0: 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: 19385.8555 - val_acc: 0.4818 Epoch …

2
jakie maszyny / techniki głębokiego uczenia / techniki nlp są używane do klasyfikowania danych słów jako nazwa, numer telefonu komórkowego, adres, adres e-mail, stan, okręg, miasto itp.
Próbuję wygenerować inteligentny model, który może skanować zestaw słów lub ciągów i klasyfikować je jako nazwy, numery telefonów komórkowych, adresy, miasta, stany, kraje i inne podmioty korzystające z uczenia maszynowego lub głębokiego uczenia się. Szukałem podejść, ale niestety nie znalazłem żadnego podejścia. Próbowałem z osadzeniem worka słów model i rękawiczki, …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.