Nauka danych deep-learning

1

Korzystanie z RNN (LSTM) w systemie rozpoznawania gestów

Usiłuję zbudować system rozpoznawania gestów do klasyfikowania gestów ASL (amerykański język migowy) , więc moje dane wejściowe powinny być sekwencją klatek z kamery lub pliku wideo, a następnie wykrywa tę sekwencję i odwzorowuje ją na odpowiednią klasa (spać, pomagać, jeść, biegać itp.) Chodzi o to, że zbudowałem już podobny system, …

10 neural-network deep-learning keras rnn lstm

1

Co to jest „nowatorski algorytm uczenia się wzmocnienia” w AlphaGo Zero?

Z jakiegoś powodu AlphaGo Zero nie zyskuje tyle rozgłosu, co oryginalne AlphaGo, pomimo jego niesamowitych rezultatów. Zaczynając od zera, pokonał już AlphaGo Master i przeszedł wiele innych testów. Co jeszcze bardziej niewiarygodne, zrobiono to w 40 dni. Google określa go jako „prawdopodobnie najlepszy odtwarzacz Go na świecie” . DeepMind twierdzi, …

10 machine-learning deep-learning

1

Keras LSTM z szeregami czasowymi 1D

Uczę się, jak korzystać z Keras i osiągnąłem znaczny sukces z moim oznaczonym zestawem danych, korzystając z przykładów z głębokiego uczenia się dla Pythona przez Cholleta . Zestaw danych to ~ 1000 szeregów czasowych o długości 3125 z 3 potencjalnymi klasami. Chciałbym wyjść poza podstawowe warstwy Dense, które dają mi …

10 python deep-learning time-series lstm rnn

1

Przekształcanie danych do głębokiego uczenia się za pomocą Keras

Jestem początkującym w Keras i zacząłem od przykładu MNIST, aby zrozumieć, jak biblioteka faktycznie działa. Fragment kodu problemu MNIST w przykładowym folderze Keras podano jako: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, Flatten from keras.layers …

10 python neural-network deep-learning keras

1

Przekształcanie AutoEncoderów

Właśnie przeczytałem artykuł Geoffa Hintona na temat transformacji autoencoderów Hinton, Krizhevsky i Wang: Transforming Auto- encoders . W sztucznych sieciach neuronowych i uczeniu maszynowym, 2011. i chciałbym się bawić z czymś takim. Ale po przeczytaniu nie mogłem uzyskać wystarczającej ilości szczegółów z gazety na temat tego, jak mogę to w …

10 neural-network deep-learning autoencoder

2

Jakie są różnice między Convolutional1D, Convolutional2D i Convolutional3D?

Dowiedziałem się o Convolutional Neural Networks. Patrząc na Kerasprzykłady, natknąłem się na trzy różne metody splotu. Mianowicie 1D, 2D i 3D. Jakie są różnice między tymi trzema warstwami? Jakie są ich przypadki użycia? Czy są jakieś linki lub odniesienia, które pokazują ich przypadki użycia?

10 machine-learning neural-network deep-learning keras cnn

2

Sortuj liczby, używając tylko 2 ukrytych warstw

Czytam kamień węgielny „ Sekwencja do nauki sekwencji za pomocą sieci neuronowych” Ilyi Sutskever i Quoc Le. Na pierwszej stronie krótko wspomina, że: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Czy ktoś może …

10 deep-learning

4

Dlaczego przyspiesza opadanie gradientu, jeśli funkcja jest płynna?

Przeczytałem teraz książkę zatytułowaną „Praktyczne uczenie maszynowe za pomocą Scikit-Learn i TensorFlow”, a na rozdziale 11 znajduje się następujący opis objaśnienia ELU (wykładniczej ReLU). Po trzecie, funkcja jest płynna wszędzie, w tym wokół z = 0, co pomaga przyspieszyć opadanie gradientu, ponieważ nie odbija się tak bardzo w lewo i …

10 deep-learning gradient-descent

1

Dlaczego TensorFlow nie może pasować do prostego modelu liniowego, skoro minimalizuję średni błąd bezwzględny zamiast błędu średniego kwadratu?

We wstępie właśnie się zmieniłem loss = tf.reduce_mean(tf.square(y - y_data)) do loss = tf.reduce_mean(tf.abs(y - y_data)) i model nie jest w stanie dowiedzieć się, że strata z czasem stała się większa. Dlaczego?

10 neural-network deep-learning tensorflow

2

Relu ma z definicji 0 gradient, to dlaczego zniknięcie gradientu nie jest problemem dla x <0?

Z definicji Relu jest max(0,f(x)). Następnie jej nachylenie jest zdefiniowany jako: 1 if x > 0 and 0 if x < 0. Czy nie oznacza to, że gradient zawsze wynosi 0 (znika), gdy x <0? Dlaczego więc mówimy, że Relu nie cierpi z powodu problemu znikania gradientu?

10 deep-learning

1

JAK: Inicjalizacja wagi głębokiej sieci neuronowej

Biorąc pod uwagę trudne zadanie uczenia się (np. Wysoką wymiarowość, naturalną złożoność danych), głębokie sieci neuronowe stają się trudne do wyszkolenia. Aby złagodzić wiele problemów, można: Normalizuj dane && handpick jakości wybierz inny algorytm treningowy (np. RMSprop zamiast Gradient Descent) wybierz bardziej stromy gradient funkcji kosztu (np. Cross Entropy zamiast …

10 machine-learning neural-network deep-learning randomized-algorithms

1

Jak obliczyć wartość delta dla warstwy konwergentnej, biorąc pod uwagę warunki delta i wagi poprzedniej warstwy konwergentnej?

Próbuję trenować sztuczną sieć neuronową z dwiema warstwami splotowymi (c1, c2) i dwiema warstwami ukrytymi (c1, c2). Używam standardowego podejścia do propagacji wstecznej. W przejściu wstecznym obliczam wartość błędu warstwy (delta) na podstawie błędu poprzedniej warstwy, wag poprzedniej warstwy i gradientu aktywacji w odniesieniu do funkcji aktywacji bieżącej warstwy. Mówiąc …

10 machine-learning data-mining neural-network deep-learning

2

Czy normalizacja partii oznacza, że sigmoidy działają lepiej niż ReLU?

Normalizacja partii i ReLU są rozwiązaniami problemu znikającego gradientu. Jeśli używamy normalizacji wsadowej, czy powinniśmy używać sigmoidów? A może istnieją funkcje ReLU, które sprawiają, że są one opłacalne nawet podczas korzystania z batchnorm? Przypuszczam, że normalizacja przeprowadzona w trybie wsadowym wyśle zero aktywacji ujemnych. Czy to oznacza, że batchnorm rozwiązuje …

9 deep-learning batch-normalization

1

Dlaczego mój model Keras uczy się rozpoznawać tło?

Próbuję wyszkolić tę implementację Keras Deeplabv3 + na Pascal VOC2012, używając wstępnie przeszkolonego modelu (który został również przeszkolony w tym zestawie danych). Mam dziwne wyniki z dokładnością szybko zbliżającą się do 1.0: 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: 19385.8555 - val_acc: 0.4818 Epoch …

9 python deep-learning keras tensorflow

2

jakie maszyny / techniki głębokiego uczenia / techniki nlp są używane do klasyfikowania danych słów jako nazwa, numer telefonu komórkowego, adres, adres e-mail, stan, okręg, miasto itp.

Próbuję wygenerować inteligentny model, który może skanować zestaw słów lub ciągów i klasyfikować je jako nazwy, numery telefonów komórkowych, adresy, miasta, stany, kraje i inne podmioty korzystające z uczenia maszynowego lub głębokiego uczenia się. Szukałem podejść, ale niestety nie znalazłem żadnego podejścia. Próbowałem z osadzeniem worka słów model i rękawiczki, …

9 machine-learning deep-learning text-mining natural-language-process

Pytania otagowane jako deep-learning