Pytania otagowane jako deep-learning

Głębokie uczenie się to dziedzina uczenia maszynowego, której celem jest nauka złożonych funkcji przy użyciu specjalnych architektur sieci neuronowych, które są „głębokie” (składają się z wielu warstw). Tego tagu należy używać w przypadku pytań dotyczących implementacji architektur uczenia głębokiego. Ogólne pytania dotyczące systemów uczących się należy oznaczyć tagiem „systemy uczące się”. Pomocne jest dołączenie znacznika do odpowiedniej biblioteki oprogramowania (np. „Keras”, „tensorflow”, „pytorch”, „fast.ai” itd.).


3
Zrozumienie LSTM Keras
Próbuję pogodzić moje rozumienie LSTM i wskazałem tutaj w tym poście Christophera Olaha zaimplementowanego w Keras. Śledzę ten blog napisany przez Jason Brownlee za tutorial Keras. Głównie jestem zdezorientowany: Przekształcenie serii danych w [samples, time steps, features]i, Stanowe LSTM Skoncentrujmy się na dwóch powyższych pytaniach w odniesieniu do kodu wklejonego …

15
Jaka jest różnica między wypełnieniem „SAME” i „WAŻNE” w tf.nn.max_pool przepływu tensorflow?
Jaka jest różnica między „sam” i „skuteczne” w wyściółką tf.nn.max_poolz tensorflow? Moim zdaniem „WAŻNE” oznacza, że ​​nie będzie zerowania na krawędziach, gdy wykonamy maksymalną pulę. Według Przewodnika po arytmetyki splotowej dla głębokiego uczenia się , mówi, że operator puli nie będzie wypełniał, tj. Po prostu użyje „WAŻNE” z tensorflow. Ale …

2
Objaśnienie danych wejściowych Keras: input_shape, jednostki, batch_size, dim itp
Dla każdej warstwy Keras ( Layerklasy), może ktoś wyjaśnić jak należy rozumieć różnicę między input_shape, units, dim, itd.? Na przykład dokument mówi, że unitsokreśl wyjściowy kształt warstwy. Na zdjęciu sieci neuronowej poniżej hidden layer1ma 4 jednostki. Czy to bezpośrednio przekłada się na unitsatrybut Layerobiektu? Czy unitsw Keras jest równy kształtowi …



5
Najlepszy sposób na zapisanie wytrenowanego modelu w PyTorch?
Szukałem alternatywnych sposobów zapisania wytrenowanego modelu w PyTorch. Jak dotąd znalazłem dwie alternatywy. torch.save (), aby zapisać model i torch.load (), aby załadować model. model.state_dict (), aby zapisać wytrenowany model i model.load_state_dict (), aby załadować zapisany model. Natknąłem się na tę dyskusję, w której podejście 2 jest zalecane zamiast podejścia …

11
Dlaczego binary_crossentropy i categorical_crossentropy dają różne wyniki dla tego samego problemu?
Próbuję wytresować CNN do kategoryzowania tekstu według tematu. Kiedy używam binarnej entropii krzyżowej, uzyskuję ~ 80% dokładności, przy kategorycznej entropii krzyżowej uzyskuję ~ 50% dokładności. Nie rozumiem, dlaczego tak jest. Jest to problem wieloklasowy, czy nie oznacza to, że muszę używać kategorycznej entropii krzyżowej i że wyniki z binarną entropią …

8
Co robi funkcja tf.nn.embedding_lookup?
tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) Nie rozumiem obowiązku tej funkcji. Czy to jest jak tabela przeglądowa? Co oznacza zwrócenie parametrów odpowiadających każdemu identyfikatorowi (w identyfikatorach)? Na przykład w skip-grammodelu, jeśli używamy tf.nn.embedding_lookup(embeddings, train_inputs), to dla każdego train_inputznajduje odpowiednie osadzenie?

10
Keras, jak uzyskać wynik każdej warstwy?
Wyszkoliłem binarny model klasyfikacji w CNN, a oto mój kod model = Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode='valid', input_shape=input_shape)) model.add(Activation('relu')) model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (16, 16, 32) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (8, 8, 64) = (2048) model.add(Flatten()) model.add(Dense(1024)) model.add(Activation('relu')) model.add(Dropout(0.5)) model.add(Dense(2)) # define …





5
Jaka jest rola „Spłaszczenia” w Keras?
Próbuję zrozumieć rolę tej Flattenfunkcji w Keras. Poniżej znajduje się mój kod, który jest prostą siecią dwuwarstwową. Pobiera dwuwymiarowe dane kształtu (3, 2) i generuje jednowymiarowe dane kształtu (1, 4): model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu')) model.add(Flatten()) model.add(Dense(4)) model.compile(loss='mean_squared_error', optimizer='SGD') x = np.array([[[1, 2], [3, 4], [5, 6]]]) y …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.