Podczas korzystania z wywołania zwrotnego wczesnego zatrzymania w Keras trening zatrzymuje się, gdy niektóre wskaźniki (zwykle utrata sprawdzania poprawności) nie rosną. Czy istnieje sposób na użycie innej miary (takiej jak precyzja, odwołanie, miara f) zamiast utraty sprawdzania poprawności? Wszystkie przykłady, które do tej pory widziałem, są podobne do tego: callbacks.EarlyStopping …
Próbowałem zrozumieć, w jaki sposób reprezentować i kształtować dane, aby tworzyć wielowymiarowe i wielowymiarowe prognozy szeregów czasowych za pomocą Keras (lub TensorFlow), ale nadal jestem bardzo niejasny po przeczytaniu wielu postów / samouczków / dokumentacji na blogu, w jaki sposób prezentować dane w poprawny kształt (większość przykładów jest nieco mniejsza …
Próbuję zaimplementować współdzielone warstwy w Keras. Widzę, że Keras ma keras.layers.concatenate, ale nie jestem pewien z dokumentacji dotyczącej jego użycia. Czy mogę go używać do tworzenia wielu współdzielonych warstw? Jaki byłby najlepszy sposób na wdrożenie prostej wspólnej sieci neuronowej, jak pokazano poniżej przy użyciu Keras? Zauważ, że wszystkie kształty warstw …
Mam duży, wielowymiarowy zestaw danych, który jest generowany każdego dnia. Jakie byłoby dobre podejście do wykrycia jakiejkolwiek „anomalii” w porównaniu z poprzednimi dniami? Czy to odpowiedni problem, który można rozwiązać za pomocą sieci neuronowych? Wszelkie sugestie są mile widziane. dodatkowe informacje: nie ma przykładów, więc metoda powinna wykryć anomalie
Mam w Keras model splotowy + LSTM, podobny do tego (ref 1), którego używam do konkursu Kaggle. Architektura jest pokazana poniżej. Przeszkoliłem go na moim oznaczonym zestawie 11000 próbek (dwie klasy, początkowa częstość wynosi ~ 9: 1, więc zwiększyłem próbkę 1 do około 1/1) dla 50 epok z 20% podziałem …
Próbuję zaimplementować ten artykuł na zestawie obrazów medycznych. Robię to w Keras. Sieć zasadniczo składa się z 4 warstw konwekcyjnych i maksymalnych pul, po których następuje w pełni połączona warstwa i miękki klasyfikator maksymalny. O ile wiem, postępowałem zgodnie z architekturą wymienioną w artykule. Jednak utrata walidacji i dokładność pozostają …
Czy istnieją jakieś praktyczne zasady (lub rzeczywiste zasady) dotyczące minimalnej, maksymalnej i „rozsądnej” liczby komórek LSTM, których powinienem użyć? W szczególności odnoszę się do BasicLSTMCell z TensorFlow i num_unitswłasności. Załóżmy, że mam problem z klasyfikacją zdefiniowany przez: t - number of time steps n - length of input vector in …
Prototypuję aplikację i potrzebuję modelu językowego, aby obliczyć zakłopotanie w przypadku niektórych wygenerowanych zdań. Czy istnieje jakiś wyuczony model języka w Pythonie, którego można łatwo używać? Coś prostego jak model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < …
Właśnie zbudowałem tę sieć neuronową LSTM za pomocą Keras import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import Sequential from matplotlib import pyplot #read and prepare data from datafile data_file_name …
Pracuję z Pythonem, scikit-learn i keras. Mam 3000 tysięcy zdjęć zegarków z przednią twarzą, takich jak: Watch_1 , Watch_2 , Watch_3 . Chcę napisać program, który odbierze jako wejście zdjęcie prawdziwego zegarka, który może być zrobiony w mniej idealnych warunkach niż powyższe zdjęcia (inny kolor tła, ciemniejsze błyskawice itp.) I …
Pracuję na modelu Seq2Seq przy użyciu LSTM z Keras (przy użyciu tła Theano) i chciałbym zrównoleglić procesy, ponieważ nawet kilka MB danych potrzebuje kilku godzin na szkolenie. Oczywiste jest, że procesory graficzne są znacznie lepsze w równoległości niż procesory. W tej chwili mam tylko procesory do pracy. Miałem dostęp do …
Usiłuję zbudować system rozpoznawania gestów do klasyfikowania gestów ASL (amerykański język migowy) , więc moje dane wejściowe powinny być sekwencją klatek z kamery lub pliku wideo, a następnie wykrywa tę sekwencję i odwzorowuje ją na odpowiednią klasa (spać, pomagać, jeść, biegać itp.) Chodzi o to, że zbudowałem już podobny system, …
Detale: GPU : GTX 1080 Szkolenie : ~ 1,1 miliona zdjęć należących do 10 klas Walidacja : ~ 150 tysięcy zdjęć należących do 10 klas Czas na epokę : ~ 10 godzin Skonfigurowałem CUDA, cuDNN i Tensorflow (również GPU Tensorflow). Nie sądzę, że mój model jest tak skomplikowany, że zajmuje …
Tło: Dopasowując sieci neuronowe z aktywacją relu, stwierdziłem, że czasami prognoza staje się prawie stała. Uważam, że jest to spowodowane umieraniem neuronów relu podczas treningu, jak stwierdzono tutaj. (Na czym polega problem „umierania ReLU” w sieciach neuronowych? ) Pytanie: Mam nadzieję zaimplementować kontrolę w samym kodzie, aby sprawdzić, czy neurony …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.