Rozpoczynam projekt, w którym zadaniem jest identyfikacja typów tenisówek na podstawie zdjęć. Obecnie czytam implementacje TensorFlow i Torch . Moje pytanie brzmi: ile zdjęć na klasę jest wymaganych, aby osiągnąć rozsądną klasyfikację?
Czy istnieją jakieś praktyczne zasady (lub rzeczywiste zasady) dotyczące minimalnej, maksymalnej i „rozsądnej” liczby komórek LSTM, których powinienem użyć? W szczególności odnoszę się do BasicLSTMCell z TensorFlow i num_unitswłasności. Załóżmy, że mam problem z klasyfikacją zdefiniowany przez: t - number of time steps n - length of input vector in …
Prototypuję aplikację i potrzebuję modelu językowego, aby obliczyć zakłopotanie w przypadku niektórych wygenerowanych zdań. Czy istnieje jakiś wyuczony model języka w Pythonie, którego można łatwo używać? Coś prostego jak model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < …
W jaki sposób można zoptymalizować się wstępnie przeszkolony neural network , aby zastosować go do osobnego problemu? Czy po prostu dodasz więcej warstw do wstępnie wyszkolonego modelu i przetestujesz go na swoim zestawie danych? Na przykład, jeśli zadaniem było użycie CNN do klasyfikacji grup tapet , jestem pewien, że nie …
Te dwie operacje splotu są obecnie bardzo powszechne w głębokim uczeniu się. O rozszerzonej warstwie splotowej przeczytałem w tym artykule: WAVENET: GENERACYJNY MODEL SUROWEGO AUDIO a Dekonwolucja znajduje się w tym artykule: W pełni konwolucyjne sieci dla segmentacji semantycznej Oba wydają się próbkować obraz, ale jaka jest różnica?
Próbuję używać CNN (splotowa sieć neuronowa) do klasyfikowania dokumentów. CNN dla krótkiego tekstu / zdań był badany w wielu artykułach. Wydaje się jednak, że żaden dokument nie używał CNN do długiego tekstu lub dokumentu. Mój problem polega na tym, że dokument zawiera zbyt wiele funkcji. W moim zestawie danych każdy …
Próbuję dowiedzieć się, ile wag i stronniczości jest potrzebnych dla CNN. Powiedz, że mam obraz (3, 32, 32) i chcę zastosować filtr (32, 5, 5). Dla każdej mapy obiektów mam wagi 5 x 5, więc powinienem mieć parametry 3 x (5 x 5) x 32. Teraz muszę dodać błąd. Wydaje …
Większość sieci, które widziałem, ma jedną lub dwie gęste warstwy przed ostatnią warstwą softmax. Czy istnieje jakiś zasadny sposób wyboru liczby i wielkości gęstych warstw? Czy dwie gęste warstwy są bardziej reprezentatywne niż jedna dla tej samej liczby parametrów? Czy należy stosować usuwanie przed każdą gęstą warstwą, czy tylko raz?
Zastanawiam się, jak interpretować architekturę cykliczną w kontekście EEG. W szczególności myślę o tym jako o Rekurencyjnym CNN (w przeciwieństwie do architektur takich jak LSTM), ale może dotyczy to również innych typów sieci rekurencyjnych Kiedy czytam o R-CNN, są one zwykle wyjaśniane w kontekście klasyfikacji obrazów. Zazwyczaj określa się je …
Pracuję z analizą danych EEG, które ostatecznie będą musiały zostać sklasyfikowane. Jednak uzyskanie etykiet do nagrań jest dość drogie, co skłoniło mnie do rozważenia podejść bez nadzoru, aby lepiej wykorzystać nasze dość duże ilości nieoznaczonych danych. To naturalnie prowadzi do rozważenia stosowania ustawionych na sobie autoencoderów, co może być dobrym …
Miałem interesującą dyskusję na podstawie projektu, nad którym pracowaliśmy: po co używać systemu kontroli wizualnej CNN zamiast algorytmu dopasowywania szablonów? Tło: Pokazałem demo prostego systemu wizyjnego CNN (kamera internetowa + laptop), który wykrył, czy określony typ obiektu został „uszkodzony” / uszkodzony, czy nie - w tym przypadku płytka drukowana PCB. …
Obecnie pracuję nad odtworzeniem wyników tego artykułu . W artykule opisują metodę wykorzystania CNN do ekstrakcji cech i mają model akustyczny, który jest Dnn-hmm i wstępnie przeszkolony przy użyciu RBM. Sekcja III podsekcja A określa różne sposoby reprezentacji danych wejściowych. Zdecydowałem się na pionowe ułożenie wykresów widmowych w statycznym, delcie …
Czy opublikowano jakieś prace, które pokazują różnice w metodach regularyzacji sieci neuronowych, najlepiej w różnych domenach (lub przynajmniej w różnych zestawach danych)? Pytam, ponieważ obecnie mam wrażenie, że większość ludzi wydaje się używać tylko porzucenia w celu uregulowania widzenia komputerowego. Chciałbym sprawdzić, czy istnieje powód (nie) zastosowania różnych sposobów regularyzacji.
Próbuję trenować model w keras i używam ModelCheckpoint, aby zapisać najlepszy model zgodnie z monitorowaną miarą walidacji (w moim przypadku indeks Jaccard ). Chociaż widzę, że model poprawia się w tablicy tensorboard, to kiedy próbuję załadować ciężary i ocenić model, wcale nie działa. Ponadto po znaczniku czasu w pliku, w …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.