Sztuczne sieci neuronowe (ANN) to szeroka klasa modeli obliczeniowych luźno opartych na biologicznych sieciach neuronowych. Obejmują one wyprzedzające NN (w tym „głębokie” NN), splotowe NN, nawracające NN itp.
Czytałem książkę Yoshua Bengio o głębokim uczeniu się i na stronie 224 napisano: Sieci splotowe to po prostu sieci neuronowe, które używają splotu zamiast ogólnego mnożenia macierzy w co najmniej jednej z ich warstw. nie byłem jednak w 100% pewien, jak „zastąpić mnożenie macierzy splotem” w matematycznie precyzyjnym sensie. To, …
Pracuję nad małym projektem, w którym staramy się przewidzieć ceny towarów (ropa, aluminium, cyna itp.) Na następne 6 miesięcy. Mam 12 takich zmiennych do przewidzenia i mam dane z kwietnia 2008 r. - maja 2013 r. Jak powinienem przejść do prognozowania? Zrobiłem następujące: Zaimportowane dane jako zestaw danych Timeseries Sezonowość …
Pulsacyjne lub impulsowe sieci neuronowe zawierają więcej dynamiki błonowej neuronów biologicznych, gdzie impulsy przenoszą informacje do następnej warstwy. Neurony niekoniecznie muszą „strzelać” jednocześnie, tak jak na przykład w backpropie. Wydaje się jednak, że istnieją przeszkody w stosowaniu tych modeli w przypadku problemów z uczeniem maszynowym. Jakie konkretne problemy stoją na …
Jaki powinien być stosunek liczby obserwacji do liczby zmiennych? Jak wykryć nadmierne dopasowanie w modelu sieci neuronowej i jakie są sposoby uniknięcia nadmiernego dopasowania? Jeśli chcę przeprowadzić klasyfikację za pomocą sieci neuronowej, czy klasy powinny mieć równą częstotliwość? Proszę pomóż mi.
Mam podstawową wiedzę na temat działania RNN (a zwłaszcza jednostek LSTM). Mam obrazowe wyobrażenie o architekturze jednostki LSTM, czyli komórki i kilku bramek, które regulują przepływ wartości. Jednak najwyraźniej nie do końca zrozumiałem, w jaki sposób LSTM rozwiązuje problem „znikania i eksplodowania gradientów”, który pojawia się podczas treningu, z wykorzystaniem …
Przechodzę przez kurs DeepAI Cousery (film 3 tygodnia 1 „Przegląd sieci neuronowych”), a Andrew Ng wyjaśnia, w jaki sposób każda warstwa w sieci neuronowej jest kolejną regresją logistyczną, ale nie wyjaśnia, w jaki sposób poprawia to dokładność. W jaki sposób w sieci dwuwarstwowej wielokrotne obliczanie logistyki czyni ją dokładniejszą?
Właśnie omówiłem Sztuczne sieci neuronowe na kursie Machine Learning Coursera i chciałbym poznać więcej teorii za nimi. Motywacja, którą naśladują biologię, jest dla mnie niezadowalająca. Na powierzchni wydaje się, że na każdym poziomie zastępujemy zmienne towarzyszące ich liniową kombinacją. Robiąc to wielokrotnie, pozwalamy na nieliniowe dopasowanie modelu. Nasuwa się pytanie: …
Kontynuuję pytanie, które zadałem wcześniej w sprawie KMS . Widzę wiele literatury, która je opisuje, ale żadna z nich nie mówi o regresji (nawet klasyfikacji z danymi oznaczonymi). Mam wrażenie, że jest on używany tylko do danych nieznakowanych. Czy są jakieś zasoby do obsługi regresji? Czy jest to tak proste, …
Na przykład chce się przewidzieć ceny domu i mieć dwie cechy wejściowe: długość i szerokość domu. Czasami jeden zawiera również „wielowymiarowe” funkcje wprowadzania, takie jak obszar, który ma długość * szerokość. 1) Po co uwzględniać funkcje pochodne? Czy sieć neuronowa nie powinna nauczyć się związku między długością, szerokością i ceną …
To pytanie ma już odpowiedzi tutaj : Algorytm propagacji wstecznej (2 odpowiedzi) Zamknięte 4 miesiące temu . Co to jest algorytm wstecznej propagacji i jak on działa?
Oto przykładowy kod keras, który go używa: from keras.constraints import max_norm model.add(Convolution2D(32, 3, 3, input_shape=(3, 32, 32), border_mode='same', activation='relu', kernel_constraint=max_norm(3)))
Studiowałem architekturę syjamskiej sieci neuronowej wprowadzonej przez Yanna LeCuna i jego współpracowników w 1994 r. Do rozpoznawania podpisów ( „Weryfikacja podpisu przy użyciu sieci neuronowej z opóźnieniem czasowym syjamskim” .pdf , NIPS 1994) Zrozumiałem ogólną ideę tej architektury, ale tak naprawdę nie rozumiem, jak działa backpropagacja w tym przypadku. Nie …
Kiedy ludzie mówią o sieciach neuronowych, co mają na myśli, mówiąc „rozmiar jądra”? Jądra są funkcjami podobieństwa, ale co to mówi o wielkości jądra?
Które problemy z sekwencyjnym wejściem są najbardziej odpowiednie dla każdego? Czy wymiar wejściowy określa, które z nich jest lepsze? Czy problemy wymagające „dłuższej pamięci” lepiej pasują do RNN LSTM, podczas gdy problemy z cyklicznymi wzorcami wprowadzania danych (giełda, pogoda) są łatwiejsze do rozwiązania przez HMM? Wygląda na to, że nakładają …
Czy możliwe jest uzyskanie ujemnych wag (po wystarczającej liczbie epok) dla głębokich splotowych sieci neuronowych, gdy używamy ReLU dla wszystkich warstw aktywacyjnych?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.