W przypadku pytań dotyczących sztucznych sieci, takich jak MLP, CNN, RNN, LSTM i GRU, ich warianty lub dowolne inne elementy systemu AI, które kwalifikują się jako sieci neuronowe, ponieważ są częściowo inspirowane biologicznymi sieciami neuronowymi.
Obecnie pracuję nad projektem, który polega na stworzeniu sztucznej inteligencji do gry Gomoku (to jak kółko i krzyżyk, ale grałem na planszy 15 * 15 i wymaga 5 z rzędu, aby wygrać). Udało mi się już zaimplementować idealną sztuczną inteligencję w kółko i krzyżyk, używając Q uczenia się i przechowując …
czy można podać ogólną zasadę dotyczącą wielkości sieci neuronowych, które można trenować na zwykłych procesorach graficznych klasy konsumenckiej ? Na przykład: Pojawienie lokomocji (wzmocnienie) papieru pociągi do sieci przez aktywację tanh neuronów. Mają trójwarstwowy NN z 300 200 100 jednostkami dla Planar Walker . Ale nie zgłaszają sprzętu i czasu …
Czytałem nowy artykuł Hintona „Dynamiczne kierowanie między kapsułkami” i nie rozumiałem pojęcia „wektor aktywności” w sposób abstrakcyjny. Kapsułka to grupa neuronów, których wektor aktywności reprezentuje parametry tworzenia określonego typu bytu, takiego jak obiekt lub część obiektu. Używamy długości wektora aktywności do reprezentowania prawdopodobieństwa istnienia istoty i jej orientacji do reprezentowania …
Wiele zasobów, o których wspomniałem, wspomina, że MSE jest świetny, ponieważ jest wypukły. Ale nie rozumiem jak, szczególnie w kontekście sieci neuronowych. Powiedzmy, że mamy następujące elementy: XXX: zestaw danych szkoleniowych YYY: cele ΘΘ\Theta: zestaw parametrów modelu fΘfΘf_\Theta (model sieci neuronowej z nieliniowościami) Następnie: MSE(Θ)=(fΘ(X)−Y)2MSE(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 Dlaczego …
Chciałbym trochę eksperymentować z ewolucją sieci neuronowej (NEAT). W latach 90. napisałem trochę kodu GA i sieci neuronowej w C ++ tylko dla zabawy, ale podejście do majsterkowania okazało się na tyle pracochłonne, że ostatecznie go porzuciłem. Od tego czasu wiele się zmieniło i istnieje wiele bardzo ładnych bibliotek i …
Czytałem, że głębokie sieci neuronowe można stosunkowo łatwo oszukać ( link ), aby dać duże zaufanie w rozpoznawaniu syntetycznych / sztucznych obrazów, które są całkowicie (lub przynajmniej w większości) poza przedmiotem zaufania. Osobiście nie widzę dużego problemu z tym, że DNN daje dużą pewność tym syntetycznym / sztucznym obrazom, ale …
Próbowałem więc zrozumieć sieci neuronowe, odkąd natknąłem się na blog Adama Geitgeya na temat uczenia maszynowego. Przeczytałem jak najwięcej na ten temat (który mogę zrozumieć) i wierzę, że rozumiem wszystkie ogólne pojęcia i niektóre działania (pomimo tego, że jestem bardzo słaby w matematyce), neurony, synapsy, wagi, funkcje kosztów, propagacja wsteczna …
DeepMind twierdzi, że ich głęboka sieć Q (DQN) była w stanie stale dostosowywać swoje zachowanie podczas nauki gry w 49 gier Atari. Po nauczeniu się wszystkich gier z tą samą siecią neuronową agent był w stanie grać wszystkie jednocześnie na „nadludzkich” poziomach (ilekroć był losowo prezentowany w jednej z gier), …
Jak duże sztuczne sieci neuronowe możemy teraz uruchomić (albo z pełnym cyklem pracy pociągu / pleców, albo po prostu oceniając wyjścia sieciowe), jeśli nasz całkowity budżet energetyczny do obliczeń jest równoważny budżetowi energii ludzkiego mózgu ( 12,6 wata )? Załóżmy jeden cykl na sekundę, który wydaje się mniej więcej odpowiadał …
I zostały aprowizacji w tensorflow zabaw . Jednym z zestawów danych wejściowych jest spirala. Bez względu na wybrane parametry wejściowe, bez względu na to, jak szeroką i głęboką wykonuję sieć neuronową, nie mogę dopasować się do spirali. Jak badacze danych dopasowują dane o tym kształcie?
Na stronie Wikipedii możemy przeczytać, że Google zbudował niestandardowy układ ASIC do uczenia maszynowego i dostosowany do TensorFlow, który pomaga przyspieszyć AI. Ponieważ układy scalone ASIC są specjalnie dostosowane do jednego konkretnego zastosowania bez możliwości zmiany jego obwodu, należy wywołać pewien ustalony algorytm. Jak dokładnie działa przyspieszenie AI za pomocą …
Sieć neuronowa to ukierunkowany wykres ważony. Mogą być reprezentowane przez (rzadką) macierz. Może to ujawnić niektóre eleganckie właściwości sieci. Czy ta technika jest korzystna do badania sieci neuronowych?
Czy autokoderów można używać do nadzorowanego uczenia się bez dodawania warstwy wyjściowej ? Czy możemy po prostu nakarmić go połączonym wektorem wejściowo-wyjściowym do treningu i zrekonstruować część wyjściową z części wejściowej podczas wnioskowania? Część wyjściowa byłaby traktowana jako brakująca wartość podczas wnioskowania i zastosowano by pewną imputację.
Deep Mind opublikował wiele prac dotyczących głębokiego uczenia się w ostatnich latach, większość z nich najnowocześniejszych w swoich zadaniach. Ale jak wiele z tych prac zostało faktycznie odtworzonych przez społeczność AI? Na przykład papier Neural Turing Machine wydaje się być bardzo trudny do odtworzenia, jak twierdzą inni badacze.
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.