Pytania otagowane jako neural-networks

W przypadku pytań dotyczących sztucznych sieci, takich jak MLP, CNN, RNN, LSTM i GRU, ich warianty lub dowolne inne elementy systemu AI, które kwalifikują się jako sieci neuronowe, ponieważ są częściowo inspirowane biologicznymi sieciami neuronowymi.


3
Jaki rozmiar sieci neuronowych można wyszkolić na obecnych procesorach graficznych klasy konsumenckiej? (1060,1070,1080)
czy można podać ogólną zasadę dotyczącą wielkości sieci neuronowych, które można trenować na zwykłych procesorach graficznych klasy konsumenckiej ? Na przykład: Pojawienie lokomocji (wzmocnienie) papieru pociągi do sieci przez aktywację tanh neuronów. Mają trójwarstwowy NN z 300 200 100 jednostkami dla Planar Walker . Ale nie zgłaszają sprzętu i czasu …

2
Co to jest wektor aktywności w sieciach neuronowych?
Czytałem nowy artykuł Hintona „Dynamiczne kierowanie między kapsułkami” i nie rozumiałem pojęcia „wektor aktywności” w sposób abstrakcyjny. Kapsułka to grupa neuronów, których wektor aktywności reprezentuje parametry tworzenia określonego typu bytu, takiego jak obiekt lub część obiektu. Używamy długości wektora aktywności do reprezentowania prawdopodobieństwa istnienia istoty i jej orientacji do reprezentowania …

2
Czy błąd średniej kwadratowej jest zawsze wypukły w kontekście sieci neuronowych?
Wiele zasobów, o których wspomniałem, wspomina, że ​​MSE jest świetny, ponieważ jest wypukły. Ale nie rozumiem jak, szczególnie w kontekście sieci neuronowych. Powiedzmy, że mamy następujące elementy: XXX: zestaw danych szkoleniowych YYY: cele ΘΘ\Theta: zestaw parametrów modelu fΘfΘf_\Theta (model sieci neuronowej z nieliniowościami) Następnie: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 Dlaczego …



1
Jak dużym problemem jest biały szum dla rzeczywistego użycia DNN?
Czytałem, że głębokie sieci neuronowe można stosunkowo łatwo oszukać ( link ), aby dać duże zaufanie w rozpoznawaniu syntetycznych / sztucznych obrazów, które są całkowicie (lub przynajmniej w większości) poza przedmiotem zaufania. Osobiście nie widzę dużego problemu z tym, że DNN daje dużą pewność tym syntetycznym / sztucznym obrazom, ale …

1
Jak przekształcać dane wejściowe i uzyskiwać przydatne dane wyjściowe w sieci neuronowej?
Próbowałem więc zrozumieć sieci neuronowe, odkąd natknąłem się na blog Adama Geitgeya na temat uczenia maszynowego. Przeczytałem jak najwięcej na ten temat (który mogę zrozumieć) i wierzę, że rozumiem wszystkie ogólne pojęcia i niektóre działania (pomimo tego, że jestem bardzo słaby w matematyce), neurony, synapsy, wagi, funkcje kosztów, propagacja wsteczna …


2
Wydajność energetyczna ludzkiego mózgu a sieci neuronowe
Jak duże sztuczne sieci neuronowe możemy teraz uruchomić (albo z pełnym cyklem pracy pociągu / pleców, albo po prostu oceniając wyjścia sieciowe), jeśli nasz całkowity budżet energetyczny do obliczeń jest równoważny budżetowi energii ludzkiego mózgu ( 12,6 wata )? Załóżmy jeden cykl na sekundę, który wydaje się mniej więcej odpowiadał …


4
Jak działa ASIC w celu przyspieszenia AI?
Na stronie Wikipedii możemy przeczytać, że Google zbudował niestandardowy układ ASIC do uczenia maszynowego i dostosowany do TensorFlow, który pomaga przyspieszyć AI. Ponieważ układy scalone ASIC są specjalnie dostosowane do jednego konkretnego zastosowania bez możliwości zmiany jego obwodu, należy wywołać pewien ustalony algorytm. Jak dokładnie działa przyspieszenie AI za pomocą …


2
Czy można używać autokoderów do nauki nadzorowanej?
Czy autokoderów można używać do nadzorowanego uczenia się bez dodawania warstwy wyjściowej ? Czy możemy po prostu nakarmić go połączonym wektorem wejściowo-wyjściowym do treningu i zrekonstruować część wyjściową z części wejściowej podczas wnioskowania? Część wyjściowa byłaby traktowana jako brakująca wartość podczas wnioskowania i zastosowano by pewną imputację.


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.