Sztuczna inteligencja

Pytania i odpowiedzi dla osób zainteresowanych pytaniami koncepcyjnymi na temat życia i wyzwań w świecie, w którym funkcje "poznawcze" można naśladować w środowisku czysto cyfrowym


1
Czy warstwy głębokich sieci neuronowych można postrzegać jako sieci Hopfielda?
Sieci Hopfield są w stanie przechowywać wektor i wyszukiwać go, zaczynając od hałaśliwej wersji. Robią to, ustawiając ciężary, aby zminimalizować funkcję energii, gdy wszystkie neurony są ustawione na równe wartościom wektorów, i odzyskują wektor, używając jego hałaśliwej wersji jako danych wejściowych i pozwalając sieci osiąść na minimum energetycznym. Pomijając problemy, …

1
Strata gwałtownie skacze, gdy zmniejszam tempo uczenia się za pomocą optymalizatora Adama w PyTorch
Trenuję auto-encodersieć z Adamoptymalizatorem (z amsgrad=True) i MSE lossdla zadania Separacja źródła dźwięku jednokanałowego. Ilekroć zmniejszam współczynnik uczenia się czynnikowo, utrata sieci gwałtownie skacze, a następnie maleje aż do następnego spadku współczynnika uczenia się. Używam Pytorch do implementacji sieci i szkolenia. Following are my experimental setups: Setup-1: NO learning rate …

3
Jak sprawić, by moja sieć traktowała jednakowo rotację danych wejściowych?
Próbuję zaprogramować własny system do uruchamiania sieci neuronowej. Aby zmniejszyć liczbę potrzebnych węzłów, zasugerowano, aby traktować obroty wejścia jednakowo. Moja sieć stara się uczyć i przewidywać grę życia Conwaya, patrząc na każdy kwadrat i otaczające go kwadraty w siatce, i dając wynik dla tego kwadratu. Jego dane wejściowe to ciąg …

1
Jak zastosować gradienty polityki w przypadku wielu ciągłych działań?
Trusted Region Policy Optimization (TRPO) i Proximal Policy Optimization (PPO) to dwa najnowocześniejsze algorytmy gradientowe. Podczas korzystania z pojedynczego działania ciągłego normalnie użyłbyś pewnego rozkładu prawdopodobieństwa (na przykład Gaussa) dla funkcji straty. Wersja przybliżona to: L ( θ ) = log( P(za1) ) A ,L.(θ)=log⁡(P.(za1))ZA,L(\theta) = \log(P(a_1)) A, gdzie ZAZAA …

3
Po co uczyć tylko algorytmów wyszukiwania na krótkim wstępnym kursie sztucznej inteligencji?
Zrozumiałem, że koncepcja wyszukiwania jest ważna w AI. Na tej stronie internetowej jest pytanie dotyczące tego tematu, ale można również intuicyjnie zrozumieć, dlaczego. Miałem kurs wprowadzający na temat sztucznej inteligencji, który trwał przez pół semestru, więc oczywiście nie było czasu na omówienie wszystkich tematów sztucznej inteligencji, ale spodziewałem się nauczyć …





3
Czy osobliwość należy brać na poważnie?
Termin „Osobliwość” jest często używany w głównych mediach do opisu technologii wizjonerskiej. Został wprowadzony przez Ray Kurzweil w popularnej książce The Singularity Is Near: When Humans Transcend Biology (2005). W swojej książce Kurzweil przedstawia perspektywę potencjalnej przyszłości ludzkości, która obejmuje nanotechnologię, komputery, modyfikację genetyczną i sztuczną inteligencję. Twierdzi, że prawo …

5
Dlaczego potrzebujemy zdrowego rozsądku w AI?
Rozważmy ten przykład: To urodziny Johna, kupmy mu latawiec. My, ludzie, najprawdopodobniej powiedzieliby, że latawiec jest prezentem urodzinowym, gdyby zapytano go, dlaczego jest kupowany; i nazywamy to rozumowanie zdrowym rozsądkiem . Dlaczego potrzebujemy tego w sztucznie inteligentnych agentach? Myślę, że może to powodować mnóstwo problemów, ponieważ wiele naszych ludzkich błędów …

7
Jaka jest najbardziej ogólna definicja „inteligencji”?
Kiedy mówimy o sztucznej inteligencji, inteligencji ludzkiej lub jakiejkolwiek innej formie inteligencji, co rozumiemy przez pojęcie inteligencji w sensie ogólnym? Jak nazwałbyś inteligentny, a co nie? Innymi słowy, w jaki sposób definiujemy pojęcie inteligencji w najbardziej ogólny możliwy sposób?


1
Dlaczego połączona sieć neuronowa AlphaGo Zero jest bardziej wydajna niż dwie oddzielne sieci neuronowe?
AlphaGo Zero zawiera kilka ulepszeń w porównaniu do swoich poprzedników. Szczegóły architektoniczne Alpha Go Zero można zobaczyć w tym ściągu . Jednym z tych ulepszeń jest użycie jednej sieci neuronowej, która jednocześnie oblicza prawdopodobieństwo przesunięcia i wartość stanu, podczas gdy starsze wersje korzystały z dwóch oddzielnych sieci neuronowych. Wykazano, że …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.