Buduję kategoryzator tekstowy dla krótkich zdań. Oprócz poinformowania użytkownika, że „kategoria wpisanego tekstu to C”, chcę móc wyjaśnić, dlaczego podjąłem tę decyzję, w krótki i zrozumiały sposób. Na przykład nie chcę powiedzieć użytkownikowi: „Umieściłem zdanie w złożonej trójwarstwowej sieci neuronowej i to jest odpowiedź, która uzyskała najlepszy wynik”; Chcę wyjaśnień, …
W pracy miałem za zadanie wnioskować o pewnych typach informacji o dynamicznym języku. Przepisuję sekwencje instrukcji na letwyrażenia zagnieżdżone , tak jak poniżej: return x; Z => x var x; Z => let x = undefined in Z x = y; Z => let x = y in Z if …
Główna idea k-Nearest-Neighbor uwzględnia najbliższych punktów i decyduje o klasyfikacji danych większością głosów. Jeśli tak, to nie powinno mieć problemów z danymi o wyższych wymiarach, ponieważ metody takie jak mieszanie wrażliwe na lokalizację mogą skutecznie znaleźć najbliższych sąsiadów.kkk Ponadto wybór funkcji w sieciach bayesowskich może zmniejszyć wymiar danych i ułatwić …
Biorąc pod uwagę dwa zbiory ciągów znaków nad alfabetem Σ , czy możemy obliczyć najmniejszy deterministyczny automat skończony (DFA) M taki, że A ⊆ L ( M ) i L ( M ) ⊆ Σ ∗ ∖ BA,BA,BA,BΣΣ\SigmaMMMA⊆L(M)A⊆L(M)A \subseteq L(M)L(M)⊆Σ∗∖BL(M)⊆Σ∗∖BL(M) \subseteq \Sigma^*\setminus B ? Innymi słowy, reprezentuje zestaw pozytywnych przykładów. …
Moim głównym zmartwieniem jest to, czy programowanie genetyczne jest aktywną dziedziną badań i ma obiecujące zastosowania w praktyce. Wydaje się, że w dziedzinie uczenia maszynowego sieci neuronowe są głównym hasłem, o których wspominają dziś główne wiadomości, ale nigdy nie słyszałem o podobnej „historii sukcesu” programowania genetycznego.
Wdrażam algorytm Naive Bayesa do kategoryzacji tekstu z wygładzaniem Laplaciana. Problem, który mam, polega na tym, że prawdopodobieństwo zbliża się do zera, ponieważ mnożę wiele małych ułamków. Dlatego prawdopodobieństwo ostatecznie daje zero. Jest tak, ponieważ w dokumentach i zestawach szkoleniowych znajduje się kilka słów. Z tego powodu nie jestem w …
Niedawno przeczytałem naprawdę ciekawy wpis na blogu Google Research Blog o sieci neuronowej. Zasadniczo wykorzystują te sieci neuronowe do rozwiązywania różnych problemów, takich jak rozpoznawanie obrazów. Używają algorytmów genetycznych do „ewolucji” ciężarów aksonów. Więc w zasadzie mój pomysł jest następujący. Gdybym miał napisać program, który rozpoznaje liczby, nie wiedziałbym, jak …
Uczę się klasyfikacji SVM i napotykam problem. Nie jestem pewien, czy ten dylemat ma na to terminologię. Załóżmy, że chcielibyśmy sklasyfikować pacjenta według SVM na podstawie próbek zdrowych osób (obu płci) i osób z rakiem wątroby (obu płci). Jeśli oznaczymy osoby zdrowe jako próbki klasy 1, a osoby z rakiem …
Ze względu na charakter pytania muszę podać wiele podstawowych informacji (ponieważ moje pytanie brzmi: jak to zawęzić?) To powiedziawszy, można je streścić (o ile wiem): Jakie metody istnieją, aby znaleźć lokalne optimum na bardzo dużych kombinatorycznych przestrzeniach poszukiwań? tło W społeczności superplay wspieranych narzędziami staramy się zapewnić specjalnie spreparowane (nie …
Zastrzeżenie: Jestem biologiem, więc przepraszam za (być może) podstawowe pytanie sformułowane w tak surowych terminach. Nie jestem pewien, czy powinienem zadać to pytanie tutaj, czy na DS / SC, ale CS jest największym z trzech, więc proszę. (Po tym, jak opublikowałem, przyszło mi do głowy, że Cross-Validated może być lepszym …
Na stronie wikipedia tutaj całkiem dobrze opisuje algorytm CDCL (i wydaje się, że zdjęcia zostały zrobione ze slajdów stworzonych przez Sharada Malika z Princeton). Jednak przy opisywaniu sposobu cofania wszystko mówi „do właściwego punktu”. MiniSAT wykorzystuje również wariant algorytmu CDCL, więc przeczytałem ten artykuł. Wydaje się, że mówią, że powinieneś …
Czy podczas aktualizacji wag sieci neuronowej za pomocą algorytmu propagacji wsteczne z terminem pędu należy zastosować szybkość uczenia się również do terminu pędu? Większość informacji, które mogłem znaleźć na temat używania pędu, ma równania wyglądające mniej więcej tak: W′i=Wi−αΔWi+μΔWi−1Wi′=Wi−αΔWi+μΔWi−1W_{i}' = W_{i} - \alpha \Delta W_i + \mu \Delta W_{i-1} gdzie …
Uczyłem się o sieciach neuronowych i SVM. Samouczki, które przeczytałem, podkreślają, jak ważne jest jądro dla SVM. Bez funkcji jądra maszyny SVM są tylko liniowym klasyfikatorem. Dzięki kernelizacji SVM mogą również zawierać funkcje nieliniowe, co czyni je bardziej zaawansowanym klasyfikatorem. Wydaje mi się, że można również zastosować jądro do sieci …
Dlaczego początkowe wagi sieci neuronowych są inicjowane jako liczby losowe? Czytałem gdzieś, że ma to na celu „przełamanie symetrii”, a to przyspiesza naukę sieci neuronowej. W jaki sposób przełamanie symetrii sprawia, że uczy się szybciej? Czy zainicjowanie wag na 0 nie byłoby lepszym pomysłem? W ten sposób wagi będą mogły …
Badam uczenie się PAC (teorii uczenia obliczeniowego) jako początkujący bez wcześniejszej wiedzy o uczeniu maszynowym / sztucznej inteligencji. Model badam głównie z historycznego punktu widzenia. W tym celu najważniejsze są oczywiście wyniki oparte na modelu. Istnieje wystarczająco dużo dokumentów, które dokumentują te wyniki. Ale chcę też napisać coś o tym, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.