Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
Czy opublikowano jakieś prace, które pokazują różnice w metodach regularyzacji sieci neuronowych, najlepiej w różnych domenach (lub przynajmniej w różnych zestawach danych)? Pytam, ponieważ obecnie mam wrażenie, że większość ludzi wydaje się używać tylko porzucenia w celu uregulowania widzenia komputerowego. Chciałbym sprawdzić, czy istnieje powód (nie) zastosowania różnych sposobów regularyzacji.
W naszym ostatnim projekcie kursu z Data Science zaproponowaliśmy następujące- Daj opinie Amazon zestawu danych , planujemy wymyślić algorytm (to z grubsza na podstawie spersonalizowanej PageRank), który określa strategiczne położenie na umieszczanie reklam na Amazon. Na przykład w Amazon są miliony produktów. A zestaw danych daje wyobrażenie o tym, jakie …
Próbuję zrozumieć analizę sentymentów i sposób jej zastosowania w dowolnym języku (R, Python itp.). Chciałbym wiedzieć, czy w Internecie jest dobre miejsce na samouczek, który mogę śledzić. Poszukałem google, ale nie byłem bardzo zadowolony, ponieważ nie były to ćwiczenia, ale więcej teorii. Chcę teorii i przykładów praktycznych.
Mój zestaw danych składa się z sekwencji wektorowych. Każdy wektor ma 50 rzeczywistych wymiarów. Liczba wektorów w sekwencji wynosi od 3-5 do 10-15. Innymi słowy, długość sekwencji nie jest stała. Pewna spora liczba sekwencji (nie wektorów!) Jest opatrzona etykietą klasy. Moim zadaniem jest nauczyć się klasyfikatora, który ma sekwencję wektorów, …
Moje pytanie jest trzykrotne W kontekście „jądra” obsługują maszyny wektorowe Czy pożądany jest wybór zmiennych / cech - zwłaszcza, że regulujemy parametr C, aby zapobiec nadmiernemu dopasowaniu, a głównym motywem wprowadzenia jądra do SVM jest zwiększenie wymiarów problemu, w takim przypadku zmniejszenie wymiarów poprzez redukcję parametrów wydaje się sprzeczne z …
Ostatnio Google opublikował interesujący głęboki sen. Czy oprócz generowania sztuki, takiego jak http://deepdreamgenerator.com/ , widzisz jakieś potencjalne zastosowania głębokiego snu w wizji komputerowej lub uczeniu maszynowym?
Studiuję uczenie maszynowe i czuję, że istnieje silna zależność między koncepcją wymiaru VC a bardziej klasyczną (statystyczną) koncepcją stopni swobody. Czy ktoś może wyjaśnić takie połączenie?
Vowpal Wabbit (VW) najwyraźniej obsługuje funkcję znakowania sekwencji za pośrednictwem SEARN . Problem polega na tym, że nie mogę znaleźć nigdzie szczegółowej listy parametrów z objaśnieniami i przykładami. Najlepsze, co mogłem znaleźć, to wpis na blogu Zinkova z bardzo krótkim przykładem. Główną stronę wiki ledwo wspomina SEARN. W pobranym kodzie …
Jestem nowy w dziedzinie uczenia maszynowego, ale zrobiłem swój udział w przetwarzaniu sygnałów. Daj mi znać, jeśli to pytanie zostało błędnie oznaczone. Mam dwuwymiarowe dane, które są zdefiniowane przez co najmniej trzy zmienne, z wysoce nieliniowym modelem, który jest zbyt skomplikowany, aby symulować. Różniłem się sukcesem przy wydobywaniu dwóch głównych …
Problem Próbowałem używać naiwnych bayes na oznaczonym zbiorze danych dotyczących przestępczości, ale otrzymałem naprawdę słabe wyniki (7% dokładności). Naiwne Bayes działa znacznie szybciej niż inne alogorytmy, których używałem, więc chciałem spróbować dowiedzieć się, dlaczego wynik był tak niski. Badania Po przeczytaniu odkryłem, że bayes Naive powinien być używany ze zbalansowanymi …
Każda obserwacja w moich danych była zbierana z różnicą 0,1 sekundy. Nie nazywam go szeregiem czasowym, ponieważ nie ma on znacznika daty i godziny. W przykładach algorytmów grupowania (znalazłem online) i PCA przykładowe dane mają 1 obserwację na przypadek i nie są mierzone w czasie. Ale moje dane zawierają setki …
Uczę losowych modeli lasu w R, używając randomForest()1000 drzew i ramek danych z około 20 predyktorami i 600 000 wierszy. Na moim laptopie wszystko działa dobrze, ale kiedy przechodzę do Amazon EC2, aby uruchomić to samo, pojawia się błąd: Error: cannot allocate vector of size 5.4 Gb Execution halted Używam …
Chcę użyć Latent Dirichlet Allocation dla projektu i używam Pythona z biblioteką gensim. Po znalezieniu tematów chciałbym klastrować dokumenty za pomocą algorytmu takiego jak k-średnich (idealnie chciałbym użyć dobrego do nakładania się klastrów, więc wszelkie zalecenia są mile widziane). Udało mi się uzyskać tematy, ale mają one postać: 0,041 * …
Właśnie dowiedziałem się o regularyzacji jako podejściu do kontrolowania nadmiernego dopasowania i chciałbym włączyć ten pomysł do prostej implementacji propagacji wstecznej i perceptronu wielowarstwowego (MLP), które zestawiłem. Obecnie, aby uniknąć nadmiernego dopasowania, sprawdzam krzyżowo i utrzymuję sieć z najlepszym wynikiem do tej pory na zestawie sprawdzania poprawności. Działa to OK, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.