Nauka danych

2

Czy istnieją badania, które badają przerwanie leczenia w porównaniu z innymi regularyzacjami?

Czy opublikowano jakieś prace, które pokazują różnice w metodach regularyzacji sieci neuronowych, najlepiej w różnych domenach (lub przynajmniej w różnych zestawach danych)? Pytam, ponieważ obecnie mam wrażenie, że większość ludzi wydaje się używać tylko porzucenia w celu uregulowania widzenia komputerowego. Chciałbym sprawdzić, czy istnieje powód (nie) zastosowania różnych sposobów regularyzacji.

9 neural-network computer-vision convnet regularization dropout

2

Jak modelować zachowania zakupowe użytkownika w Amazon?

W naszym ostatnim projekcie kursu z Data Science zaproponowaliśmy następujące- Daj opinie Amazon zestawu danych , planujemy wymyślić algorytm (to z grubsza na podstawie spersonalizowanej PageRank), który określa strategiczne położenie na umieszczanie reklam na Amazon. Na przykład w Amazon są miliony produktów. A zestaw danych daje wyobrażenie o tym, jakie …

9 machine-learning data-mining dataset recommender-system

3

Samouczek analizy sentymentów

Próbuję zrozumieć analizę sentymentów i sposób jej zastosowania w dowolnym języku (R, Python itp.). Chciałbym wiedzieć, czy w Internecie jest dobre miejsce na samouczek, który mogę śledzić. Poszukałem google, ale nie byłem bardzo zadowolony, ponieważ nie były to ćwiczenia, ale więcej teorii. Chcę teorii i przykładów praktycznych.

9 machine-learning reference-request sentiment-analysis

2

Klasyfikacja sekwencji wektorowych

Mój zestaw danych składa się z sekwencji wektorowych. Każdy wektor ma 50 rzeczywistych wymiarów. Liczba wektorów w sekwencji wynosi od 3-5 do 10-15. Innymi słowy, długość sekwencji nie jest stała. Pewna spora liczba sekwencji (nie wektorów!) Jest opatrzona etykietą klasy. Moim zadaniem jest nauczyć się klasyfikatora, który ma sekwencję wektorów, …

9 classification sequence

1

Jak binarnie kodować wielowartościową zmienną kategorialną z ramki danych Pandas?

Załóżmy, że mamy następującą ramkę danych z wieloma wartościami dla pewnej kolumny: categories 0 - ["A", "B"] 1 - ["B", "C", "D"] 2 - ["B", "D"] Jak możemy uzyskać taki stół? "A" "B" "C" "D" 0 - 1 1 0 0 1 - 0 1 1 1 2 - 0 …

9 python pandas

1

Wybór funkcji dla maszyn wektorowych wsparcia

Moje pytanie jest trzykrotne W kontekście „jądra” obsługują maszyny wektorowe Czy pożądany jest wybór zmiennych / cech - zwłaszcza, że regulujemy parametr C, aby zapobiec nadmiernemu dopasowaniu, a głównym motywem wprowadzenia jądra do SVM jest zwiększenie wymiarów problemu, w takim przypadku zmniejszenie wymiarów poprzez redukcję parametrów wydaje się sprzeczne z …

9 svm feature-selection scikit-learn

5

Masz pomysł na zastosowanie głębokiego snu?

Ostatnio Google opublikował interesujący głęboki sen. Czy oprócz generowania sztuki, takiego jak http://deepdreamgenerator.com/ , widzisz jakieś potencjalne zastosowania głębokiego snu w wizji komputerowej lub uczeniu maszynowym?

9 machine-learning deep-learning

2

Zależność między wymiarem VC a stopniami swobody

Studiuję uczenie maszynowe i czuję, że istnieje silna zależność między koncepcją wymiaru VC a bardziej klasyczną (statystyczną) koncepcją stopni swobody. Czy ktoś może wyjaśnić takie połączenie?

9 machine-learning self-study

1

Korzystanie z Vowpal Wabbit dla NER

Vowpal Wabbit (VW) najwyraźniej obsługuje funkcję znakowania sekwencji za pośrednictwem SEARN . Problem polega na tym, że nie mogę znaleźć nigdzie szczegółowej listy parametrów z objaśnieniami i przykładami. Najlepsze, co mogłem znaleźć, to wpis na blogu Zinkova z bardzo krótkim przykładem. Główną stronę wiki ledwo wspomina SEARN. W pobranym kodzie …

9 machine-learning nlp

2

Czy istnieje metoda przeciwna redukcji wymiarów?

Jestem nowy w dziedzinie uczenia maszynowego, ale zrobiłem swój udział w przetwarzaniu sygnałów. Daj mi znać, jeśli to pytanie zostało błędnie oznaczone. Mam dwuwymiarowe dane, które są zdefiniowane przez co najmniej trzy zmienne, z wysoce nieliniowym modelem, który jest zbyt skomplikowany, aby symulować. Różniłem się sukcesem przy wydobywaniu dwóch głównych …

9 machine-learning scikit-learn

2

Wdrażanie uzupełniających naiwnych Bayesa w pythonie?

Problem Próbowałem używać naiwnych bayes na oznaczonym zbiorze danych dotyczących przestępczości, ale otrzymałem naprawdę słabe wyniki (7% dokładności). Naiwne Bayes działa znacznie szybciej niż inne alogorytmy, których używałem, więc chciałem spróbować dowiedzieć się, dlaczego wynik był tak niski. Badania Po przeczytaniu odkryłem, że bayes Naive powinien być używany ze zbalansowanymi …

9 machine-learning classification python naive-bayes-classifier

1

Czy istnieją jakieś nienadzorowane algorytmy uczenia się danych sekwencyjnych?

Każda obserwacja w moich danych była zbierana z różnicą 0,1 sekundy. Nie nazywam go szeregiem czasowym, ponieważ nie ma on znacznika daty i godziny. W przykładach algorytmów grupowania (znalazłem online) i PCA przykładowe dane mają 1 obserwację na przypadek i nie są mierzone w czasie. Ale moje dane zawierają setki …

9 algorithms

3

R losowy las na Amazon ec2 Błąd: nie można przydzielić wektora o rozmiarze 5,4 Gb

Uczę losowych modeli lasu w R, używając randomForest()1000 drzew i ramek danych z około 20 predyktorami i 600 000 wierszy. Na moim laptopie wszystko działa dobrze, ale kiedy przechodzę do Amazon EC2, aby uruchomić to samo, pojawia się błąd: Error: cannot allocate vector of size 5.4 Gb Execution halted Używam …

9 r random-forest

2

Grupowanie dokumentów przy użyciu tematów pochodzących z Latent Dirichlet Allocation

Chcę użyć Latent Dirichlet Allocation dla projektu i używam Pythona z biblioteką gensim. Po znalezieniu tematów chciałbym klastrować dokumenty za pomocą algorytmu takiego jak k-średnich (idealnie chciałbym użyć dobrego do nakładania się klastrów, więc wszelkie zalecenia są mile widziane). Udało mi się uzyskać tematy, ale mają one postać: 0,041 * …

9 python clustering lda

2

Jakieś różnice w regularyzacji MLP między aktualizacjami wsadowymi i indywidualnymi?

Właśnie dowiedziałem się o regularyzacji jako podejściu do kontrolowania nadmiernego dopasowania i chciałbym włączyć ten pomysł do prostej implementacji propagacji wstecznej i perceptronu wielowarstwowego (MLP), które zestawiłem. Obecnie, aby uniknąć nadmiernego dopasowania, sprawdzam krzyżowo i utrzymuję sieć z najlepszym wynikiem do tej pory na zestawie sprawdzania poprawności. Działa to OK, …

9 neural-network