Pytania otagowane jako deep-learning

nowy obszar badań Machine Learning dotyczący technologii wykorzystywanych do uczenia się hierarchicznych reprezentacji danych, wykonywanych głównie w głębokich sieciach neuronowych (tj. sieciach z dwiema lub więcej ukrytymi warstwami), ale także z pewnymi probabilistycznymi modelami graficznymi.

3
Multi GPU w kamerach
W jaki sposób można zaprogramować w bibliotece keras (lub tensorflow) szkolenie partycjonowania na wielu GPU? Powiedzmy, że jesteś w instancji Amazon ec2, która ma 8 procesorów graficznych i chciałbyś wykorzystać je wszystkie, aby trenować szybciej, ale twój kod dotyczy tylko jednego procesora lub karty graficznej.

4
Intuicyjne wyjaśnienie utraty szumu (NCE)?
Czytam o NCE (forma próbkowania kandydata) z tych dwóch źródeł: Zapis Tensorflow Oryginalny papier Czy ktoś może mi pomóc w następujących kwestiach: Proste wyjaśnienie, w jaki sposób działa NCE (dla mnie powyższe było trudne do przeanalizowania i zrozumienia, więc coś intuicyjnego, które prowadzi do przedstawionej matematyki, byłoby świetne) Po punkcie …

1
Papier: jaka jest różnica między normalizacją warstw, normalizacją okresowej partii (2016) i normalizacją partii RNN (2015)?
Tak więc ostatnio jest papier do normalizacji warstw . Istnieje również jego implementacja w Keras. Ale pamiętam, że są artykuły zatytułowane Recurrent Batch Normalization (Cooijmans, 2016) i Batch Normalized Recurrent Neural Networks (Laurent, 2015). Jaka jest różnica między tymi trzema? Istnieje sekcja Powiązana praca, której nie rozumiem: Normalizacja partii została …




2
Czym jest Ground Truth
W kontekście uczenia maszynowego widziałem, że termin „ Prawda naziemna” jest często używany. Dużo szukałem i znalazłem następującą definicję w Wikipedii : W uczeniu maszynowym termin „podstawowa prawda” odnosi się do dokładności klasyfikacji zestawu szkoleniowego dla nadzorowanych technik uczenia się. Jest to wykorzystywane w modelach statystycznych do udowodnienia lub obalenia …

1
Dlaczego xgboost jest o wiele szybszy niż sklearn GradientBoostingClassifier?
Próbuję wytrenować model zwiększania gradientu na ponad 50 tysiącach przykładów ze 100 funkcjami numerycznymi. XGBClassifierobsługuje 500 drzew w ciągu 43 sekund na mojej maszynie, a GradientBoostingClassifierobsługuje tylko 10 drzew (!) w 1 minutę i 2 sekundy :( Nie zawracałem sobie głowy próbą wyhodowania 500 drzew, ponieważ zajmie to godziny. Używam …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
Wybór pomiędzy CPU a GPU do szkolenia sieci neuronowej
Widziałem dyskusje na temat „narzutu” GPU, a dla „małych” sieci trening może być szybszy na CPU (lub sieci CPU) niż na GPU. Co oznacza „mały”? Na przykład, czy jednowarstwowa MLP ze 100 ukrytymi jednostkami byłaby „mała”? Czy nasza definicja „małej” zmienia się dla architektur cyklicznych? Czy są jakieś inne kryteria, …

7
Czy są dostępne bezpłatne usługi chmurowe do szkolenia modeli uczenia maszynowego?
Chcę trenować głęboki model z dużą ilością danych treningowych, ale mój komputer nie ma takiej mocy, aby trenować tak głęboki model z tymi obfitymi danymi. Chciałbym wiedzieć, czy istnieją jakieś bezpłatne usługi w chmurze, które można wykorzystać do szkolenia uczenia maszynowego i modeli głębokiego uczenia? Chciałbym również wiedzieć, czy istnieje …

1
PyTorch vs. Tensorflow Fold
Zarówno PyTorch, jak i Tensorflow Fold są platformami do głębokiego uczenia się, przeznaczonymi do radzenia sobie w sytuacjach, w których dane wejściowe mają niejednorodną długość lub wymiary (to znaczy sytuacje, w których dynamiczne wykresy są przydatne lub potrzebne). Chciałbym wiedzieć, jak się porównują, w sensie paradygmatów, na których się opierają …

1
Jak Keras oblicza dokładność?
Jak Keras oblicza dokładność na podstawie prawdopodobieństw klasowych? Powiedzmy, na przykład, że mamy 100 próbek w zestawie testowym, które mogą należeć do jednej z dwóch klas. Mamy również listę klasowych probabilitów. Jakiego progu używa Keras do przypisania próbki do jednej z dwóch klas?



5
Jak ustawić liczbę neuronów i warstw w sieciach neuronowych
Jestem początkującym w sieciach neuronowych i miałem problem z uchwyceniem dwóch koncepcji: Jak decyduje się o liczbie warstw środkowych w danej sieci neuronowej? 1 vs. 10 lub cokolwiek innego. Jak decyduje się liczba neuronów w każdej środkowej warstwie? Czy zaleca się posiadanie jednakowej liczby neuronów w każdej środkowej warstwie, czy …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.