t-SNE, jak w [1], działa poprzez stopniowe zmniejszanie dywergencji Kullbacka-Leiblera (KL), aż do spełnienia pewnego warunku. Twórcy t-SNE sugerują wykorzystanie dywergencji KL jako kryterium wydajności dla wizualizacji: można porównać rozbieżności Kullbacka-Leiblera zgłoszone przez t-SNE. Dziesięć razy można uruchomić t-SNE i wybrać rozwiązanie o najniższej dywergencji KL [2] Próbowałem dwóch implementacji …
Jestem bardzo nowy w głębokim uczeniu się i jestem szczególnie zainteresowany wiedzą, czym są LSTM i BiLSTM i kiedy z nich korzystać (główne obszary zastosowań). Dlaczego LSTM i BILSTM są bardziej popularne niż RNN? Czy możemy wykorzystać te architektury głębokiego uczenia się do rozwiązywania problemów bez nadzoru?
Jestem trochę zdezorientowany różnicą między terminami „Machine Learning” i „Deep Learning”. Przejrzałem go i przeczytałem wiele artykułów, ale wciąż nie jest to dla mnie jasne. Znana definicja uczenia maszynowego przez Toma Mitchella to: Program komputerowy mówi się nauczyć z doświadczeń E w odniesieniu do pewnej klasy zadań T i zmierzyć …
Na poniższym wykresie oś x => Rozmiar zestawu danych oś y => Wynik weryfikacji krzyżowej Czerwona linia służy do danych treningowych Zielona linia służy do testowania danych W samouczku, o którym mówię, autor mówi, że punkt, w którym czerwona linia i zielona linia nachodzą na siebie, oznacza, Zebranie większej ilości …
Co dzieje się, gdy szkolimy podstawową maszynę wektorów nośnych (jądro liniowe i brak marginesu miękkiego) na danych nieliniowo rozdzielalnych? Problem optymalizacji jest niewykonalny, więc co powraca algorytm minimalizacji?
Jaki jest efekt NIE zmieniania ciężarów filtrów CNN podczas propagacji wstecznej? Zmieniłem tylko w pełni połączone wagi warstw podczas treningu w zbiorze danych MNIST i nadal osiągałem prawie 99 procent dokładności.
Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 5 lat temu . Wydaje się, że w większości języków dostępna jest pewna liczba naukowych bibliotek komputerowych. Python ma …
Obecnie uczę sieci neuronowej i nie mogę zdecydować, którego użyć, aby wdrożyć moje kryteria wczesnego zatrzymania: utratę walidacji lub mierniki takie jak dokładność / f1score / auc / cokolwiek obliczone na zestawie walidacyjnym. W swoich badaniach natknąłem się na artykuły broniące obu punktów widzenia. Wygląda na to, że Keras domyślnie …
Mam problem z klasyfikacją zarówno danych kategorycznych, jak i liczbowych. Problem, z którym się zmagam, polega na tym, że moje dane kategoryczne nie są naprawione, co oznacza, że nowy kandydat, którego etykietę chcę przewidzieć, może mieć nową kategorię, która nie była wcześniej obserwowana. Na przykład, jeśli moje dane kategoryczne sexbyłyby …
Z jakiegoś powodu AlphaGo Zero nie zyskuje tyle rozgłosu, co oryginalne AlphaGo, pomimo jego niesamowitych rezultatów. Zaczynając od zera, pokonał już AlphaGo Master i przeszedł wiele innych testów. Co jeszcze bardziej niewiarygodne, zrobiono to w 40 dni. Google określa go jako „prawdopodobnie najlepszy odtwarzacz Go na świecie” . DeepMind twierdzi, …
Jestem nowy w ML i TensorFlow (zacząłem kilka godzin temu) i próbuję go wykorzystać do przewidywania kolejnych punktów danych w szeregu czasowym. Biorę swój wkład i robię to przy tym: /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 …
Detale: GPU : GTX 1080 Szkolenie : ~ 1,1 miliona zdjęć należących do 10 klas Walidacja : ~ 150 tysięcy zdjęć należących do 10 klas Czas na epokę : ~ 10 godzin Skonfigurowałem CUDA, cuDNN i Tensorflow (również GPU Tensorflow). Nie sądzę, że mój model jest tak skomplikowany, że zajmuje …
Tło: Dopasowując sieci neuronowe z aktywacją relu, stwierdziłem, że czasami prognoza staje się prawie stała. Uważam, że jest to spowodowane umieraniem neuronów relu podczas treningu, jak stwierdzono tutaj. (Na czym polega problem „umierania ReLU” w sieciach neuronowych? ) Pytanie: Mam nadzieję zaimplementować kontrolę w samym kodzie, aby sprawdzić, czy neurony …
Zastanawiam się, jak interpretować architekturę cykliczną w kontekście EEG. W szczególności myślę o tym jako o Rekurencyjnym CNN (w przeciwieństwie do architektur takich jak LSTM), ale może dotyczy to również innych typów sieci rekurencyjnych Kiedy czytam o R-CNN, są one zwykle wyjaśniane w kontekście klasyfikacji obrazów. Zazwyczaj określa się je …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.