Pytania dotyczące implementacji algorytmów uczenia maszynowego. Ogólne pytania dotyczące uczenia maszynowego należy kierować do określonych społeczności.
Śledzę samouczek dotyczący podstaw uczenia maszynowego i jest wspomniane, że coś może być funkcją lub etykietą . Z tego, co wiem, cecha to właściwość używanych danych. Nie wiem, co to za etykieta, znam znaczenie tego słowa, ale chcę wiedzieć, co to znaczy w kontekście uczenia maszynowego.
Mam zainstalowany Keras z zapleczem Tensorflow i CUDA. Chciałbym czasami na żądanie zmusić Keras do korzystania z procesora. Czy można to zrobić bez, powiedzmy, instalowania oddzielnego Tensorflow z samym procesorem w środowisku wirtualnym? Jeśli tak to jak? Gdyby backendem był Theano, flagi można by ustawić, ale nie słyszałem o flagach …
Biorąc pod uwagę przykładowy kod . Chciałbym wiedzieć, jak zastosować obcinanie gradientu w tej sieci w sieci RNN, gdzie istnieje możliwość eksplozji gradientów. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) To jest przykład, który można wykorzystać, ale gdzie mam go wprowadzić? W obronie RNN lstm_cell = rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0) # Split data because rnn …
Mam przykład sieci neuronowej z dwiema warstwami. Pierwsza warstwa przyjmuje dwa argumenty i ma jedno wyjście. Drugi powinien przyjąć jeden argument jako wynik pierwszej warstwy i jeden dodatkowy argument. Powinien wyglądać tak: x1 x2 x3 \ / / y1 / \ / y2 Utworzyłem więc model z dwiema warstwami i …
Wiem, że istnieje wiele wyjaśnień, czym jest cross-entropia, ale nadal jestem zdezorientowany. Czy jest to tylko metoda opisania funkcji straty? Czy możemy użyć algorytmu gradientu, aby znaleźć minimum za pomocą funkcji straty?
Jaka jest różnica między iteracją polityki a iteracją wartości w uczeniu się przez wzmacnianie ? O ile rozumiem, w iteracji wartości używasz równania Bellmana do rozwiązania optymalnej polityki, podczas gdy w iteracji polityki wybierasz losowo politykę π i znajdujesz nagrodę za tę politykę. Wątpię, że jeśli wybierasz losową polisę π …
Śledziłem samouczek, który był dostępny w części 1 i części 2 . Niestety autor nie miał czasu na ostatnią sekcję, która polegała na wykorzystaniu podobieństwa cosinusowego, aby faktycznie znaleźć odległość między dwoma dokumentami. Podążałem za przykładami w artykule za pomocą poniższego linku ze stackoverflow , w zestawie jest kod wymieniony …
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat przepełnienia stosu. Zamknięte 7 lat temu . Popraw to pytanie Co to jest uczenie maszynowe ? Co robi kod uczenia maszynowego ? Kiedy mówimy, że maszyna się uczy, …
Uczę się różnych metod konwersji zmiennych kategorialnych na numeryczne dla klasyfikatorów uczenia maszynowego. Natknąłem się na tę pd.get_dummiesmetodę i sklearn.preprocessing.OneHotEncoder()chciałem zobaczyć, jak różnią się pod względem wydajności i użytkowania. Znalazłem poradnik, jak używać OneHotEncoder()na https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/ od sklearndokumentacja nie był zbyt pomocny w tej funkcji. Mam wrażenie, że nie robię tego …
W samouczku dla początkujących MNIST znajduje się oświadczenie accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) tf.cast zasadniczo zmienia typ tensora obiektu, ale jaka jest różnica między tf.reduce_mean i np.mean? Oto dokument dotyczący tf.reduce_mean: reduce_mean(input_tensor, reduction_indices=None, keep_dims=False, name=None) input_tensor: Tensor do zmniejszenia. Powinien mieć typ liczbowy. reduction_indices: Wymiary do zmniejszenia. Jeśli None(defaut), zmniejsza wszystkie …
Czytam poniższy artykuł i mam problem ze zrozumieniem koncepcji próbkowania ujemnego. http://arxiv.org/pdf/1402.3722v1.pdf Czy ktoś może pomóc, proszę?
Zauważyłem, że weight_regularizer nie jest już dostępny w Keras i że w jego miejsce pojawił się regulator aktywności i jądra . Chciałbym wiedzieć: Jakie są główne różnice między regulatorami jądra i aktywności ? Czy mogę użyć activity_regularizer zamiast weight_regularizer ?
Na slajdzie w ramach wykładu wprowadzającego na temat uczenia maszynowego, wygłoszonego przez Andrew Ng ze Stanforda w Coursera, przedstawia następujące jedno liniowe rozwiązanie problemu koktajlowego, biorąc pod uwagę, że źródła dźwięku są nagrywane przez dwa oddzielone przestrzennie mikrofony: [W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x'); U dołu slajdu znajduje się „źródło: Sam Roweis, Yair Weiss, Eero …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.