Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
W tym cytowanym artykule autorzy przedstawiają następującą dyskusję na temat liczby parametrów masy. Nie jestem do końca jasne, dlaczego ma parametry . Myślę, że powinien to być ponieważ każdy z kanałów wejściowych ma ten sam filtr, który ma parametrów.49C249C249C^249C49C49CCCC494949
Obecnie pracuję nad odtworzeniem wyników tego artykułu . W artykule opisują metodę wykorzystania CNN do ekstrakcji cech i mają model akustyczny, który jest Dnn-hmm i wstępnie przeszkolony przy użyciu RBM. Sekcja III podsekcja A określa różne sposoby reprezentacji danych wejściowych. Zdecydowałem się na pionowe ułożenie wykresów widmowych w statycznym, delcie …
Niedawno opublikowałem zestaw danych ( link ) z 369 klasami. Przeprowadziłem na nich kilka eksperymentów, aby dowiedzieć się, jak trudne jest zadanie klasyfikacji. Zwykle podoba mi się to, jeśli istnieją macierze nieporozumień, aby zobaczyć rodzaj popełnionego błędu. Jednak369×369369×369369 \times 369 matryca nie jest praktyczna. Czy istnieje sposób na przekazanie ważnych …
Próbuję zrozumieć, jak w pełni zrozumieć proces decyzyjny modelu klasyfikacji drzewa decyzyjnego zbudowanego za pomocą sklearn. Dwa główne aspekty, na które patrzę, to reprezentacja drzewa grafviz oraz lista ważniejszych cech. To, czego nie rozumiem, to sposób, w jaki znaczenie funkcji jest określane w kontekście drzewa. Na przykład, oto moja lista …
Używam tensorflow do pisania prostych sieci neuronowych w celu trochę badań i miałem wiele problemów z wagami „nan” podczas treningu. Próbowałem wielu różnych rozwiązań, takich jak zmiana optymalizatora, zmiana utraty, rozmiaru danych itp., Ale bezskutecznie. Wreszcie zauważyłem, że zmiana współczynnika uczenia się spowodowała niewiarygodną różnicę w moich wagach. Przy zastosowaniu …
Próbuję przeprowadzić analizę sentymentu. Aby przekonwertować słowa na wektory słów, używam modelu word2vec. Załóżmy, że mam wszystkie zdania na liście o nazwie „zdania” i przekazuję te zdania do word2vec w następujący sposób: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Ponieważ jestem nobem wektory słów, mam dwie wątpliwości. 1- …
Numer.ai istnieje już od jakiegoś czasu i wydaje się, że w Internecie jest niewiele postów lub innych dyskusji na ten temat. System zmieniał się od czasu do czasu, a dzisiejsza konfiguracja jest następująca: pociąg (N = 96K) i dane testowe (N = 33K) z 21 cechami o wartościach ciągłych w …
Zastosował Lasso do oceny funkcji i uzyskał następujące wyniki: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Pamiętaj, że zestaw danych ma 3 etykiety. Ranking funkcji dla różnych etykiet jest taki sam. Następnie zastosował losowy las do tego samego zestawu danych: rank feature score =================================== …
Podczas szkolenia sieci neuronowych istnieją co najmniej 4 sposoby uregulowania sieci: Normalizacja L1 L2 Regulararyzacja Spadkowicz Normalizacja partii plus oczywiście inne rzeczy, takie jak dzielenie ciężaru i zmniejszanie liczby połączeń, co może nie być regularyzacją w ścisłym tego słowa znaczeniu. Ale jak wybrać jedną z tych metod regularyzacji? Czy istnieje …
Teksty uczenia maszynowego opisujące algorytmy, takie jak maszyny zwiększające gradient lub sieci neuronowe, często komentują, że modele te są dobre w przewidywaniu, ale dzieje się to kosztem utraty wyjaśnialności lub interpretacji. I odwrotnie, drzewa z pojedynczą decyzją i klasyczne modele regresji są oznaczone jako dobre w wyjaśnieniu, ale dają (względnie) …
Chciałbym przetestować nowy algorytm wspólnego filtrowania . Typowym przypadkiem użycia jest polecanie filmów na podstawie preferencji użytkowników podobnych do konkretnego użytkownika. Jakie są typowe zestawy danych porównawczych, których naukowcy często używają do testowania swoich algorytmów? Wiem, że w ramach Computer Vision ludzie często używają MNIST lub CIFAR, ale nie znalazłem …
Chcę dodać funkcję rekomendacji do systemu zarządzania dokumentami . Jest to serwer, na którym przechowywana jest większość dokumentów firmowych. Pracownicy przeglądają interfejs sieciowy i klikają, aby pobrać (lub czytać online) żądane dokumenty. Każdy pracownik ma dostęp tylko do podzestawu wszystkich dokumentów: Mój cel : polecić pracownikowi dokumenty ostatnio otwarte przez …
Przeszkoliłem model predykcyjny w Scikit Learn w Pythonie (Random Forest Regressor) i chcę w jakiś sposób wyodrębnić wagi każdej funkcji, aby stworzyć narzędzie Excel do ręcznego przewidywania. Jedyne, co znalazłem, model.feature_importances_to nie pomaga. Czy jest jakiś sposób na osiągnięcie tego? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest Regression''' from …
Mój kolega i ja staramy się obejść różnicę między regresją logistyczną a maszyną SVM. Najwyraźniej optymalizują różne funkcje celu. Czy SVM jest tak proste, jak stwierdzenie, że jest klasyfikatorem dyskryminującym, który po prostu optymalizuje utratę zawiasów? A może jest to bardziej skomplikowane? W jaki sposób wektory pomocnicze wchodzą w grę? …
Szukam biblioteki Pythona, która może obliczyć macierz nieporozumień do klasyfikacji wieloznakowej . FYI: scikit-learn nie obsługuje wielu etykiet dla macierzy pomieszania) Jaka jest różnica między Problemem Wieloklasowym a Multilabelowym
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.