Nauka danych

Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny

1
liczba parametrów warstw splotu
W tym cytowanym artykule autorzy przedstawiają następującą dyskusję na temat liczby parametrów masy. Nie jestem do końca jasne, dlaczego ma parametry . Myślę, że powinien to być ponieważ każdy z kanałów wejściowych ma ten sam filtr, który ma parametrów.49C249C249C^249C49C49CCCC494949

1
Czym różni się warstwa splotowa od zwykłej sieci splotowej?
Obecnie pracuję nad odtworzeniem wyników tego artykułu . W artykule opisują metodę wykorzystania CNN do ekstrakcji cech i mają model akustyczny, który jest Dnn-hmm i wstępnie przeszkolony przy użyciu RBM. Sekcja III podsekcja A określa różne sposoby reprezentacji danych wejściowych. Zdecydowałem się na pionowe ułożenie wykresów widmowych w statycznym, delcie …

3
Jak mogę ułatwić odczyt dużych macierzy zamieszania?
Niedawno opublikowałem zestaw danych ( link ) z 369 klasami. Przeprowadziłem na nich kilka eksperymentów, aby dowiedzieć się, jak trudne jest zadanie klasyfikacji. Zwykle podoba mi się to, jeśli istnieją macierze nieporozumień, aby zobaczyć rodzaj popełnionego błędu. Jednak369×369369×369369 \times 369 matryca nie jest praktyczna. Czy istnieje sposób na przekazanie ważnych …

4
Interpretacja drzewa decyzyjnego w kontekście ważności operacji
Próbuję zrozumieć, jak w pełni zrozumieć proces decyzyjny modelu klasyfikacji drzewa decyzyjnego zbudowanego za pomocą sklearn. Dwa główne aspekty, na które patrzę, to reprezentacja drzewa grafviz oraz lista ważniejszych cech. To, czego nie rozumiem, to sposób, w jaki znaczenie funkcji jest określane w kontekście drzewa. Na przykład, oto moja lista …

2
Dlaczego szybkość uczenia się powoduje, że waga mojej sieci neuronowej gwałtownie rośnie?
Używam tensorflow do pisania prostych sieci neuronowych w celu trochę badań i miałem wiele problemów z wagami „nan” podczas treningu. Próbowałem wielu różnych rozwiązań, takich jak zmiana optymalizatora, zmiana utraty, rozmiaru danych itp., Ale bezskutecznie. Wreszcie zauważyłem, że zmiana współczynnika uczenia się spowodowała niewiarygodną różnicę w moich wagach. Przy zastosowaniu …

2
Cechy wektorów słownych w word2vec
Próbuję przeprowadzić analizę sentymentu. Aby przekonwertować słowa na wektory słów, używam modelu word2vec. Załóżmy, że mam wszystkie zdania na liście o nazwie „zdania” i przekazuję te zdania do word2vec w następujący sposób: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Ponieważ jestem nobem wektory słów, mam dwie wątpliwości. 1- …


1
znaczenie cech losowego lasu i regresja liniowa są różne
Zastosował Lasso do oceny funkcji i uzyskał następujące wyniki: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Pamiętaj, że zestaw danych ma 3 etykiety. Ranking funkcji dla różnych etykiet jest taki sam. Następnie zastosował losowy las do tego samego zestawu danych: rank feature score =================================== …

3
Wybór metody regularyzacji w sieciach neuronowych
Podczas szkolenia sieci neuronowych istnieją co najmniej 4 sposoby uregulowania sieci: Normalizacja L1 L2 Regulararyzacja Spadkowicz Normalizacja partii plus oczywiście inne rzeczy, takie jak dzielenie ciężaru i zmniejszanie liczby połączeń, co może nie być regularyzacją w ścisłym tego słowa znaczeniu. Ale jak wybrać jedną z tych metod regularyzacji? Czy istnieje …

3
Jakie, jeśli w ogóle, algorytmy uczenia maszynowego są akceptowane jako dobry kompromis między wyjaśnialnością a prognozowaniem?
Teksty uczenia maszynowego opisujące algorytmy, takie jak maszyny zwiększające gradient lub sieci neuronowe, często komentują, że modele te są dobre w przewidywaniu, ale dzieje się to kosztem utraty wyjaśnialności lub interpretacji. I odwrotnie, drzewa z pojedynczą decyzją i klasyczne modele regresji są oznaczone jako dobre w wyjaśnieniu, ale dają (względnie) …

2
Zestawy danych porównawczych do wspólnego filtrowania
Chciałbym przetestować nowy algorytm wspólnego filtrowania . Typowym przypadkiem użycia jest polecanie filmów na podstawie preferencji użytkowników podobnych do konkretnego użytkownika. Jakie są typowe zestawy danych porównawczych, których naukowcy często używają do testowania swoich algorytmów? Wiem, że w ramach Computer Vision ludzie często używają MNIST lub CIFAR, ale nie znalazłem …

3
Jaki silnik rekomendacji dla sytuacji, w której użytkownicy widzą tylko ułamek wszystkich elementów?
Chcę dodać funkcję rekomendacji do systemu zarządzania dokumentami . Jest to serwer, na którym przechowywana jest większość dokumentów firmowych. Pracownicy przeglądają interfejs sieciowy i klikają, aby pobrać (lub czytać online) żądane dokumenty. Każdy pracownik ma dostęp tylko do podzestawu wszystkich dokumentów: Mój cel : polecić pracownikowi dokumenty ostatnio otwarte przez …

3
Eksportuj wagi (formuła) z Random Forest Regressor w Scikit-Learn
Przeszkoliłem model predykcyjny w Scikit Learn w Pythonie (Random Forest Regressor) i chcę w jakiś sposób wyodrębnić wagi każdej funkcji, aby stworzyć narzędzie Excel do ręcznego przewidywania. Jedyne, co znalazłem, model.feature_importances_to nie pomaga. Czy jest jakiś sposób na osiągnięcie tego? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest Regression''' from …

1
Jaki jest związek między SVM a utratą zawiasów?
Mój kolega i ja staramy się obejść różnicę między regresją logistyczną a maszyną SVM. Najwyraźniej optymalizują różne funkcje celu. Czy SVM jest tak proste, jak stwierdzenie, że jest klasyfikatorem dyskryminującym, który po prostu optymalizuje utratę zawiasów? A może jest to bardziej skomplikowane? W jaki sposób wektory pomocnicze wchodzą w grę? …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.