Nauka danych

1

W tym cytowanym artykule autorzy przedstawiają następującą dyskusję na temat liczby parametrów masy. Nie jestem do końca jasne, dlaczego ma parametry . Myślę, że powinien to być ponieważ każdy z kanałów wejściowych ma ten sam filtr, który ma parametrów.49C249C249C^249C49C49CCCC494949

9 machine-learning deep-learning computer-vision

1

Czym różni się warstwa splotowa od zwykłej sieci splotowej?

Obecnie pracuję nad odtworzeniem wyników tego artykułu . W artykule opisują metodę wykorzystania CNN do ekstrakcji cech i mają model akustyczny, który jest Dnn-hmm i wstępnie przeszkolony przy użyciu RBM. Sekcja III podsekcja A określa różne sposoby reprezentacji danych wejściowych. Zdecydowałem się na pionowe ułożenie wykresów widmowych w statycznym, delcie …

9 neural-network convnet feature-extraction audio-recognition

3

Jak mogę ułatwić odczyt dużych macierzy zamieszania?

Niedawno opublikowałem zestaw danych ( link ) z 369 klasami. Przeprowadziłem na nich kilka eksperymentów, aby dowiedzieć się, jak trudne jest zadanie klasyfikacji. Zwykle podoba mi się to, jeśli istnieją macierze nieporozumień, aby zobaczyć rodzaj popełnionego błędu. Jednak369×369369×369369 \times 369 matryca nie jest praktyczna. Czy istnieje sposób na przekazanie ważnych …

9 visualization confusion-matrix

4

Interpretacja drzewa decyzyjnego w kontekście ważności operacji

Próbuję zrozumieć, jak w pełni zrozumieć proces decyzyjny modelu klasyfikacji drzewa decyzyjnego zbudowanego za pomocą sklearn. Dwa główne aspekty, na które patrzę, to reprezentacja drzewa grafviz oraz lista ważniejszych cech. To, czego nie rozumiem, to sposób, w jaki znaczenie funkcji jest określane w kontekście drzewa. Na przykład, oto moja lista …

9 machine-learning visualization scikit-learn data decision-trees

2

Dlaczego szybkość uczenia się powoduje, że waga mojej sieci neuronowej gwałtownie rośnie?

Używam tensorflow do pisania prostych sieci neuronowych w celu trochę badań i miałem wiele problemów z wagami „nan” podczas treningu. Próbowałem wielu różnych rozwiązań, takich jak zmiana optymalizatora, zmiana utraty, rozmiaru danych itp., Ale bezskutecznie. Wreszcie zauważyłem, że zmiana współczynnika uczenia się spowodowała niewiarygodną różnicę w moich wagach. Przy zastosowaniu …

9 machine-learning python tensorflow optimization gradient-descent

2

Cechy wektorów słownych w word2vec

Próbuję przeprowadzić analizę sentymentu. Aby przekonwertować słowa na wektory słów, używam modelu word2vec. Załóżmy, że mam wszystkie zdania na liście o nazwie „zdania” i przekazuję te zdania do word2vec w następujący sposób: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Ponieważ jestem nobem wektory słów, mam dwie wątpliwości. 1- …

9 machine-learning deep-learning word-embeddings word2vec sentiment-analysis

1

Jak podejść do konkurencji numer.ai z anonimowymi skalowanymi predyktorami liczbowymi?

Numer.ai istnieje już od jakiegoś czasu i wydaje się, że w Internecie jest niewiele postów lub innych dyskusji na ten temat. System zmieniał się od czasu do czasu, a dzisiejsza konfiguracja jest następująca: pociąg (N = 96K) i dane testowe (N = 33K) z 21 cechami o wartościach ciągłych w …

9 machine-learning deep-learning cross-validation preprocessing competitions

1

znaczenie cech losowego lasu i regresja liniowa są różne

Zastosował Lasso do oceny funkcji i uzyskał następujące wyniki: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Pamiętaj, że zestaw danych ma 3 etykiety. Ranking funkcji dla różnych etykiet jest taki sam. Następnie zastosował losowy las do tego samego zestawu danych: rank feature score =================================== …

9 feature-selection random-forest linear-regression

3

Wybór metody regularyzacji w sieciach neuronowych

Podczas szkolenia sieci neuronowych istnieją co najmniej 4 sposoby uregulowania sieci: Normalizacja L1 L2 Regulararyzacja Spadkowicz Normalizacja partii plus oczywiście inne rzeczy, takie jak dzielenie ciężaru i zmniejszanie liczby połączeń, co może nie być regularyzacją w ścisłym tego słowa znaczeniu. Ale jak wybrać jedną z tych metod regularyzacji? Czy istnieje …

9 neural-network regularization

3

Jakie, jeśli w ogóle, algorytmy uczenia maszynowego są akceptowane jako dobry kompromis między wyjaśnialnością a prognozowaniem?

Teksty uczenia maszynowego opisujące algorytmy, takie jak maszyny zwiększające gradient lub sieci neuronowe, często komentują, że modele te są dobre w przewidywaniu, ale dzieje się to kosztem utraty wyjaśnialności lub interpretacji. I odwrotnie, drzewa z pojedynczą decyzją i klasyczne modele regresji są oznaczone jako dobre w wyjaśnieniu, ale dają (względnie) …

9 machine-learning predictive-modeling

2

Zestawy danych porównawczych do wspólnego filtrowania

Chciałbym przetestować nowy algorytm wspólnego filtrowania . Typowym przypadkiem użycia jest polecanie filmów na podstawie preferencji użytkowników podobnych do konkretnego użytkownika. Jakie są typowe zestawy danych porównawczych, których naukowcy często używają do testowania swoich algorytmów? Wiem, że w ramach Computer Vision ludzie często używają MNIST lub CIFAR, ale nie znalazłem …

9 dataset recommender-system

3

Jaki silnik rekomendacji dla sytuacji, w której użytkownicy widzą tylko ułamek wszystkich elementów?

Chcę dodać funkcję rekomendacji do systemu zarządzania dokumentami . Jest to serwer, na którym przechowywana jest większość dokumentów firmowych. Pracownicy przeglądają interfejs sieciowy i klikają, aby pobrać (lub czytać online) żądane dokumenty. Każdy pracownik ma dostęp tylko do podzestawu wszystkich dokumentów: Mój cel : polecić pracownikowi dokumenty ostatnio otwarte przez …

9 machine-learning recommender-system

3

Eksportuj wagi (formuła) z Random Forest Regressor w Scikit-Learn

Przeszkoliłem model predykcyjny w Scikit Learn w Pythonie (Random Forest Regressor) i chcę w jakiś sposób wyodrębnić wagi każdej funkcji, aby stworzyć narzędzie Excel do ręcznego przewidywania. Jedyne, co znalazłem, model.feature_importances_to nie pomaga. Czy jest jakiś sposób na osiągnięcie tego? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest Regression''' from …

9 python predictive-modeling regression random-forest scikit-learn

1

Jaki jest związek między SVM a utratą zawiasów?

Mój kolega i ja staramy się obejść różnicę między regresją logistyczną a maszyną SVM. Najwyraźniej optymalizują różne funkcje celu. Czy SVM jest tak proste, jak stwierdzenie, że jest klasyfikatorem dyskryminującym, który po prostu optymalizuje utratę zawiasów? A może jest to bardziej skomplikowane? W jaki sposób wektory pomocnicze wchodzą w grę? …

9 svm logistic-regression hinge-loss

7

Biblioteka Python, która może obliczyć macierz nieporozumień do klasyfikacji wielu etykiet

Szukam biblioteki Pythona, która może obliczyć macierz nieporozumień do klasyfikacji wieloznakowej . FYI: scikit-learn nie obsługuje wielu etykiet dla macierzy pomieszania) Jaka jest różnica między Problemem Wieloklasowym a Multilabelowym

9 python software-recommendation multilabel-classification