Nauka danych

Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny


3
Jednoklasowa klasyfikacja dyskryminacyjna o niezrównoważonym, heterogenicznym tle negatywnym?
Pracuję nad ulepszeniem istniejącego nadzorowanego klasyfikatora, do klasyfikowania sekwencji {białka} jako należących do określonej klasy (prekursorów hormonu neuropeptydowego), czy nie. Istnieje około 1150 znanych „pozytywów” na tle około 13 milionów sekwencji białek („Nieznane / słabo opatrzone adnotacjami tło”) lub około 100 000 sprawdzonych, odpowiednich białek, opatrzonych różnorodnymi właściwościami (ale bardzo …

6
Jaki jest powód podjęcia logarytmicznej transformacji kilku zmiennych ciągłych?
Robiłem problem z klasyfikacją i przeczytałem kod wielu osób i samouczki. Jedną rzeczą, jaką zauważyłem jest to, że wiele osób podejmuje np.loglub logciągłej zmiennej jak loan_amounti applicant_incomeetc. Chcę tylko zrozumieć przyczynę tego. Czy pomaga to poprawić dokładność prognozowania naszego modelu? Czy to jest obowiązkowe? lub Czy kryje się za tym …

3
Jak uzyskać prognozy za pomocą prognozy_generatora na temat transmisji danych testowych w Keras?
Na blogu Keras o konwencjach szkoleniowych od zera kod pokazuje tylko sieć działającą na danych szkoleniowych i walidacyjnych. Co z danymi testowymi? Czy dane walidacyjne są takie same jak dane testowe (nie sądzę). Jeśli istniał oddzielny folder testowy na podobnych liniach jak folder pociągu i sprawdzania poprawności, w jaki sposób …

3
Jak przewidzieć prawdopodobieństwo w xgboost?
Poniższa funkcja przewidywania podaje również wartości -ve, więc nie może to być prawdopodobieństwo. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) I google i próbowałem, pred_s <- predict(bst, x_mat_s2,type="response") ale to nie działało. Pytanie …


1
propagacja wsteczna w CNN
Mam następujący CNN: Zaczynam od obrazu wejściowego o rozmiarze 5x5 Następnie stosuję splot za pomocą jądra 2x2 i stride = 1, który tworzy mapę cech o rozmiarze 4x4. Następnie stosuję maksymalne łączenie 2x2 z krokiem = 2, co zmniejsza mapę obiektów do rozmiaru 2x2. Następnie stosuję sigmoid logistyczny. Następnie jedna …

5
Wybór funkcji a ekstrakcja funkcji. Którego użyć, kiedy?
Wyodrębnianie funkcji i wybór funkcji zasadniczo zmniejszają wymiarowość danych, ale ekstrakcja funkcji sprawia, że ​​dane są bardziej rozdzielne, jeśli mam rację. Która technika byłaby lepsza od drugiej i kiedy? Myślałem, ponieważ ponieważ wybór funkcji nie modyfikuje oryginalnych danych i ich właściwości, zakładam, że użyjesz wyboru funkcji, gdy ważne jest, aby …

1
Metoda punktacji OOB RandomForestClassifier
Czy przypadkowa implementacja lasu w scikit-learn wykorzystuje średnią dokładność jako metodę punktacji do oszacowania błędu uogólnienia przy próbkach z worka? Nie jest to wspomniane w dokumentacji, ale metoda score () podaje średnią dokładność. Mam bardzo niezrównoważony zestaw danych i używam AUC ROC jako mojej metryki punktacji w wyszukiwaniu siatki. Czy …

3
Jak połączyć funkcje jakościowego i ciągłego wprowadzania danych do szkolenia w sieci neuronowej
Załóżmy, że mamy dwa rodzaje funkcji wprowadzania danych, kategoryczne i ciągłe. Dane kategoryczne mogą być reprezentowane jako jeden kod A, natomiast dane ciągłe to po prostu wektor B w przestrzeni N-wymiarowej. Wydaje się, że samo użycie concat (A, B) nie jest dobrym wyborem, ponieważ A, B to zupełnie różne rodzaje …


8
Jak nauczyć się sieci neuronowych?
Jestem studentem pierwszego roku (wspominając o tym, abyś mógł wybaczyć moją nieznajomość), który obecnie prowadzi badania z wykorzystaniem sieci neuronowych. Zakodowałem trójwęzłową sieć neuronową (która działa) na podstawie wskazówek mojego profesora. Chciałbym jednak kontynuować karierę w sztucznej inteligencji i nauce o danych i chciałbym dowiedzieć się więcej na ich temat. …


3
Jak dodać nową kategorię do modelu głębokiego uczenia się?
Powiedzmy, że wykonałem naukę transferu w sieci wstępnie przeszkolonej, aby rozpoznać 10 obiektów. Jak dodać jedenasty element, który sieć może sklasyfikować, nie tracąc wszystkich 10 kategorii, które już trenowałem, ani informacji z oryginalnego wstępnie wyszkolonego modelu? Znajomy powiedział mi, że trwają aktywne badania w tej dziedzinie, ale nie mogę znaleźć …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.