Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
Zastanawiam się, czy istnieje scenariusz, w którym zejście gradientu nie jest zbieżne do minimum. Zdaję sobie sprawę, że nie zawsze gwarantuje się, że zejście gradientu zbliży się do globalnego optimum. Wiem również, że może różnić się od optymalnego, jeśli powiedzmy, że stopień jest zbyt duży. Wydaje mi się jednak, że …
Dość nowy w Pythonie, ale budowanie mojego pierwszego modelu RF na podstawie niektórych danych klasyfikacyjnych. Przekształciłem wszystkie etykiety w dane liczbowe int64 i załadowałem do X i Y jako tablicę numpy, ale próbuję wyszkolić modele, popełniam błąd. Oto jak wyglądają moje tablice: >>> X = np.array([[df.tran_cityname, df.tran_signupos, df.tran_signupchannel, df.tran_vmake, df.tran_vmodel, …
Jestem nowy w pytorch i zacząłem z tym kodem github. Nie rozumiem komentarza w wierszu 60–61 w kodzie "because weights have requires_grad=True, but we don't need to track this in autograd". Zrozumiałem, że wspominamy requires_grad=Trueo zmiennych, które musimy obliczyć gradienty przy użyciu autograd, ale co to znaczy być "tracked by …
Które są lepsze dla dokładności, czy są takie same? Oczywiście, jeśli używasz categorical_crossentropy, używasz jednego gorącego kodowania, a jeśli używasz sparse_categorical_crossentropy, kodujesz jako normalne liczby całkowite. Dodatkowo, kiedy jedno jest lepsze od drugiego?
Kiedyś stosowałem walidację krzyżową K-fold do solidnej oceny moich modeli uczenia maszynowego. Ale jestem świadomy istnienia metody ładowania również w tym celu. Nie widzę jednak głównej różnicy między nimi pod względem oceny wydajności. Z tego, co widzę, ładowanie początkowe generuje również pewną liczbę losowych podzbiorów treningu + testowania (choć w …
Podczas czytania tego artykułu pojawia się wiersz „klasyfikatory liniowe nie dzielą parametrów między cechami i klasami”. Jakie jest znaczenie tego stwierdzenia? Czy to oznacza, że klasyfikatory liniowe, takie jak regresja logistyczna, potrzebują cech, które są od siebie niezależne?
Biorąc pod uwagę zdanie: „Kiedy otworzę drzwi ?? , zacznie się automatycznie nagrzewać” Chciałbym uzyskać listę możliwych słów w? z prawdopodobieństwem. Podstawową koncepcją stosowaną w modelu word2vec jest „przewidywanie” słowa na podstawie otaczającego kontekstu. Po zbudowaniu modelu, jaka jest właściwa operacja wektorów kontekstowych, aby wykonać moje zadanie przewidywania nowych zdań? …
W przetwarzaniu obrazów medycznych większość opublikowanych prac stara się zmniejszyć współczynnik fałszywie dodatnich wyników (FPR), podczas gdy w rzeczywistości fałszywe negatywy są bardziej niebezpieczne niż fałszywie pozytywne. Jakie jest uzasadnienie tego?
Keras obsługuje zarówno TensorFlow i Theano jako backend: jakie są plusy / minusy wybierając jedną versus inne, oprócz faktu, że obecnie nie wszystkie operacje są realizowane przy backend TensorFlow?
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było na temat wymiany danych stosu nauki. Zamknięte 5 lat temu . Jestem studentem MSc na uniwersytecie w Edynburgu, specjalizującym się w uczeniu maszynowym i przetwarzaniu języka naturalnego. Miałem kilka praktycznych …
To podobne pytanie jak pytanie dotyczące konferencji statystycznych w CrossValidated Jakie są najważniejsze doroczne konferencje Data Science? Zasady: Dołącz link do konferencji Dołącz linki do rozmów (czy to na youtube, na stronie konferencji lub w innej witrynie do przesyłania strumieniowego wideo)
Jak najlepiej ustalić semantyczne podobieństwo słów? Word2Vec jest w porządku, ale nie idealny: # Using the 840B word Common Crawl GloVe vectors with gensim: # 'hot' is closer to 'cold' than 'warm' In [7]: model.similarity('hot', 'cold') Out[7]: 0.59720456121072973 In [8]: model.similarity('hot', 'warm') Out[8]: 0.56784095376659627 # Cold is much closer to …
Być może jest to zbyt ogólne, ale szukam referencji na temat korzystania z głębokiego uczenia się w zadaniu podsumowywania tekstu. Wdrożyłem już podsumowanie tekstu przy użyciu standardowych podejść do częstotliwości słów i rankingu zdań, ale chciałbym zbadać możliwość zastosowania technik głębokiego uczenia się do tego zadania. Przeszedłem również kilka implementacji …
Znam różnicę między klastrowaniem a klasyfikacją w uczeniu maszynowym, ale nie rozumiem różnicy między klasyfikacją tekstu a modelowaniem tematów dla dokumentów. Czy mogę używać modelowania tematów do dokumentów, aby zidentyfikować temat? Czy mogę używać metod klasyfikacji do klasyfikowania tekstu w tych dokumentach?
Jestem trochę zagubiony w wyborze pomiędzy Keras (keras-team / keras) i tf.keras (tensorflow / tensorflow / python / keras /) dla mojego nowego projektu badawczego. Toczy się debata, w której Keras nie jest własnością nikogo, więc ludzie chętniej się do tego przyczyniają, a zarządzanie projektem będzie znacznie łatwiejsze w przyszłości. …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.