Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
Czy istnieje kompleksowy pakiet open source (najlepiej w Pythonie lub R), który może być wykorzystywany do wykrywania anomalii w szeregach czasowych? W scikit-learn znajduje się pakiet SVM jednej klasy, ale nie dotyczy on danych szeregów czasowych. Szukam bardziej wyrafinowanych pakietów, które na przykład wykorzystują sieci bayesowskie do wykrywania anomalii.
Czy ktoś może napisać prosty przykład Keras wykorzystujący wywołanie zwrotne, aby zapisać model po każdej epoce? Potrafię znaleźć przykłady oszczędzania ciężarów, ale chcę móc zapisać w pełni funkcjonujący model po każdej epoce treningowej.
Jak mogę uzyskać liczbę brakujących wartości w każdym wierszu w ramce danych Pandas. Chciałbym podzielić ramkę danych na różne ramki danych, które mają taką samą liczbę brakujących wartości w każdym wierszu. Jakieś sugestie?
Buduję przepływ pracy do tworzenia modeli uczenia maszynowego (w moim przypadku przy użyciu Pythona pandasi sklearnpakietów) z danych pobranych z bardzo dużej bazy danych (tutaj, Vertica za pomocą SQL i pyodbc), a kluczowym krokiem w tym procesie jest przypisywanie braku wartości predyktorów. Jest to proste w obrębie pojedynczej platformy analitycznej …
Wiem, że keras służy jako interfejs wysokiego poziomu dla TensorFlow. Wydaje mi się jednak, że keras może samodzielnie wykonywać wiele funkcji (wprowadzanie danych, tworzenie modeli, szkolenie, ocena). Co więcej, niektóre funkcje TensorFlow mogą być przeniesione bezpośrednio do keras (np. W keras można użyć funkcji metrycznej tf lub utraty). Moje pytanie …
Przeglądałem artykuł o blogach Kaggle. Wielokrotnie autor wymienia „wynik LB” i „dopasowanie LB”) jako miernik skuteczności uczenia maszynowego (wraz z wynikiem weryfikacji krzyżowej (CV)). Badając znaczenie „LB” spędziłem sporo czasu, zdałem sobie sprawę, że ogólnie ludzie nazywają go bezpośrednio LB bez większego tła. Więc moje pytanie brzmi - co to …
Zaczynam się uczyć uczenia maszynowego ze strony internetowej Tensorflow. Rozwinąłem bardzo podstawowe podejście do programu głębokiego uczenia się (ta metoda sprawia, że uczę się szybko zamiast czytać książki i duże artykuły). Jest kilka mylących rzeczy, z którymi się zetknąłem, 2 z nich to: Stronniczość Waga W samouczku MNIST na stronie …
Gram trochę z konwekcjami. W szczególności korzystam z zestawu danych kaggle koty kontra psy, który składa się z 25 000 obrazów oznaczonych jako kot lub pies (po 12500 każdego). Udało mi się osiągnąć około 85% dokładności klasyfikacji na moim zestawie testowym, jednak wyznaczyłem sobie cel osiągnięcia 90% dokładności. Moim głównym …
W NLP istnieje koncepcja, Gazetteerktóra może być bardzo przydatna do tworzenia adnotacji. O ile rozumiem: Gazeter składa się z zestawu list zawierających nazwy podmiotów, takich jak miasta, organizacje, dni tygodnia itp. Listy te służą do wyszukiwania wystąpień tych nazw w tekście, np. Do zadania rozpoznawania nazwanych podmiotów. Jest to więc …
Jakie są cechy szczególne lub właściwości wskazujące, że pewien problem uczenia się można rozwiązać za pomocą maszyn wektorów wsparcia? Innymi słowy, co jest takiego, że gdy widzisz problem z nauką, sprawiasz, że mówisz „och, zdecydowanie powinienem używać do tego SVM” niż sieci neuronowe lub drzewa decyzyjne czy cokolwiek innego?
Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 4 lata temu . Jestem samoukiem i jestem programistą stron internetowych i jestem zainteresowany nauczeniem się danych, ale nie …
Czy są jakieś artykuły lub dyskusje na temat wyodrębnienia części tekstu, która zawiera najwięcej informacji o bieżącym dokumencie. Na przykład mam duży zbiór dokumentów z tej samej domeny. Istnieją fragmenty tekstu zawierające kluczowe informacje, o których mówi pojedynczy dokument. Chcę wyodrębnić niektóre z tych części i wykorzystać je jako podsumowanie …
Jakie są podcasty związane z nauką danych? To jest podobne pytanie do pytania z prośbą o referencję na CrossValidated . Szczegóły / zasady: Podcasty (temat i odcinki) powinny być związane z nauką danych. (Na przykład: podcast dotyczący innej domeny z odcinkiem, który mówi o analizie danych w tej dziedzinie, nie …
Jak bazy danych NoSQL, takie jak MongoDB, mogą być wykorzystywane do analizy danych? Jakie są w nich funkcje, dzięki którym analiza danych jest szybsza i wydajniejsza?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.