Nauka danych

3

Poszukuję dobrego pakietu do wykrywania anomalii w szeregach czasowych

Czy istnieje kompleksowy pakiet open source (najlepiej w Pythonie lub R), który może być wykorzystywany do wykrywania anomalii w szeregach czasowych? W scikit-learn znajduje się pakiet SVM jednej klasy, ale nie dotyczy on danych szeregów czasowych. Szukam bardziej wyrafinowanych pakietów, które na przykład wykorzystują sieci bayesowskie do wykrywania anomalii.

17 python time-series anomaly-detection

2

Przykład oddzwonienia Keras do zapisywania modelu po każdej epoce?

Czy ktoś może napisać prosty przykład Keras wykorzystujący wywołanie zwrotne, aby zapisać model po każdej epoce? Potrafię znaleźć przykłady oszczędzania ciężarów, ale chcę móc zapisać w pełni funkcjonujący model po każdej epoce treningowej.

17 python keras

8

Jak policzyć liczbę brakujących wartości w każdym wierszu w ramce danych Pandas?

Jak mogę uzyskać liczbę brakujących wartości w każdym wierszu w ramce danych Pandas. Chciałbym podzielić ramkę danych na różne ramki danych, które mają taką samą liczbę brakujących wartości w każdym wierszu. Jakieś sugestie?

17 python pandas

2

Gdzie w przepływie pracy powinniśmy radzić sobie z brakującymi danymi?

Buduję przepływ pracy do tworzenia modeli uczenia maszynowego (w moim przypadku przy użyciu Pythona pandasi sklearnpakietów) z danych pobranych z bardzo dużej bazy danych (tutaj, Vertica za pomocą SQL i pyodbc), a kluczowym krokiem w tym procesie jest przypisywanie braku wartości predyktorów. Jest to proste w obrębie pojedynczej platformy analitycznej …

16 machine-learning python pandas scikit-learn

5

Co jeszcze oferuje TensorFlow kamerom?

Wiem, że keras służy jako interfejs wysokiego poziomu dla TensorFlow. Wydaje mi się jednak, że keras może samodzielnie wykonywać wiele funkcji (wprowadzanie danych, tworzenie modeli, szkolenie, ocena). Co więcej, niektóre funkcje TensorFlow mogą być przeniesione bezpośrednio do keras (np. W keras można użyć funkcji metrycznej tf lub utraty). Moje pytanie …

16 keras tensorflow

1

Co to jest wynik LB w uczeniu maszynowym?

Przeglądałem artykuł o blogach Kaggle. Wielokrotnie autor wymienia „wynik LB” i „dopasowanie LB”) jako miernik skuteczności uczenia maszynowego (wraz z wynikiem weryfikacji krzyżowej (CV)). Badając znaczenie „LB” spędziłem sporo czasu, zdałem sobie sprawę, że ogólnie ludzie nazywają go bezpośrednio LB bez większego tła. Więc moje pytanie brzmi - co to …

16 machine-learning accuracy

3

Co to jest waga i stronniczość w głębokim uczeniu się?

Zaczynam się uczyć uczenia maszynowego ze strony internetowej Tensorflow. Rozwinąłem bardzo podstawowe podejście do programu głębokiego uczenia się (ta metoda sprawia, że uczę się szybko zamiast czytać książki i duże artykuły). Jest kilka mylących rzeczy, z którymi się zetknąłem, 2 z nich to: Stronniczość Waga W samouczku MNIST na stronie …

16 machine-learning deep-learning tensorflow

5

Konwolucyjna nadmierna sieć neuronowa. Porzucenie nie pomaga

Gram trochę z konwekcjami. W szczególności korzystam z zestawu danych kaggle koty kontra psy, który składa się z 25 000 obrazów oznaczonych jako kot lub pies (po 12500 każdego). Udało mi się osiągnąć około 85% dokładności klasyfikacji na moim zestawie testowym, jednak wyznaczyłem sobie cel osiągnięcia 90% dokładności. Moim głównym …

16 neural-network deep-learning convnet image-recognition dropout

2

NLP - Czy Gazetteer to oszustwo?

W NLP istnieje koncepcja, Gazetteerktóra może być bardzo przydatna do tworzenia adnotacji. O ile rozumiem: Gazeter składa się z zestawu list zawierających nazwy podmiotów, takich jak miasta, organizacje, dni tygodnia itp. Listy te służą do wyszukiwania wystąpień tych nazw w tekście, np. Do zadania rozpoznawania nazwanych podmiotów. Jest to więc …

16 nlp named-entity-recognition

2

Jakie problemy z uczeniem się są odpowiednie dla maszyn wektorowych wsparcia?

Jakie są cechy szczególne lub właściwości wskazujące, że pewien problem uczenia się można rozwiązać za pomocą maszyn wektorów wsparcia? Innymi słowy, co jest takiego, że gdy widzisz problem z nauką, sprawiasz, że mówisz „och, zdecydowanie powinienem używać do tego SVM” niż sieci neuronowe lub drzewa decyzyjne czy cokolwiek innego?

16 machine-learning svm supervised-learning unsupervised-learning

3

Jak samouczyć się danych? [Zamknięte]

Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 4 lata temu . Jestem samoukiem i jestem programistą stron internetowych i jestem zainteresowany nauczeniem się danych, ale nie …

16 beginner self-study

2

Wyodrębnij najbardziej pouczające części tekstu z dokumentów

Czy są jakieś artykuły lub dyskusje na temat wyodrębnienia części tekstu, która zawiera najwięcej informacji o bieżącym dokumencie. Na przykład mam duży zbiór dokumentów z tej samej domeny. Istnieją fragmenty tekstu zawierające kluczowe informacje, o których mówi pojedynczy dokument. Chcę wyodrębnić niektóre z tych części i wykorzystać je jako podsumowanie …

16 nlp text-mining

6

Podcasty z zakresu nauki o danych?

Jakie są podcasty związane z nauką danych? To jest podobne pytanie do pytania z prośbą o referencję na CrossValidated . Szczegóły / zasady: Podcasty (temat i odcinki) powinny być związane z nauką danych. (Na przykład: podcast dotyczący innej domeny z odcinkiem, który mówi o analizie danych w tej dziedzinie, nie …

16 reference-request

4

Biblioteka Pythona do regresji segmentowej (inaczej regresja fragmentaryczna)

Szukam biblioteki Pythona, która może przeprowadzać regresję segmentową (zwaną także regresją częściową) . Przykład :

16 python linear-regression library software-recommendation

3

Wykorzystanie bazy danych NoSQL w badaniach danych

Jak bazy danych NoSQL, takie jak MongoDB, mogą być wykorzystywane do analizy danych? Jakie są w nich funkcje, dzięki którym analiza danych jest szybsza i wydajniejsza?

16 bigdata nosql mongodb