Nauka danych python

2

Przykład oddzwonienia Keras do zapisywania modelu po każdej epoce?

Czy ktoś może napisać prosty przykład Keras wykorzystujący wywołanie zwrotne, aby zapisać model po każdej epoce? Potrafię znaleźć przykłady oszczędzania ciężarów, ale chcę móc zapisać w pełni funkcjonujący model po każdej epoce treningowej.

17 python keras

8

Jak policzyć liczbę brakujących wartości w każdym wierszu w ramce danych Pandas?

Jak mogę uzyskać liczbę brakujących wartości w każdym wierszu w ramce danych Pandas. Chciałbym podzielić ramkę danych na różne ramki danych, które mają taką samą liczbę brakujących wartości w każdym wierszu. Jakieś sugestie?

17 python pandas

2

Gdzie w przepływie pracy powinniśmy radzić sobie z brakującymi danymi?

Buduję przepływ pracy do tworzenia modeli uczenia maszynowego (w moim przypadku przy użyciu Pythona pandasi sklearnpakietów) z danych pobranych z bardzo dużej bazy danych (tutaj, Vertica za pomocą SQL i pyodbc), a kluczowym krokiem w tym procesie jest przypisywanie braku wartości predyktorów. Jest to proste w obrębie pojedynczej platformy analitycznej …

16 machine-learning python pandas scikit-learn

4

Biblioteka Pythona do regresji segmentowej (inaczej regresja fragmentaryczna)

Szukam biblioteki Pythona, która może przeprowadzać regresję segmentową (zwaną także regresją częściową) . Przykład :

16 python linear-regression library software-recommendation

3

Jednoklasowa klasyfikacja dyskryminacyjna o niezrównoważonym, heterogenicznym tle negatywnym?

Pracuję nad ulepszeniem istniejącego nadzorowanego klasyfikatora, do klasyfikowania sekwencji {białka} jako należących do określonej klasy (prekursorów hormonu neuropeptydowego), czy nie. Istnieje około 1150 znanych „pozytywów” na tle około 13 milionów sekwencji białek („Nieznane / słabo opatrzone adnotacjami tło”) lub około 100 000 sprawdzonych, odpowiednich białek, opatrzonych różnorodnymi właściwościami (ale bardzo …

16 machine-learning data-mining python classification

6

Jaki jest powód podjęcia logarytmicznej transformacji kilku zmiennych ciągłych?

Robiłem problem z klasyfikacją i przeczytałem kod wielu osób i samouczki. Jedną rzeczą, jaką zauważyłem jest to, że wiele osób podejmuje np.loglub logciągłej zmiennej jak loan_amounti applicant_incomeetc. Chcę tylko zrozumieć przyczynę tego. Czy pomaga to poprawić dokładność prognozowania naszego modelu? Czy to jest obowiązkowe? lub Czy kryje się za tym …

16 machine-learning python classification scikit-learn

3

Jak uzyskać prognozy za pomocą prognozy_generatora na temat transmisji danych testowych w Keras?

Na blogu Keras o konwencjach szkoleniowych od zera kod pokazuje tylko sieć działającą na danych szkoleniowych i walidacyjnych. Co z danymi testowymi? Czy dane walidacyjne są takie same jak dane testowe (nie sądzę). Jeśli istniał oddzielny folder testowy na podobnych liniach jak folder pociągu i sprawdzania poprawności, w jaki sposób …

16 machine-learning python deep-learning keras confusion-matrix

5

Biblioteka Python do implementacji ukrytych modeli Markowa

Jakiej stabilnej biblioteki Python mogę użyć do implementacji ukrytych modeli Markowa? Potrzebuję go w miarę dobrze udokumentować, ponieważ nigdy tak naprawdę nie korzystałem z tego modelu. Alternatywnie, czy istnieje bardziej bezpośrednie podejście do przeprowadzania analizy szeregów czasowych na zbiorze danych przy użyciu HMM?

15 python time-series markov-process

5

Prognozowanie podobieństwa zdań

Szukam rozwiązania następującego problemu: Mam zestaw zdań jako zestaw danych i chcę móc wpisać nowe zdanie i znaleźć zdanie, które jest najbardziej podobne do tego w zestawie danych. Przykład mógłby wyglądać następująco: Nowe zdanie: „ I opened a new mailbox” Prognozowanie na podstawie zestawu danych: Sentence | Similarity A dog …

15 python nlp scikit-learn similarity text

2

Dlaczego zmienne danych pociągu i danych testowych są definiowane za pomocą dużej litery (w Pythonie)?

Mam nadzieję, że to pytanie jest najbardziej odpowiednie na tej stronie ... W Pythonie zwykle nazwa klasy jest definiowana na przykład za pomocą dużej litery class Vehicle: ... Jednak w dziedzinie uczenia maszynowego dane treningowe i testowe często są definiowane jako Xi Y- nie xi y. Na przykład teraz czytam …

15 python dataset

2

Jak działa SelectKBest?

Patrzę na ten samouczek: https://www.dataquest.io/mission/75/improving-your-submission W sekcji 8, znajdując najlepsze funkcje, pokazuje następujący kod. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # Get the raw p-values …

15 python scikit-learn

1

Czy konieczne jest próbkowanie warstwowe (losowy las, Python)?

Używam Pythona do uruchamiania losowego modelu lasu w moim niezrównoważonym zbiorze danych (zmienną docelową była klasa binarna). Podczas dzielenia zestawu danych szkoleniowych i testowych zastanawiałem się, czy zastosować próbkowanie warstwowe (jak pokazano w kodzie), czy nie. Do tej pory zauważyłem w moim projekcie, że rozwarstwiony przypadek doprowadziłby do wyższej wydajności …

14 machine-learning python random-forest sampling training

2

Binarny model klasyfikacji dla niezrównoważonych danych

Mam zestaw danych o następujących specyfikacjach: Zestaw danych szkoleniowych z 193 176 próbkami z 2821 pozytywami Przetestuj zestaw danych z 82 887 próbkami z 673 pozytywami Istnieje 10 funkcji. Chcę przeprowadzić klasyfikację binarną (0 lub 1). Problem, przed którym stoję, polega na tym, że dane są bardzo niezrównoważone. Po normalizacji …

14 machine-learning python classification logistic-regression

1

Mapa termiczna na mapie w Pythonie

Mode Analytics ma fajną funkcję mapy cieplnej ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Ale nie sprzyja to porównywaniu map (tylko jedna na raport). Pozwalają na łatwe pobieranie danych do zapakowanego notatnika Pythona. A następnie dowolny obraz w pythonie można łatwo dodać do raportu. Moje pytanie brzmi: jak odtworzyć mapę termiczną na rzeczywistej mapie …

14 python visualization geospatial

5

Czy współczesne biblioteki R i / lub Python powodują, że SQL staje się przestarzały?

Pracuję w biurze, w którym SQL Server jest podstawą wszystkiego, co robimy, od przetwarzania danych przez czyszczenie po mung. Mój kolega specjalizuje się w pisaniu złożonych funkcji i procedur przechowywanych w celu metodycznego przetwarzania przychodzących danych, aby można je było znormalizować i uruchomić w raportach, wizualizacjach i projektach analitycznych. Przed …

14 python r data-cleaning data sql

Pytania otagowane jako python