Nauka danych

3

Najlepszy sposób na klasyfikację zbiorów danych o mieszanych typach atrybutów

Chciałbym wiedzieć, jaki jest najlepszy sposób klasyfikacji zestawu danych złożonego z mieszanych typów atrybutów, na przykład tekstowych i liczbowych. Wiem, że mogę konwertować tekst na logiczne, ale słownictwo jest zróżnicowane, a dane stają się zbyt rzadkie. Próbowałem również klasyfikować typy atrybutów osobno i łączyć wyniki za pomocą technik meta-uczenia, ale …

13 machine-learning classification

2

Czy są jakieś interfejsy API do indeksowania streszczenia papieru?

Jeśli mam bardzo długą listę nazw artykułów, jak mogę uzyskać streszczenie tych artykułów z Internetu lub z dowolnej bazy danych? Nazwy artykułów są jak „Ocena użyteczności w Web Mining dla domeny zdrowia publicznego”. Czy ktoś zna API, które może dać mi rozwiązanie? Próbowałem zaindeksować Google Scholar, jednak Google zablokował mój …

13 data-mining machine-learning

2

Jak zaimplementować prognozowanie sekwencji „jeden do wielu” i „wiele do wielu” w Keras?

Mam problem z interpretacją różnicy kodowania Keras dla znakowania sekwencji jeden do wielu (np. Klasyfikacja pojedynczych obrazów) i wiele do wielu (np. Klasyfikacja sekwencji obrazów). Często widzę dwa różne rodzaje kodów: Typ 1 to miejsce, w którym nie zastosowano takiego podziału czasu: model=Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode="valid", input_shape=[1, 56,14])) model.add(Activation("relu")) …

13 keras rnn lstm sequence

3

Czy do wnioskowania należy użyć procesora graficznego lub procesora?

Prowadzę głęboko uczącą się sieć neuronową, która została przeszkolona przez procesor graficzny. Chcę teraz wdrożyć to na wielu hostach w celu wnioskowania. Pytanie brzmi, jakie są warunki, aby zdecydować, czy należy używać procesorów graficznych, czy procesorów do wnioskowania? Dodając więcej szczegółów z komentarzy poniżej. Jestem nowy w tym, więc wskazówki …

13 deep-learning gpu

3

Czym różnią się teraz głębokie uczenie się NN (2016) od tych, które studiowałem 4 lata temu (2012)?

W Wikipedii i deeplearning4j mówi się, że NN (DLNN) to NN, które mają> 1 ukrytą warstwę. Tego rodzaju NN były dla mnie standardem na uniwersytecie, podczas gdy DLNN jest teraz bardzo podekscytowany. Byłem tam, zrobiłem to - o co chodzi? Słyszałem również, że stosy NN są uważane za głębokie uczenie …

13 neural-network deep-learning

2

Czy istnieje możliwość zmiany metryki używanej przez wywołanie zwrotne Early Stopping w Keras?

Podczas korzystania z wywołania zwrotnego wczesnego zatrzymania w Keras trening zatrzymuje się, gdy niektóre wskaźniki (zwykle utrata sprawdzania poprawności) nie rosną. Czy istnieje sposób na użycie innej miary (takiej jak precyzja, odwołanie, miara f) zamiast utraty sprawdzania poprawności? Wszystkie przykłady, które do tej pory widziałem, są podobne do tego: callbacks.EarlyStopping …

13 machine-learning neural-network deep-learning keras

3

Co to znaczy, gdy mówimy, że większość punktów w hipersześcianie znajduje się na granicy?

Jeśli mam 50-wymiarowy hipersześcian. I definiuję jego granicę przez 0<xj<0.050<xj<0.050<x_j<0.05 lub 0.95<xj<10.95<xj<10.95<x_j<1 gdzie jest wymiarem hipersześcianu. Następnie obliczenie proporcji punktów na granicy hipersześcianu wyniesie . Co to znaczy? Czy to oznacza, że reszta przestrzeni jest pusta? Jeśli punktów znajduje się na granicy, to punkty wewnątrz sześcianu nie mogą być równomiernie …

13 machine-learning math

4

Zaimportuj zawartość pliku csv do ramek danych pyspark

Jak mogę zaimportować plik .csv do ramek danych pyspark? Próbowałem nawet odczytać plik csv w Pandas, a następnie przekonwertować go na ramkę danych Spark za pomocą createDataFrame, ale nadal pojawia się jakiś błąd. Czy ktoś może mnie przez to poprowadzić? Powiedz mi też, jak mogę zaimportować plik xlsx? Próbuję zaimportować …

13 pyspark

3

Co oznacza „liniowy w parametrach”?

Model regresji liniowej ma parametry liniowe. Co to właściwie znaczy?

13 regression linear-regression

4

Dlaczego w algorytmie SVM wektor w jest prostopadły do hiperpłaszczyzny oddzielającej?

Jestem początkującym w uczeniu maszynowym. W SVM hiperpłaszczyzna oddzielająca jest zdefiniowana jako y= wT.x + by=wT.x+by = w^T x + b . Dlaczego mówimy wektor www prostopadła do hiperpłaszczyzny rozdzielającej?

13 machine-learning svm

3

Zapytanie języka naturalnego do SQL

Pracowałem nad opracowaniem systemu „Konwertowanie języka naturalnego na zapytania SQL”. Przeczytałem odpowiedzi z podobnych pytań, ale nie byłem w stanie uzyskać informacji, których szukałem. Poniżej znajduje się schemat blokowy takiego systemu, który mam z algorytmu przekształcania języka naturalnego w zapytania SQL dla relacyjnych baz danych autorstwa Garimy Singh, Arun Solanki …

13 machine-learning nlp sql natural-language-process

4

Jedna alternatywa kodowania na gorąco dla dużych wartości jakościowych?

Cześć, mam ramkę danych z dużymi wartościami kategorialnymi ponad 1600 kategorii. Czy mogę znaleźć alternatywy, aby nie mieć ponad 1600 kolumn. Znalazłem to poniżej ciekawy link http://amunategui.github.io/feature-hashing/#sourcecode Ale konwertują na klasę / obiekt, którego nie chcę. Czy chcę, aby końcowy wynik był ramką danych, aby móc testować za pomocą różnych …

13 machine-learning dataset dimensionality-reduction encoding

5

Zalety ramki danych pand do regularnej relacyjnej bazy danych

W Data Science wielu wydaje się używać ramek danych pand jako magazynu danych. Jakie są cechy pand, które czynią go lepszym magazynem danych w porównaniu ze zwykłymi relacyjnymi bazami danych, takimi jak MySQL , które są używane do przechowywania danych w wielu innych dziedzinach programowania? Podczas gdy pandy zapewniają przydatne …

13 pandas databases

1

Więc jaki jest haczyk z LSTM?

Poszerzam swoją wiedzę o pakiecie Keras i korzystam z niektórych dostępnych modeli. Mam problem z klasyfikacją binarną NLP, który próbuję rozwiązać i stosuję różne modele. Po pracy z niektórymi wynikami i czytaniu coraz więcej o LSTM wydaje się, że to podejście jest znacznie lepsze niż cokolwiek innego, co próbowałem (w …

12 neural-network nlp lstm recurrent-neural-net

1

Wielowymiarowa i wielowymiarowa prognoza szeregów czasowych (RNN / LSTM) Keras

Próbowałem zrozumieć, w jaki sposób reprezentować i kształtować dane, aby tworzyć wielowymiarowe i wielowymiarowe prognozy szeregów czasowych za pomocą Keras (lub TensorFlow), ale nadal jestem bardzo niejasny po przeczytaniu wielu postów / samouczków / dokumentacji na blogu, w jaki sposób prezentować dane w poprawny kształt (większość przykładów jest nieco mniejsza …

12 python keras rnn lstm