Nauka danych

Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny

3
Najlepszy sposób na klasyfikację zbiorów danych o mieszanych typach atrybutów
Chciałbym wiedzieć, jaki jest najlepszy sposób klasyfikacji zestawu danych złożonego z mieszanych typów atrybutów, na przykład tekstowych i liczbowych. Wiem, że mogę konwertować tekst na logiczne, ale słownictwo jest zróżnicowane, a dane stają się zbyt rzadkie. Próbowałem również klasyfikować typy atrybutów osobno i łączyć wyniki za pomocą technik meta-uczenia, ale …

2
Czy są jakieś interfejsy API do indeksowania streszczenia papieru?
Jeśli mam bardzo długą listę nazw artykułów, jak mogę uzyskać streszczenie tych artykułów z Internetu lub z dowolnej bazy danych? Nazwy artykułów są jak „Ocena użyteczności w Web Mining dla domeny zdrowia publicznego”. Czy ktoś zna API, które może dać mi rozwiązanie? Próbowałem zaindeksować Google Scholar, jednak Google zablokował mój …

2
Jak zaimplementować prognozowanie sekwencji „jeden do wielu” i „wiele do wielu” w Keras?
Mam problem z interpretacją różnicy kodowania Keras dla znakowania sekwencji jeden do wielu (np. Klasyfikacja pojedynczych obrazów) i wiele do wielu (np. Klasyfikacja sekwencji obrazów). Często widzę dwa różne rodzaje kodów: Typ 1 to miejsce, w którym nie zastosowano takiego podziału czasu: model=Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode="valid", input_shape=[1, 56,14])) model.add(Activation("relu")) …
13 keras  rnn  lstm  sequence 

3
Czy do wnioskowania należy użyć procesora graficznego lub procesora?
Prowadzę głęboko uczącą się sieć neuronową, która została przeszkolona przez procesor graficzny. Chcę teraz wdrożyć to na wielu hostach w celu wnioskowania. Pytanie brzmi, jakie są warunki, aby zdecydować, czy należy używać procesorów graficznych, czy procesorów do wnioskowania? Dodając więcej szczegółów z komentarzy poniżej. Jestem nowy w tym, więc wskazówki …


2
Czy istnieje możliwość zmiany metryki używanej przez wywołanie zwrotne Early Stopping w Keras?
Podczas korzystania z wywołania zwrotnego wczesnego zatrzymania w Keras trening zatrzymuje się, gdy niektóre wskaźniki (zwykle utrata sprawdzania poprawności) nie rosną. Czy istnieje sposób na użycie innej miary (takiej jak precyzja, odwołanie, miara f) zamiast utraty sprawdzania poprawności? Wszystkie przykłady, które do tej pory widziałem, są podobne do tego: callbacks.EarlyStopping …

3
Co to znaczy, gdy mówimy, że większość punktów w hipersześcianie znajduje się na granicy?
Jeśli mam 50-wymiarowy hipersześcian. I definiuję jego granicę przez 0&lt;xj&lt;0.050&lt;xj&lt;0.050<x_j<0.05 lub 0.95&lt;xj&lt;10.95&lt;xj&lt;10.95<x_j<1 gdzie jest wymiarem hipersześcianu. Następnie obliczenie proporcji punktów na granicy hipersześcianu wyniesie . Co to znaczy? Czy to oznacza, że ​​reszta przestrzeni jest pusta? Jeśli punktów znajduje się na granicy, to punkty wewnątrz sześcianu nie mogą być równomiernie …

4
Zaimportuj zawartość pliku csv do ramek danych pyspark
Jak mogę zaimportować plik .csv do ramek danych pyspark? Próbowałem nawet odczytać plik csv w Pandas, a następnie przekonwertować go na ramkę danych Spark za pomocą createDataFrame, ale nadal pojawia się jakiś błąd. Czy ktoś może mnie przez to poprowadzić? Powiedz mi też, jak mogę zaimportować plik xlsx? Próbuję zaimportować …
13 pyspark 



3
Zapytanie języka naturalnego do SQL
Pracowałem nad opracowaniem systemu „Konwertowanie języka naturalnego na zapytania SQL”. Przeczytałem odpowiedzi z podobnych pytań, ale nie byłem w stanie uzyskać informacji, których szukałem. Poniżej znajduje się schemat blokowy takiego systemu, który mam z algorytmu przekształcania języka naturalnego w zapytania SQL dla relacyjnych baz danych autorstwa Garimy Singh, Arun Solanki …

4
Jedna alternatywa kodowania na gorąco dla dużych wartości jakościowych?
Cześć, mam ramkę danych z dużymi wartościami kategorialnymi ponad 1600 kategorii. Czy mogę znaleźć alternatywy, aby nie mieć ponad 1600 kolumn. Znalazłem to poniżej ciekawy link http://amunategui.github.io/feature-hashing/#sourcecode Ale konwertują na klasę / obiekt, którego nie chcę. Czy chcę, aby końcowy wynik był ramką danych, aby móc testować za pomocą różnych …

5
Zalety ramki danych pand do regularnej relacyjnej bazy danych
W Data Science wielu wydaje się używać ramek danych pand jako magazynu danych. Jakie są cechy pand, które czynią go lepszym magazynem danych w porównaniu ze zwykłymi relacyjnymi bazami danych, takimi jak MySQL , które są używane do przechowywania danych w wielu innych dziedzinach programowania? Podczas gdy pandy zapewniają przydatne …
13 pandas  databases 

1
Więc jaki jest haczyk z LSTM?
Poszerzam swoją wiedzę o pakiecie Keras i korzystam z niektórych dostępnych modeli. Mam problem z klasyfikacją binarną NLP, który próbuję rozwiązać i stosuję różne modele. Po pracy z niektórymi wynikami i czytaniu coraz więcej o LSTM wydaje się, że to podejście jest znacznie lepsze niż cokolwiek innego, co próbowałem (w …

1
Wielowymiarowa i wielowymiarowa prognoza szeregów czasowych (RNN / LSTM) Keras
Próbowałem zrozumieć, w jaki sposób reprezentować i kształtować dane, aby tworzyć wielowymiarowe i wielowymiarowe prognozy szeregów czasowych za pomocą Keras (lub TensorFlow), ale nadal jestem bardzo niejasny po przeczytaniu wielu postów / samouczków / dokumentacji na blogu, w jaki sposób prezentować dane w poprawny kształt (większość przykładów jest nieco mniejsza …
12 python  keras  rnn  lstm 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.