Nauka danych

Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny

1
Wielozadaniowe uczenie się w Keras
Próbuję zaimplementować współdzielone warstwy w Keras. Widzę, że Keras ma keras.layers.concatenate, ale nie jestem pewien z dokumentacji dotyczącej jego użycia. Czy mogę go używać do tworzenia wielu współdzielonych warstw? Jaki byłby najlepszy sposób na wdrożenie prostej wspólnej sieci neuronowej, jak pokazano poniżej przy użyciu Keras? Zauważ, że wszystkie kształty warstw …


4
Wykrywanie anomalii za pomocą sieci neuronowej
Mam duży, wielowymiarowy zestaw danych, który jest generowany każdego dnia. Jakie byłoby dobre podejście do wykrycia jakiejkolwiek „anomalii” w porównaniu z poprzednimi dniami? Czy to odpowiedni problem, który można rozwiązać za pomocą sieci neuronowych? Wszelkie sugestie są mile widziane. dodatkowe informacje: nie ma przykładów, więc metoda powinna wykryć anomalie

4
Alternatywy dla TF-IDF i podobieństwa kosinusowego podczas porównywania dokumentów o różnych formatach
Pracowałem nad małym, osobistym projektem, który wymaga umiejętności zawodowych użytkownika i sugeruje najbardziej idealną karierę dla nich w oparciu o te umiejętności. W tym celu korzystam z bazy ofert pracy. W tej chwili kod działa w następujący sposób: 1) Przetwarzaj tekst każdej oferty pracy, aby wyodrębnić umiejętności wymienione w tej …

3
Jak korzystać z RBM do klasyfikacji?
W tej chwili gram z Restricted Boltzmann Machines i skoro już to robię, chciałbym spróbować sklasyfikować za nim ręcznie pisane cyfry. Model, który stworzyłem, jest teraz dość fantazyjnym modelem generatywnym, ale nie wiem, jak dalej z nim iść. W tym artykule autor mówi, że po stworzeniu dobrego modelu generatywnego, jeden …

1
Uczenie nadzorowane a uczenie się wzmacniające dla prostego samochodu rc z własnym napędem
Dla zabawy buduję zdalnie sterowany samochód. Używam Raspberry Pi jako komputera pokładowego; i używam różnych wtyczek, takich jak kamera Raspberry Pi i czujniki odległości, aby uzyskać informacje zwrotne na temat otoczenia samochodu. Używam OpenCV do przekształcania klatek wideo w tensory i używam Google TensorFlow do zbudowania zwiniętej sieci neuronowej do …


1
MinHashing vs SimHashing
Załóżmy, że mam pięć zestawów, które chciałbym połączyć. Rozumiem, że opisana tutaj technika SimHashing: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ może przynieść trzy klastry ( {A}, {B,C,D}i {E}), na przykład, gdy jego wyniki: A -> h01 B -> h02 C -> h02 D -> h02 E -> h03 Podobnie technika MinHashing opisana w rozdziale 3 …



2
Taryfy lotnicze - Jaką analizę należy zastosować, aby wykryć konkurencyjne zachowanie przy ustalaniu cen i korelacje cenowe?
Chcę zbadać zachowanie linii lotniczych w zakresie ustalania cen - w szczególności sposób, w jaki linie lotnicze reagują na ceny konkurentów. Ponieważ powiedziałbym, że moja wiedza na temat bardziej złożonych analiz jest dość ograniczona, zrobiłem głównie wszystkie podstawowe metody, aby zebrać ogólny widok danych. Obejmuje to proste wykresy, które już …

7
Jaka jest „stara nazwa” naukowca danych?
W dzisiejszych czasach coraz częściej używa się terminów takich jak „nauka danych” i „naukowiec danych”. Wiele firm zatrudnia „naukowca danych”. Ale nie sądzę, że to zupełnie nowa praca. Dane istniały w przeszłości i ktoś musiał się nimi zajmować. Wydaje mi się, że termin „naukowiec danych” staje się bardziej popularny, ponieważ …
12 bigdata 

1
Hashing Trick - co się właściwie dzieje
Kiedy algorytmy ML, np. Vowpal Wabbit lub niektóre maszyny do faktoryzacji wygrywające w konkursach współczynnika klikalności ( Kaggle ), wspominają, że funkcje są „mieszane”, co to właściwie oznacza dla modelu? Powiedzmy, że istnieje zmienna reprezentująca identyfikator dodania internetowego, który przyjmuje wartości takie jak „236BG231”. Rozumiem zatem, że ta funkcja jest …

2
Dane sentymentalne dla Emoji
Do eksperymentów chcielibyśmy użyć Emoji osadzonego w wielu tweetach jako podstawowych danych o prawdzie / treningu do prostej ilościowej analizy wrażliwości. Tweety są zwykle zbyt nieustrukturyzowane, aby NLP działało dobrze. W każdym razie w Unicode 6.0 jest 722 Emoji, a prawdopodobnie kolejne 250 zostanie dodanych w Unicode 7.0. Czy istnieje …

3
Klasyfikacja tekstu nieustrukturyzowanego
Zamierzam sklasyfikować nieustrukturyzowane dokumenty tekstowe, a mianowicie strony internetowe o nieznanej strukturze. Liczba klas, do których klasyfikuję, jest ograniczona (w tym momencie uważam, że nie ma więcej niż trzy). Czy ktoś ma sugestie dotyczące tego, jak mogę zacząć? Czy możliwe jest podejście „worek słów”? Później mógłbym dodać kolejny etap klasyfikacji …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.