Nauka danych

Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny

1
RNN przy użyciu wielu szeregów czasowych
Próbuję utworzyć sieć neuronową, używając szeregów czasowych jako danych wejściowych, aby trenować ją w oparciu o typ każdej serii. Czytałem, że używając RNN możesz podzielić dane wejściowe na partie i wykorzystać każdy punkt szeregu czasowego na poszczególne neurony i ostatecznie wyszkolić sieć. Staram się jednak używać wielu szeregów czasowych jako …
14 time-series  rnn 


1
Mapa termiczna na mapie w Pythonie
Mode Analytics ma fajną funkcję mapy cieplnej ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Ale nie sprzyja to porównywaniu map (tylko jedna na raport). Pozwalają na łatwe pobieranie danych do zapakowanego notatnika Pythona. A następnie dowolny obraz w pythonie można łatwo dodać do raportu. Moje pytanie brzmi: jak odtworzyć mapę termiczną na rzeczywistej mapie …

5
Czy współczesne biblioteki R i / lub Python powodują, że SQL staje się przestarzały?
Pracuję w biurze, w którym SQL Server jest podstawą wszystkiego, co robimy, od przetwarzania danych przez czyszczenie po mung. Mój kolega specjalizuje się w pisaniu złożonych funkcji i procedur przechowywanych w celu metodycznego przetwarzania przychodzących danych, aby można je było znormalizować i uruchomić w raportach, wizualizacjach i projektach analitycznych. Przed …
14 python  r  data-cleaning  data  sql 


3
Doc2vec (gensim) - Jak wywnioskować etykietę zdań niewidocznych?
https://radimrehurek.com/gensim/models/doc2vec.html Na przykład, jeśli przeszkoliliśmy doc2vec „aaaaaAAAAAaaaaaa” - „etykieta 1” „BbbbbbBBBBBbbbb” - „etykieta 2” czy możemy wywnioskować, że „aaaaAAAAaaaaAA” oznacza etykietę 1 za pomocą Doc2vec? Wiem, że Doc2vec może trenować wektory słów i wektory etykiet. Korzystając z tych wektorów, czy możemy wnioskować o niewidocznych zdaniach (kombinacji wyuczonych słów), w której …
14 gensim 

1
Jaka jest różnica między (dynamiczną) siecią Bayesa a HMM?
Czytałem, że HMM, filtry cząstek i filtry Kalmana są szczególnymi przypadkami dynamicznych sieci Bayesa. Jednak znam tylko HMM i nie widzę różnicy w stosunku do dynamicznych sieci Bayesa. Czy ktoś mógłby wyjaśnić? Byłoby miło, gdyby Twoja odpowiedź była podobna do następującej, ale w przypadku bayes Networks: Ukryte modele Markowa Ukryty …

3
Czy w przypadku niezrównoważonej klasy muszę korzystać z próbkowania w moich zestawach danych do sprawdzania poprawności / testowania?
Jestem początkującym w uczeniu maszynowym i mam do czynienia z sytuacją. Pracuję nad problemem określania stawek w czasie rzeczywistym z zestawem danych IPinYou i próbuję przewidzieć kliknięcie. Chodzi o to, że, jak być może wiesz, zestaw danych jest bardzo niezrównoważony: około 1300 negatywnych przykładów (bez kliknięcia) na 1 pozytywny przykład …

2
Dane wielowymiarowe: jakie przydatne techniki należy znać?
Z powodu różnych przekleństw wymiarowych dokładność i szybkość wielu popularnych technik predykcyjnych obniżają się w przypadku danych o dużych wymiarach. Jakie są najbardziej przydatne techniki / triki / heurystyki, które pomagają skutecznie radzić sobie z danymi wielowymiarowymi? Na przykład, Czy niektóre metody statystyczne / modelujące działają dobrze na wielowymiarowych zestawach …


3
Kiedy wartości p są zwodnicze?
Na jakie warunki danych należy zwrócić uwagę, w przypadku których wartości p mogą nie być najlepszym sposobem decydowania o istotności statystycznej? Czy istnieją konkretne typy problemów, które należą do tej kategorii?


1
Drzewa decyzyjne: liść drzewa (najlepiej pierwszy) i poziom drzewa
Problem 1: Jestem zdezorientowany opisem LightGBM dotyczącym sposobu, w jaki drzewo jest rozwijane. Stanowią one: Większość algorytmów uczenia się drzew decyzyjnych rośnie według poziomów (głębokości), jak na poniższym obrazku: Pytania 1 : Jakie „większość” algorytmów stosuje się w ten sposób? O ile wiem C4.5 i CART używają DFS. XGBoost używa …

3
Po co zawracać sobie głowę, jeśli Max Pooling i tak po prostu przeskaluje obraz?
Pomysł zastosowania filtrów w celu zidentyfikowania krawędzi jest całkiem fajnym pomysłem. Na przykład możesz zrobić zdjęcie 7. Z niektórymi filtrami możesz uzyskać przekształcone obrazy, które podkreślają różne cechy oryginalnego obrazu. Oryginalny 7: może być postrzegany przez sieć jako: Zauważ, jak każdy obraz wyodrębnił inną krawędź oryginału 7. To wszystko świetnie, …

4
Jak zainicjować nowy model word2vec przy pomocy wstępnie wyuczonych wag modelu?
Korzystam z biblioteki Gensim w Pythonie do używania i szkolenia modelu word2vector. Ostatnio zastanawiałem się nad zainicjowaniem wag modelu za pomocą wstępnie wyszkolonego modelu word2vec, takiego jak (model wstępnie przeszkolony GoogleNewDataset). Walczyłem z tym od kilku tygodni. Teraz właśnie sprawdziłem, że w gesim jest funkcja, która może mi pomóc zainicjować …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.