Nauka danych

Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny

3
Przetwarzanie równoległe i rozproszone
Jaka jest (są) różnica (-y) między obliczeniami równoległymi i rozproszonymi? Jeśli chodzi o skalowalność i wydajność, bardzo często spotyka się rozwiązania dotyczące obliczeń w klastrach maszyn, a czasem nazywa się je przetwarzaniem równoległym lub przetwarzaniem rozproszonym. W pewnym sensie obliczenia wydają się zawsze równoległe, ponieważ niektóre rzeczy działają równolegle. Ale …


5
Prognozowanie podobieństwa zdań
Szukam rozwiązania następującego problemu: Mam zestaw zdań jako zestaw danych i chcę móc wpisać nowe zdanie i znaleźć zdanie, które jest najbardziej podobne do tego w zestawie danych. Przykład mógłby wyglądać następująco: Nowe zdanie: „ I opened a new mailbox” Prognozowanie na podstawie zestawu danych: Sentence | Similarity A dog …

2
Grupowanie unikalnych użytkowników według useragent, ip, session_id
Biorąc pod uwagę dane dostępu do witryny w formularzu session_id, ip, user_agenti opcjonalnie znacznik czasu, zgodnie z poniższymi warunkami, w jaki sposób najlepiej podzielić sesje na unikalnych użytkowników? session_id: to identyfikator nadawany każdemu nowemu odwiedzającemu. Nie wygasa, jednak jeśli użytkownik nie zaakceptuje plików cookie / wyczyści pliki cookie / zmieni …
15 clustering 


6
Keras - Transfer learning - zmiana kształtu tensora wejściowego
Ten post wydaje się wskazywać, że to, co chcę osiągnąć, nie jest możliwe. Nie jestem jednak do tego przekonany - biorąc pod uwagę to, co już zrobiłem, nie rozumiem, dlaczego nie mogę osiągnąć tego, co chcę zrobić ... Mam dwa zestawy danych obrazów, w których jeden ma obrazy kształtu (480, …
15 keras 

4
Drzewo decyzyjne a KNN
W jakich przypadkach lepiej jest użyć drzewa decyzyjnego, a innych - KNN? Po co używać jednego z nich w niektórych przypadkach? A drugi w różnych przypadkach? (Patrząc na jego funkcjonalność, a nie na algorytm) Czy ktoś ma jakieś wyjaśnienia lub odniesienia na ten temat?




2
Jak działa SelectKBest?
Patrzę na ten samouczek: https://www.dataquest.io/mission/75/improving-your-submission W sekcji 8, znajdując najlepsze funkcje, pokazuje następujący kod. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # Get the raw p-values …

1
PyTorch vs. Tensorflow chętny
Google niedawno zawarł w nocnej kompilacji tensorflow tryb Eager , niezbędny interfejs API umożliwiający dostęp do możliwości obliczeń tensorflow. Jak tensorflow chętnie wypada w porównaniu z PyTorch? Niektóre aspekty, które mogą mieć wpływ na porównanie, to: Zalety i wady chętnych ze względu na spuściznę graficzną (np. Nazwy w węzłach). Wewnętrzne …

3
GAN (generatywne sieci przeciwne) są również możliwe dla tekstu?
Czy GAN - generatywne sieci przeciwne - są dobre tylko dla obrazów, czy mogą być również użyte do tekstu? Na przykład wytrenuj sieć, aby generowała sensowne teksty ze streszczenia. UPD - cytaty wynalazcy GAN Iana Goodfellow. GAN nie zostały zastosowane do NLP, ponieważ GAN są zdefiniowane tylko dla danych o …
14 gan 


1
Czy konieczne jest próbkowanie warstwowe (losowy las, Python)?
Używam Pythona do uruchamiania losowego modelu lasu w moim niezrównoważonym zbiorze danych (zmienną docelową była klasa binarna). Podczas dzielenia zestawu danych szkoleniowych i testowych zastanawiałem się, czy zastosować próbkowanie warstwowe (jak pokazano w kodzie), czy nie. Do tej pory zauważyłem w moim projekcie, że rozwarstwiony przypadek doprowadziłby do wyższej wydajności …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.