Nauka danych

3

Jaka jest (są) różnica (-y) między obliczeniami równoległymi i rozproszonymi? Jeśli chodzi o skalowalność i wydajność, bardzo często spotyka się rozwiązania dotyczące obliczeń w klastrach maszyn, a czasem nazywa się je przetwarzaniem równoległym lub przetwarzaniem rozproszonym. W pewnym sensie obliczenia wydają się zawsze równoległe, ponieważ niektóre rzeczy działają równolegle. Ale …

15 definitions parallel distributed

1

Jak wybiera się punkt podziału dla zmiennych ciągłych w drzewach decyzyjnych?

Mam dwa pytania dotyczące drzew decyzyjnych: Jeśli mamy ciągły atrybut, jak wybrać wartość podziału? Przykład: Wiek = (20,29,50,40 ....) Wyobrazić, że mają ciągłą atrybutu , które mają wartości R . Jak napisać algorytm, który znajdzie punkt podziału v , aby po podzieleniu f przez v uzyskaliśmy minimalne wzmocnienie dla f …

15 classification data decision-trees

5

Prognozowanie podobieństwa zdań

Szukam rozwiązania następującego problemu: Mam zestaw zdań jako zestaw danych i chcę móc wpisać nowe zdanie i znaleźć zdanie, które jest najbardziej podobne do tego w zestawie danych. Przykład mógłby wyglądać następująco: Nowe zdanie: „ I opened a new mailbox” Prognozowanie na podstawie zestawu danych: Sentence | Similarity A dog …

15 python nlp scikit-learn similarity text

2

Grupowanie unikalnych użytkowników według useragent, ip, session_id

Biorąc pod uwagę dane dostępu do witryny w formularzu session_id, ip, user_agenti opcjonalnie znacznik czasu, zgodnie z poniższymi warunkami, w jaki sposób najlepiej podzielić sesje na unikalnych użytkowników? session_id: to identyfikator nadawany każdemu nowemu odwiedzającemu. Nie wygasa, jednak jeśli użytkownik nie zaakceptuje plików cookie / wyczyści pliki cookie / zmieni …

15 clustering

3

Zalety układania LSTM?

Zastanawiam się, w jakich sytuacjach korzystne jest układanie LSTM?

15 machine-learning neural-network deep-learning lstm

6

Keras - Transfer learning - zmiana kształtu tensora wejściowego

Ten post wydaje się wskazywać, że to, co chcę osiągnąć, nie jest możliwe. Nie jestem jednak do tego przekonany - biorąc pod uwagę to, co już zrobiłem, nie rozumiem, dlaczego nie mogę osiągnąć tego, co chcę zrobić ... Mam dwa zestawy danych obrazów, w których jeden ma obrazy kształtu (480, …

15 keras

4

Drzewo decyzyjne a KNN

W jakich przypadkach lepiej jest użyć drzewa decyzyjnego, a innych - KNN? Po co używać jednego z nich w niektórych przypadkach? A drugi w różnych przypadkach? (Patrząc na jego funkcjonalność, a nie na algorytm) Czy ktoś ma jakieś wyjaśnienia lub odniesienia na ten temat?

15 machine-learning data-mining decision-trees

2

Nauka danych bez znajomości konkretnego tematu, czy warto kontynuować karierę? [Zamknięte]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym wymiany danych stosu nauki. Zamknięte 5 lat temu . Niedawno rozmawiałem z kimś i wspomniałem o moim zainteresowaniu analizą danych oraz o tym, kim chciałem nauczyć się niezbędnych …

15 education beginner career

2

Dlaczego zmienne danych pociągu i danych testowych są definiowane za pomocą dużej litery (w Pythonie)?

Mam nadzieję, że to pytanie jest najbardziej odpowiednie na tej stronie ... W Pythonie zwykle nazwa klasy jest definiowana na przykład za pomocą dużej litery class Vehicle: ... Jednak w dziedzinie uczenia maszynowego dane treningowe i testowe często są definiowane jako Xi Y- nie xi y. Na przykład teraz czytam …

15 python dataset

4

Inny zestaw testów i rozkład zestawu treningowego

Pracuję nad konkursem danych, dla którego rozkład mojego zestawu testowego różni się od zestawu treningowego. Chcę podpróbować obserwacje z zestawu treningowego, który bardzo przypomina zestaw testowy. W jaki sposób mogę to zrobić?

15 preprocessing

2

Jak działa SelectKBest?

Patrzę na ten samouczek: https://www.dataquest.io/mission/75/improving-your-submission W sekcji 8, znajdując najlepsze funkcje, pokazuje następujący kod. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # Get the raw p-values …

15 python scikit-learn

1

PyTorch vs. Tensorflow chętny

Google niedawno zawarł w nocnej kompilacji tensorflow tryb Eager , niezbędny interfejs API umożliwiający dostęp do możliwości obliczeń tensorflow. Jak tensorflow chętnie wypada w porównaniu z PyTorch? Niektóre aspekty, które mogą mieć wpływ na porównanie, to: Zalety i wady chętnych ze względu na spuściznę graficzną (np. Nazwy w węzłach). Wewnętrzne …

14 deep-learning tensorflow pytorch

3

GAN (generatywne sieci przeciwne) są również możliwe dla tekstu?

Czy GAN - generatywne sieci przeciwne - są dobre tylko dla obrazów, czy mogą być również użyte do tekstu? Na przykład wytrenuj sieć, aby generowała sensowne teksty ze streszczenia. UPD - cytaty wynalazcy GAN Iana Goodfellow. GAN nie zostały zastosowane do NLP, ponieważ GAN są zdefiniowane tylko dla danych o …

14 gan

4

Czy możemy wygenerować ogromny zestaw danych za pomocą Generatywnych sieci przeciwników

Mam do czynienia z problemem, w którym nie mogłem znaleźć wystarczającej ilości danych (obrazów), aby móc zasilić moją głęboką sieć neuronową w celu szkolenia. Tak zainspirował mnie artykuł Generative Adversarial Text to Image Synthesis opublikowany przez Scotta Reeda i in. w sprawie generatywnych sieci przeciwnych. Byłem ciekawy, czy mogę użyć …

14 deep-learning gan

1

Czy konieczne jest próbkowanie warstwowe (losowy las, Python)?

Używam Pythona do uruchamiania losowego modelu lasu w moim niezrównoważonym zbiorze danych (zmienną docelową była klasa binarna). Podczas dzielenia zestawu danych szkoleniowych i testowych zastanawiałem się, czy zastosować próbkowanie warstwowe (jak pokazano w kodzie), czy nie. Do tej pory zauważyłem w moim projekcie, że rozwarstwiony przypadek doprowadziłby do wyższej wydajności …

14 machine-learning python random-forest sampling training