Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
Jestem nowicjuszem w głębokim uczeniu się. Czy jest teraz jakiś sposób na użycie TensorFlow z procesorami graficznymi Intel? Jeśli tak, proszę wskazać mi właściwy kierunek. Jeśli nie, proszę dać mi znać, jakiej ramy (Keras, Theano itp.) Mogę użyć dla mojego zintegrowanego kontrolera graficznego Intel Core Xeon E3-1200 v3 / 4-tej …
W tym linku dotyczącym stacjonarności i różnicowania wspomniano, że modele takie jak ARIMA wymagają stacjonarnych szeregów czasowych do prognozowania, ponieważ jego właściwości statystyczne, takie jak średnia, wariancja, autokorelacja itp., Są stałe w czasie. Ponieważ sieci RNN mają lepszą zdolność do uczenia się relacji nieliniowych ( jak podano tutaj: Obietnica nawracających …
Kiedy czytałem o używaniu StandardScaler, większość zaleceń mówiła, że powinieneś użyć StandardScaler przed podzieleniem danych na pociąg / test, ale kiedy sprawdzałem niektóre kody opublikowane online (za pomocą sklearn), były dwa główne zastosowania. 1- Korzystanie StandardScalerze wszystkich danych. Na przykład from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_fit = sc.fit(X) …
W przypadku posiadania kombinacji atrybutów jakościowych i liczbowych zwykle przekształcam atrybuty jakościowe w jeden gorący wektor. Moje pytanie brzmi: czy pozostawiam te wektory bez zmian i skaluję atrybuty numeryczne poprzez standaryzację / normalizację, czy powinienem skalować jeden gorący wektor wraz z atrybutami numerycznymi?
Mam 3 klasy z tą dystrybucją: Class 0: 0.1169 Class 1: 0.7668 Class 2: 0.1163 I używam xgboostdo klasyfikacji. Wiem, że istnieje parametr o nazwie scale_pos_weight. Ale jak to jest obsługiwane w przypadku „wieloklasowym” i jak mogę to właściwie ustawić?
Zastanawiałem się, jak musimy zdecydować, ile węzłów w ukrytych warstwach i ile ukrytych warstw umieścić, gdy budujemy architekturę sieci neuronowej. Rozumiem, że warstwa wejściowa i wyjściowa zależy od posiadanego zestawu szkoleniowego, ale jak decydujemy o warstwie ukrytej i ogólnej architekturze w ogóle?
LDA ma dwa hiperparametry, strojenie ich zmienia indukowane tematy. Co hiperparametry alfa i beta przyczyniają się do LDA? Jak zmienia się temat, jeśli jeden lub drugi hiperparametry zwiększają się lub zmniejszają? Dlaczego są to hiperparametry, a nie tylko parametry?
Chcę wiedzieć, co tak naprawdę dzieje się w Hellinger Distance (w prostych słowach). Co więcej, jestem również zainteresowany tym, jakie rodzaje problemów możemy wykorzystać Hellinger Distance? Jakie są zalety korzystania z Hellinger Distance?
Buduję wielomianową regresję logistyczną za pomocą sklearn (LogisticRegression). Ale po zakończeniu, jak mogę uzyskać wartość p i przedział ufności mojego modelu? Wydaje się tylko, że sklearn zapewnia jedynie współczynnik i przechwytuje. Dziękuję bardzo.
Biorę udział w konkursie kaggle. Zestaw danych ma około 100 funkcji i wszystkie są nieznane (pod względem tego, co faktycznie reprezentują). Zasadniczo są to tylko liczby. Ludzie wykonują wiele inżynierii funkcji na tych funkcjach. Zastanawiam się, jak dokładnie można wykonać inżynierię funkcji na nieznanych funkcjach? Czy ktoś może mi pomóc …
Zasadniczo model uczenia maszynowego jest oparty na zestawach danych. Chciałbym wiedzieć, czy istnieje jakiś sposób na wygenerowanie syntetycznego zestawu danych przy użyciu takiego wyuczonego modelu uczenia maszynowego, zachowującego oryginalne cechy zestawu danych? [oryginalne dane -> zbuduj model uczenia maszynowego -> użyj modelu ml do wygenerowania danych syntetycznych .... !!!] Czy …
Niedawno zacząłem uczyć się pracy sklearni właśnie spotkałem się z tym osobliwym rezultatem. Użyłem digitsdostępnego zestawu danych, sklearnaby wypróbować różne modele i metody szacowania. Kiedy testowaliśmy model Pomoc Wektor maszynowego na danych, znalazłem tam są dwie różne klasy w sklearnklasyfikacji SVM: SVCa LinearSVC, gdzie dawne zastosowania jednego przed jednym podejściem …
Chcę więc utworzyć tabelę radarową profilu gracza w taki sposób: Nie tylko skala każdej zmiennej jest inna, ale także chcę odwrotnej skali dla niektórych statystyk, takich jak statystyka „wywłaszczona”, gdzie mniej faktycznie oznacza dobre. Jednym rozwiązaniem dla zmiennej skali dla każdej statystyki może być ustanowienie testu porównawczego, a następnie obliczenie …
Niedawno widziałem fajną funkcję, która była kiedyś dostępna w Arkuszach Google: zaczynasz od napisania kilku powiązanych słów kluczowych w kolejnych komórkach, na przykład: „niebieski”, „zielony”, „żółty”, i automatycznie generuje podobne słowa kluczowe (w tym przypadku , inne kolory). Zobacz więcej przykładów w tym filmie na YouTube . Chciałbym to odtworzyć …
Problem, który rozwiązuję, polega na podzieleniu krótkich tekstów na wiele klas. Moje obecne podejście polega na wykorzystaniu częstotliwości ważonych tf-idf i nauce prostego klasyfikatora liniowego (regresja logistyczna). Działa to całkiem dobrze (około 90% makra F-1 na zestawie testowym, prawie 100% na zestawie treningowym). Dużym problemem są niewidoczne słowa / n-gram. …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.