Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
Mam zestaw danych obejmujący zestaw klientów w różnych miastach Kalifornii, czas dzwonienia dla każdego klienta oraz status połączenia (Prawda, jeśli klient odbierze połączenie i False, jeśli klient nie odbierze). Muszę znaleźć odpowiedni czas na dzwonienie do przyszłych klientów, aby prawdopodobieństwo odebrania połączenia było wysokie. Jaka jest najlepsza strategia dla tego …
Obecnie pracuję / prototypuję w notatniku Jupyter . Chcę uruchomić część mojego kodu na samodzielnej powłoce iPython . Na razie eksportuję kod iPython (plik -> pobierz jako), a następnie uruchamiam go w moim iPython (z% run). Działa, ale chciałbym wyeksportować tylko jedną komórkę lub zestaw komórek. Tak, że mogę uruchomić …
Mam zestaw danych zawierający 20000 próbek, z których każda ma 12 różnych funkcji. Każda próbka należy do kategorii 0 lub 1. Chcę trenować sieć neuronową i las decyzyjny, aby kategoryzować próbki, aby móc porównać wyniki i obie techniki. Pierwszą rzeczą, na którą natknąłem się, jest właściwa normalizacja danych. Jedna cecha …
Z definicji Relu jest max(0,f(x)). Następnie jej nachylenie jest zdefiniowany jako: 1 if x > 0 and 0 if x < 0. Czy nie oznacza to, że gradient zawsze wynosi 0 (znika), gdy x <0? Dlaczego więc mówimy, że Relu nie cierpi z powodu problemu znikania gradientu?
Biorąc pod uwagę trudne zadanie uczenia się (np. Wysoką wymiarowość, naturalną złożoność danych), głębokie sieci neuronowe stają się trudne do wyszkolenia. Aby złagodzić wiele problemów, można: Normalizuj dane && handpick jakości wybierz inny algorytm treningowy (np. RMSprop zamiast Gradient Descent) wybierz bardziej stromy gradient funkcji kosztu (np. Cross Entropy zamiast …
Początkujący w analityce za pomocą Pythona, więc proszę, bądź łagodny :-) Nie mogłem znaleźć odpowiedzi na to pytanie - przepraszam, jeśli jest już dostępna odpowiedź w innym formacie. Mam zestaw danych danych transakcji dla punktu sprzedaży detalicznej. Zmienne wraz z wyjaśnieniem to: sekcja: sekcja sklepu, str; nazwa_produktu: nazwa produktu, str; …
Mam zestaw danych zawierający dane dotyczące temperatury, opadów i plonów soi dla gospodarstwa przez 10 lat (2005–2014). Na podstawie tych danych chciałbym przewidzieć rentowności w 2015 r. Należy pamiętać, że zestaw danych zawiera CODZIENNE wartości temperatury i opadów, ale tylko 1 wartość rocznie dla plonu, ponieważ zbiory roślin mają miejsce …
Bardzo często w polecającym mamy dane użytkownika, które mają etykietę np. „Kliknięcie”. Aby poznać model, potrzebuję danych dotyczących kliknięć i braku kliknięć. Najprostszym podejściem do generowania jest pobranie par produktów użytkownika, których nie ma w danych kliknięć. Może to jednak wprowadzać w błąd. Przykład: user1, product1 (click) user2, product2 (click) …
Powiedzmy, że przewidujemy sprzedaż sklepu, a moje dane szkoleniowe mają dwa zestawy funkcji: Jedna dotyczy sprzedaży w sklepie z datami (pole „Sklep” nie jest unikalne) Jedna dotyczy typów sklepów (pole „Sklep” jest tutaj unikalne) Zatem macierz wyglądałaby mniej więcej tak: +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | Date | Sales | …
Szukam pakietu Python, który implementuje regresję liniową na wielu odmianach. (Uwaga terminologiczna: regresja wielowymiarowa dotyczy przypadku, w którym występuje więcej niż jedna zmienna zależna, podczas gdy regresja wielokrotna dotyczy przypadku, w którym istnieje jedna zmienna zależna, ale więcej niż jedna zmienna niezależna.)
Rozumiem, w jaki sposób ukryty model Markowa jest wykorzystywany w sekwencjach genomowych, takich jak znalezienie genu. Ale nie rozumiem, jak wymyślić konkretny model Markowa. Mam na myśli, ile stanów powinien mieć ten model? Ile możliwych przejść? Czy model powinien mieć pętlę? Skąd mieliby wiedzieć, że ich model jest optymalny? Czy …
Chciałbym porównać różnicę między tym samym słowem wymienionym w różnych źródłach. To jest, w jaki sposób autorzy różnią się w użyciu źle zdefiniowanych słów, takich jak „demokracja”. Krótki plan był Weź książki, w których wzmianka o „demokracji” to zwykły tekst W każdej książki, wymienić democracyzdemocracy_%AuthorName% Trenuj word2vecmodel na tych książkach …
Wydaje się, że w wielu pakietach sieci neuronowych sparowanie funkcji celu ma zostać zminimalizowane za pomocą funkcji aktywacji w warstwie wyjściowej. Na przykład dla liniowej warstwy wyjściowej używanej do regresji standardową (i często jedyną możliwością) jest funkcja celu z kwadratem błędu. Innym typowym parowaniem jest wyjście logistyczne i utrata dziennika …
Od jakiegoś czasu staram się zrozumieć uczenie się o wzmocnieniu, ale jakoś nie jestem w stanie wyobrazić sobie, jak napisać program do nauki o wzmocnieniu, aby rozwiązać problem związany ze światem sieci. Czy możesz zasugerować mi kilka podręczników, które pomogłyby mi zbudować jasną koncepcję uczenia się przez wzmocnienie?
Próbuję trenować sztuczną sieć neuronową z dwiema warstwami splotowymi (c1, c2) i dwiema warstwami ukrytymi (c1, c2). Używam standardowego podejścia do propagacji wstecznej. W przejściu wstecznym obliczam wartość błędu warstwy (delta) na podstawie błędu poprzedniej warstwy, wag poprzedniej warstwy i gradientu aktywacji w odniesieniu do funkcji aktywacji bieżącej warstwy. Mówiąc …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.