Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
Jestem 35-letnim specjalistą IT, który jest czysto techniczny. Jestem dobry w programowaniu, uczeniu się nowych technologii, ich zrozumieniu i wdrażaniu. Nie lubiłem matematyki w szkole, więc nie osiągałem dobrych wyników w matematyce. Jestem bardzo zainteresowany karierą w analityce Big Data. Bardziej interesuje mnie analityka niż technologie Big Data (Hadoop itp.), …
Jakich swobodnie dostępnych zestawów danych mogę użyć do szkolenia klasyfikatora tekstu? Staramy się zwiększyć zaangażowanie użytkowników, polecając mu najbardziej powiązane treści, więc pomyśleliśmy, że jeśli sklasyfikujemy nasze treści w oparciu o predefiniowany zestaw słów, możemy polecić mu angażujące treści, uzyskując jego opinie na temat losowej liczby postów już sklasyfikowanych przed. …
Mam dużą liczbę próbek, które reprezentują strumienie bitów zakodowane w Manchesterze jako sygnały audio. Częstotliwość, z jaką są one kodowane, jest głównym składnikiem częstotliwości, gdy jest wysoka, a w tle występuje stała ilość białego szumu. Ręcznie zdekodowałem te strumienie, ale zastanawiałem się, czy mógłbym użyć jakiejś techniki uczenia maszynowego do …
Mam ogromny zestaw danych z relacyjnej bazy danych, dla którego muszę utworzyć model klasyfikacji. Zwykle w tej sytuacji używałbym programowania logiki indukcyjnej (ILP), ale ze względu na szczególne okoliczności nie mogę tego zrobić. Innym sposobem rozwiązania tego problemu jest próba agregacji wartości, gdy mam relację zagraniczną. Mam jednak tysiące ważnych …
Jestem nowy w tej społeczności i mam nadzieję, że moje pytanie będzie tutaj pasować. W ramach mojego studiów licencjackich z zakresu analizy danych postanowiłem wykonać projekt dotyczący rozpoznawania działalności człowieka za pomocą zestawów danych ze smartfona. Jeśli chodzi o mnie, ten temat dotyczy maszyn uczenia maszynowego i obsługi wektorów. Nie …
Użyłem techniki smote do nadpróbkowania mojego zestawu danych, a teraz mam zrównoważony zestaw danych. Problem, z którym się spotkałem, polega na tym, że wskaźniki wydajności; precyzja, przywołanie, pomiar F1, dokładność w niezrównoważonym zbiorze danych są lepiej wykonywane niż w zbalansowanym zbiorze danych. Jakiego pomiaru mogę użyć, aby wykazać, że zestaw …
Próbuję trenować model w keras i używam ModelCheckpoint, aby zapisać najlepszy model zgodnie z monitorowaną miarą walidacji (w moim przypadku indeks Jaccard ). Chociaż widzę, że model poprawia się w tablicy tensorboard, to kiedy próbuję załadować ciężary i ocenić model, wcale nie działa. Ponadto po znaczniku czasu w pliku, w …
Jaki jest najlepszy sposób kategoryzacji podejść opracowanych w celu rozwiązania problemu klasy nierównowagi? W tym artykule podzielono je na: Przetwarzanie wstępne: obejmuje oversampling, undersampling i metody hybrydowe, Uczenie wrażliwe na koszty: obejmuje metody bezpośrednie i meta-nauczanie, które to ostatnie dzieli się na progi i pobieranie próbek Techniki zestawów: obejmują zestawy …
Mam dane dotyczące pozycji bocznej każdego pojazdu w czasie i numer pasa, jak pokazano na tych 3 wykresach na zdjęciu i przykładowe dane poniżej. > a Frame.ID xcoord Lane 1 452 27.39400 3 2 453 27.38331 3 3 454 27.42999 3 4 455 27.46512 3 5 456 27.49066 3 Pozycja …
Chciałbym wiedzieć, czy ludzie mają dobre tutoriale (szybkie i proste) na temat modeli tematów i LDA, ucząc intuicyjnie, jak ustawić niektóre parametry, co oznaczają i jeśli to możliwe, z prawdziwymi przykładami.
Jak zwiększyć liczbę drzew w scikit nauczyć „s GradientBoostingRegressor, mam więcej negatywnych prognoz, choć nie ma wartości ujemne w moim szkolenia lub testowania zestawu. Mam około 10 funkcji, z których większość jest binarna. Niektóre parametry, które tuningowałem to: liczba drzew / iteracji; głębokość uczenia się; i współczynnik uczenia się. Procent …
Na moim laptopie Dell Core i7 - 16 GB RAM - 4GB 960m GPU pracuję nad projektem klasyfikacji obrazów CT płuc przy użyciu 3d CNN. Używam wersji procesora tensorflow. Obrazy są przygotowywane jako tablica liczb numpy (25,50,50). Mój model CNN miał 2 warstwy konwekcyjne, dwie warstwy maxpool, jedną warstwę FC …
Właśnie zacząłem uczyć się sieci neuronowych do głębokiego uczenia się od cs231. Próbuję zaimplementować sieć neuronową w języku Python. Patrzę na używanie Tensorflow lub scikit-learn. Jakie są zalety i wady tych bibliotek dla tej aplikacji?
Zastanawiałem się więc, w jaki sposób można na przykład zoptymalizować model, który próbują zbudować, gdy napotykają problemy wynikające z dużej stronniczości lub dużej wariancji. Teraz oczywiście możesz grać z parametrem regularyzacyjnym, aby osiągnąć satysfakcjonujący koniec, ale zastanawiałem się, czy można to zrobić bez polegania na regularyzacji. Jeśli b jest estymatorem …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.