Pytania i odpowiedzi dotyczące specjalistów ds. Danych, specjalistów od uczenia maszynowego oraz osób zainteresowanych zdobyciem wiedzy na temat tej dziedziny
To pytanie jest odpowiedzią na komentarz, który widziałem na inne pytanie. Komentarz dotyczył programu szkolenia Machine Learning na Coursera, podobnie jak „SVM nie są obecnie tak często używane”. Właśnie ukończyłem odpowiednie wykłady i rozumiem SVM, ponieważ są one solidnym i wydajnym algorytmem uczenia się do klasyfikacji oraz że podczas korzystania …
Z wikipedii, redukcja wymiarów lub redukcja wymiarów to proces zmniejszania liczby rozważanych zmiennych losowych, który można podzielić na wybór cech i ekstrakcję cech. Jaka jest różnica między wyborem funkcji a ekstrakcją funkcji? Jaki jest przykład zmniejszenia wymiarów w zadaniu przetwarzania języka naturalnego?
Logika często stwierdza, że przez niedopasowanie modelu zwiększa się jego zdolność do generalizowania. To powiedziawszy, wyraźnie w pewnym momencie niedopasowanie modelu powoduje pogorszenie modeli bez względu na złożoność danych. Skąd wiesz, kiedy Twój model osiągnął właściwą równowagę i nie jest niedopasowany do danych, które zamierza modelować? Uwaga: Jest to kontynuacja …
Niedawno przeczytałem komentarz Yan LeCuns na temat zwojów 1x1 : W sieciach konwekcyjnych nie ma czegoś takiego jak „w pełni połączone warstwy”. Istnieją tylko warstwy splotu z jądrem splotu 1x1 i pełną tabelą połączeń. Jest to zbyt rzadko rozumiany fakt, że ConvNets nie muszą mieć danych wejściowych o stałym rozmiarze. …
Myślałem o Rekurencyjnych Sieciach Neuronowych (RNN) i ich odmianach oraz Konwolucyjnych Sieciach Neuronowych (CNN) i ich odmianach. Czy te dwa punkty są sprawiedliwe: Użyj CNN, aby rozbić komponent (taki jak obraz) na podskładniki (takie jak obiekt w obrazie, taki jak kontur obiektu w obrazie itp.) Użyj RNN do tworzenia kombinacji …
Widzę wiele razy w opisie pracy dla analityka danych proszącego o doświadczenie w Pythonie / Javie i nie zwracam uwagi na R. Poniżej znajduje się osobisty e-mail, który otrzymałem od głównego analityka danych firmy, o którą aplikowałem przez linkin. X, dzięki za połączenie i wyrażenie zainteresowania. Masz dobre umiejętności analityczne. …
Wiedziałem, że Residual Network (ResNet) sprawił, że zwykła inicjalizacja He stała się popularna. W ResNet używana jest normalna inicjalizacja He , podczas gdy pierwsza warstwa używa jednolitej inicjalizacji He. Przejrzałem papier ResNet i papier „Zagłębiając się w prostowniki” (papier inicjalizacyjny He), ale nie znalazłem żadnej wzmianki o normalnym init vs. …
Jakie jest właściwe podejście i algorytm grupowania dla grupowania geolokalizacyjnego? Używam następującego kodu do grupowania współrzędnych geolokalizacji: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = kmeans2(whiten(coordinates), 3, iter = 20) plt.scatter(coordinates[:,0], coordinates[:,1], …
Pracuję nad projektem nauki danych za pomocą Pythona. Projekt składa się z kilku etapów. Każdy etap obejmuje pobranie zestawu danych, użycie skryptów Python, danych pomocniczych, konfiguracji i parametrów oraz utworzenie innego zestawu danych. Przechowuję kod w git, więc ta część jest objęta. Chciałbym usłyszeć o: Narzędzia do kontroli wersji danych. …
Kiedy zaczynałem od sztucznych sieci neuronowych (NN), pomyślałem, że będę musiał walczyć z nadmiernym dopasowaniem jako głównym problemem. Ale w praktyce nie mogę nawet sprawić, aby mój NN przekroczył barierę 20% poziomu błędu. Nie mogę nawet pobić mojego wyniku w losowym lesie! Szukam bardzo ogólnych lub niezbyt ogólnych wskazówek, co …
Utajone przydzielanie Dirichleta (LDA) i hierarchiczny proces Dirichleta (HDP) to procesy modelowania tematów. Główną różnicą jest to, że LDA wymaga specyfikacji liczby tematów, a HDP nie. Dlaczego to jest takie? A jakie są różnice, zalety i wady obu metod modelowania tematów?
Logika często stwierdza, że nadmierne dopasowanie modelu ogranicza jego możliwości uogólnienia, chociaż może to oznaczać jedynie, że nadmierne dopasowanie powstrzymuje model przed poprawą po określonej złożoności. Czy nadmierne dopasowanie powoduje pogorszenie modeli bez względu na złożoność danych, a jeśli tak, to dlaczego tak jest? Powiązane: Kontynuacja pytania powyżej: „ Kiedy …
Używam TensorFlow do eksperymentów głównie z sieciami neuronowymi. Chociaż przeprowadziłem już dość eksperymentów (problem XOR, MNIST, niektóre rzeczy związane z regresją ...), mam problem z wybraniem „właściwej” funkcji kosztu dla konkretnych problemów, ponieważ ogólnie można mnie uznać za początkującego. Przed przyjściem do TensorFlow kodowałem niektóre w pełni połączone MLP i …
Sieci neuronowe osiągają najlepsze wyniki w zadaniach widzenia komputerowego (patrz MNIST , ILSVRC , Kaggle Galaxy Challenge ). Wydaje się, że przewyższają każde inne podejście w Computer Vision. Ale są też inne zadania: Kaggle Molecular Activity Challenge Regresja: prognoza Kaggle Rain , również 2. miejsce Chwyć i podnieś 2. również …
R ma wiele bibliotek, które są przeznaczone do analizy danych (np. JAGS, BŁĘDY, ARULES itp.) I jest wspomniany w popularnych podręcznikach, takich jak: J.Krusche, Doing Bayesian Data Analysis; B.Lantz, „Uczenie maszynowe z R”. Widziałem wytyczną 5 TB, aby zestaw danych uważać za Big Data. Moje pytanie brzmi: czy R jest …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.