Jaka jest różnica między spadkiem gradientu a spadkiem gradientu stochastycznego? Nie znam ich zbyt dobrze, czy możesz opisać różnicę krótkim przykładem?
Zamknięte . To pytanie jest oparte na opiniach . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby można było na nie odpowiedzieć faktami i cytatami, edytując ten post . Zamknięte 5 lat temu . Nie wiem, czy to właściwe miejsce, aby zadać to pytanie, ale moim zdaniem …
Istnieje wiele technik wizualizacji zestawów danych o dużych wymiarach, takich jak T-SNE, izomapa, PCA, nadzorowany PCA itp. I przechodzimy przez ruchy rzutowania danych do przestrzeni 2D lub 3D, więc mamy „ładne zdjęcia” „. Niektóre z tych metod osadzania (uczenie się na wiele sposobów) opisano tutaj . Ale czy to „ładne …
Czy lepiej jest kodować funkcje takie jak miesiąc i godzina jako czynnik lub wartość liczbowa w modelu uczenia maszynowego? Z jednej strony uważam, że kodowanie numeryczne może być rozsądne, ponieważ czas jest procesem postępowym (po piątym miesiącu następuje szósty miesiąc), ale z drugiej strony uważam, że kodowanie kategoryczne może być …
Obecnie pracuję z Python i Scikit uczyć się do celów klasyfikacji i czytając GridSearch, pomyślałem, że to świetny sposób na optymalizację parametrów estymatora, aby uzyskać najlepsze wyniki. Moja metodologia jest następująca: Podziel moje dane na szkolenie / test. Użyj GridSearch z 5-krotną weryfikacją krzyżową, aby trenować i testować moje estymatory …
Czytałem o rozwiązaniu tego wyzwania OTTO Kaggle i rozwiązanie na pierwszym miejscu wydaje się wykorzystywać kilka transformacji dla danych wejściowych X, na przykład Log (X + 1), sqrt (X + 3/8) itp. Czy istnieje ogólna wskazówka, kiedy zastosować rodzaj transformacji do różnych klasyfikatorów? Rozumiem pojęcia normalizacji średniej-zmiennej i minimalnej-maksymalnej. Jednak …
Często słyszę, jak ludzie mówią, dlaczego splotowe sieci neuronowe są nadal słabo poznane. Czy wiadomo, dlaczego splotowe sieci neuronowe zawsze uczą się coraz bardziej wyrafinowanych funkcji w miarę wchodzenia na kolejne warstwy? Co spowodowało, że stworzyli taki zestaw cech i czy dotyczyłoby to również innych typów głębokich sieci neuronowych?
Szukam artykułu szczegółowo opisującego podstawy głębokiego uczenia się. Idealnie jak kurs Andrew Ng do głębokiego uczenia się. Czy wiesz, gdzie mogę to znaleźć?
Jak obliczyć mAP (średnia średnia precyzja) dla zadania wykrywania dla liderów Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Tam powiedział - na stronie 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Średnia precyzja (AP). Do oceny VOC2007 zastosowano interpolowaną średnią precyzję (Salton i Mcgill 1986) do oceny zarówno klasyfikacji, jak i wykrywania. Dla danego zadania i klasy krzywa precyzji …
Chcę obliczyć precyzję, pamięć i wynik F1 dla mojego binarnego modelu KerasClassifier, ale nie znajduję żadnego rozwiązania. Oto mój rzeczywisty kod: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) model.add(Dense(1, …
Ostatnio mój przyjaciel został zapytany, czy algorytmy drzewa decyzyjnego są algorytmami liniowymi czy nieliniowymi w wywiadzie. Próbowałem poszukać odpowiedzi na to pytanie, ale nie znalazłem satysfakcjonującego wyjaśnienia. Czy ktoś może odpowiedzieć i wyjaśnić rozwiązanie tego pytania? Jakie są też inne przykłady nieliniowych algorytmów uczenia maszynowego?
Zastanawiam się, czy istnieje scenariusz, w którym zejście gradientu nie jest zbieżne do minimum. Zdaję sobie sprawę, że nie zawsze gwarantuje się, że zejście gradientu zbliży się do globalnego optimum. Wiem również, że może różnić się od optymalnego, jeśli powiedzmy, że stopień jest zbyt duży. Wydaje mi się jednak, że …
Podczas czytania tego artykułu pojawia się wiersz „klasyfikatory liniowe nie dzielą parametrów między cechami i klasami”. Jakie jest znaczenie tego stwierdzenia? Czy to oznacza, że klasyfikatory liniowe, takie jak regresja logistyczna, potrzebują cech, które są od siebie niezależne?
Kiedy czytałem o używaniu StandardScaler, większość zaleceń mówiła, że powinieneś użyć StandardScaler przed podzieleniem danych na pociąg / test, ale kiedy sprawdzałem niektóre kody opublikowane online (za pomocą sklearn), były dwa główne zastosowania. 1- Korzystanie StandardScalerze wszystkich danych. Na przykład from sklearn.preprocessing import StandardScaler sc = StandardScaler() X_fit = sc.fit(X) …
Zastanawiałem się, jak musimy zdecydować, ile węzłów w ukrytych warstwach i ile ukrytych warstw umieścić, gdy budujemy architekturę sieci neuronowej. Rozumiem, że warstwa wejściowa i wyjściowa zależy od posiadanego zestawu szkoleniowego, ale jak decydujemy o warstwie ukrytej i ogólnej architekturze w ogóle?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.