Wiem, że w Keras istnieje możliwość class_weightsdopasowania słownika parametrów, ale nie znalazłem żadnego przykładu. Czy ktoś byłby tak miły, aby go zapewnić? Nawiasem mówiąc, w tym przypadku właściwą praktyką jest po prostu ważenie klasy mniejszości proporcjonalnie do jej niedostatecznej reprezentacji?
Próbuję zacząć uczyć się o RNN i używam Keras. Rozumiem podstawowe założenie waniliowych warstw RNN i LSTM, ale mam problem ze zrozumieniem pewnej technicznej kwestii szkolenia. W dokumentacji keras napisano, że wejście do warstwy RNN musi mieć kształt (batch_size, timesteps, input_dim). Sugeruje to, że wszystkie przykłady treningu mają ustaloną długość …
Mam zamiar wytrenować dużą sieć LSTM z 2-3 milionami artykułów i walczę z błędami pamięci (używam AWS EC2 g2x2large). Dowiedziałem się, że jednym z rozwiązań jest zmniejszenie batch_size. Nie jestem jednak pewien, czy ten parametr dotyczy tylko problemów z wydajnością pamięci lub czy wpłynie to na moje wyniki. W rzeczywistości …
Ja nadal mylić o różnicę między Densei TimeDistributedDensena Keraschociaż istnieją już pewne podobne pytania zadawane tutaj i tutaj . Ludzie dużo dyskutują, ale nie uzgodniono wspólnie wniosków. I chociaż tutaj @fchollet stwierdził, że: TimeDistributedDensestosuje tę samą Dense(w pełni połączoną) operację do każdego pomiaru czasu tensora 3D. Nadal potrzebuję szczegółowej ilustracji, …
W jaki sposób można zaprogramować w bibliotece keras (lub tensorflow) szkolenie partycjonowania na wielu GPU? Powiedzmy, że jesteś w instancji Amazon ec2, która ma 8 procesorów graficznych i chciałbyś wykorzystać je wszystkie, aby trenować szybciej, ale twój kod dotyczy tylko jednego procesora lub karty graficznej.
Mam trochę samouczącej się wiedzy związanej z algorytmami uczenia maszynowego (podstawowe rzeczy typu Losowy Las i Regresja Liniowa). Postanowiłem rozgałęzić się i zacząć uczyć RNN z Keras. Patrząc na większość przykładów, które zwykle wiążą się z prognozami giełdowymi, nie znalazłem żadnych podstawowych przykładów implementacji wielu funkcji innych niż 1 kolumna …
Jak Keras oblicza dokładność na podstawie prawdopodobieństw klasowych? Powiedzmy, na przykład, że mamy 100 próbek w zestawie testowym, które mogą należeć do jednej z dwóch klas. Mamy również listę klasowych probabilitów. Jakiego progu używa Keras do przypisania próbki do jednej z dwóch klas?
Próbuję scalić dwa modele Keras w jeden model i nie jestem w stanie tego osiągnąć. Na przykład na załączonym rysunku chciałbym pobrać środkową warstwę o wymiarze 8 i użyć jej jako danych wejściowych do warstwy (ponownie o wymiarze 8) w Modelu a następnie połączyć Model i Model jako jeden Model.B …
Zaczynam uczyć się CNN za pomocą Keras. Korzystam z backendu theano. Nie rozumiem, jak ustawić wartości na: batch_size, kroki na epokę, validation_steps. Jaka powinna być wartość batch_size, liczba kroków na epokę i kroki sprawdzania poprawności, jeśli mam 240 000 próbek w zestawie szkoleniowym i 80 000 w zestawie testowym?
Chcę obliczyć precyzję, pamięć i wynik F1 dla mojego binarnego modelu KerasClassifier, ale nie znajduję żadnego rozwiązania. Oto mój rzeczywisty kod: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) model.add(Dense(1, …
Które są lepsze dla dokładności, czy są takie same? Oczywiście, jeśli używasz categorical_crossentropy, używasz jednego gorącego kodowania, a jeśli używasz sparse_categorical_crossentropy, kodujesz jako normalne liczby całkowite. Dodatkowo, kiedy jedno jest lepsze od drugiego?
Keras obsługuje zarówno TensorFlow i Theano jako backend: jakie są plusy / minusy wybierając jedną versus inne, oprócz faktu, że obecnie nie wszystkie operacje są realizowane przy backend TensorFlow?
Jestem trochę zagubiony w wyborze pomiędzy Keras (keras-team / keras) i tf.keras (tensorflow / tensorflow / python / keras /) dla mojego nowego projektu badawczego. Toczy się debata, w której Keras nie jest własnością nikogo, więc ludzie chętniej się do tego przyczyniają, a zarządzanie projektem będzie znacznie łatwiejsze w przyszłości. …
Jestem nowicjuszem w głębokim uczeniu się. Czy jest teraz jakiś sposób na użycie TensorFlow z procesorami graficznymi Intel? Jeśli tak, proszę wskazać mi właściwy kierunek. Jeśli nie, proszę dać mi znać, jakiej ramy (Keras, Theano itp.) Mogę użyć dla mojego zintegrowanego kontrolera graficznego Intel Core Xeon E3-1200 v3 / 4-tej …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.