Pracuję na modelu Seq2Seq przy użyciu LSTM z Keras (przy użyciu tła Theano) i chciałbym zrównoleglić procesy, ponieważ nawet kilka MB danych potrzebuje kilku godzin na szkolenie.
Oczywiste jest, że procesory graficzne są znacznie lepsze w równoległości niż procesory. W tej chwili mam tylko procesory do pracy. Miałem dostęp do 16 procesorów (2 wątki na rdzeń X 4 rdzenie na gniazdo X 2 gniazda)
Z DOC wielordzeniowych wsparcia w Theano, udało mi się wykorzystać wszystkie cztery rdzenie z jednego gniazda. Zasadniczo więc procesor jest wykorzystywany w 400% przy 4 procesorach, a pozostałe 12 procesorów pozostaje nieużywanych. Jak też z nich korzystać. Tensorflow można również zastosować zamiast tła Theano, jeśli działa.