Jestem całkiem nowy w głębokim uczeniu się, ale myślę, że znalazłem właściwą sytuację w świecie rzeczywistym, aby zacząć z niej korzystać. Problem polega na tym, że używałem tylko takich algorytmów do przewidywania wyników. Do mojego nowego projektu potrzebuję informacji, aby nakarmić maszynę, aby zoptymalizować wyniki. Czy ktoś mógłby krótko wyjaśnić, jak mam postępować? Utknąłem.
Oto sytuacja:
Mam maszynę, która pobiera deski z różnymi gatunkami drewna dostępnymi na całej długości i musi ciąć je na bloki znajdujące się na liście cięcia. Ta maszyna zawsze wybierze najwyższy wynik, jaki może uzyskać z danej deski. Wynik uzyskuje się przez pomnożenie każdego bloku na powierzchni jego multiplikatora . Algorytm, który chcę zbudować, musi dać tej maszynie multiplikator dla każdego bloku wymienionego na liście elementów ciętych. Cały fizyczny wynik z tej maszyny będzie przechowywany na półkach przez robota, dopóki nie będzie potrzebny. Maszyna tnąca może obniżyć klasę części deski, jeśli pomaga osiągnąć wyższy wynik.
Wartość musi działać jako zachęta dla maszyny, aby dać mi blok, którego najbardziej potrzebuję, bez obniżania poziomu zbyt dużej ilości drewna.
CELE OPTYMALIZACYJNE
- Upewnij się, że każdy blok jest w magazynie, zanim będzie potrzebny, ale nie za wcześnie bez powodu
- Obniż jak najmniejszą powierzchnię drewna (niektóre gatunki są bardzo drogie)
Węzły wejściowe
- Czas potrzebny na ten blok
- Gatunek drewna dla tego bloku
- Potrzebna ilość tego bloku
- Obszar bloku (może?)
INFORMACJE ZWROTNE PRZEKAZANE ALGORYTMOWI
- Ilość czasu, zanim blok był gotowy (musi być jak najmniejszy)
- Obniżona powierzchnia drewna * liczba pominiętych gatunków
OCZEKIWANE DANE ZWROTU
- Mnożnik , które dadzą tego bloku optymalny swój priorytet w stosunku do innych
INFORMACJE, KTÓRE NIE MIAŁEM, ALE MOGŁEM ZNAĆ
- Średni stosunek każdego gatunku dla każdego gatunku drewna
Do tej pory doszedłem do wniosku, że może być konieczne, aby moje informacje zwrotne zostały zmiażdżone tylko jedną wartością, aby stał się węzłem wyjściowym. Problem polega na tym, że nie rozumiem, jak zrobić ten algorytm, aby określić multiplikator . Czy mylę się, próbując rozwiązać ten problem poprzez głębokie uczenie się?