Rozsądnie jest wziąć pod uwagę nie tylko korelację zaangażowania zasobów z kosztami, ale także zwrot z kosztu zaangażowania zasobów. Typowym wyzwaniem jest to, że zwroty te prawie zawsze kumulują się lub są opóźnione. Przypadkiem kumulacji jest sytuacja, gdy zasobem jest ciągłe dostrajanie lub doskonalenie procesu, którego brak spowalnia generowanie przychodów. Przypadek opóźnienia występuje wtedy, gdy zasoby badawcze ponoszą koszty przez pewien czas bez wpływu na przychody, ale generowanie przychodów, które rozpoczyna się, gdy badania przynoszą produktywne wyniki, może być istotnym czynnikiem przekraczającym całkowity koszt dostarczonych wyników.
Powodem, dla którego dane o kosztach same w sobie mogą prowadzić do nieprzystosowującego uczenia się sieci, jest to, że sieć, która jest przeszkolona, na przykład, do ograniczenia wydatków marketingowych, wyzeruje je. Zwykle powodowałoby to tendencję spadkową sprzedaży, dopóki firma się nie załamie. Bez uwzględnienia zwrotów w informacjach o szkoleniu nie może nastąpić użyteczne uczenie się.
Podstawowy MLP (perceptron wielowarstwowy) nie nauczy się charakterystyki czasowej danych, aspektów akumulacji i opóźnień. Potrzebujesz sieci stanowej. Najbardziej konsekwentnym typem sieci dla tego rodzaju uczenia się od tego pisania jest typ sieci LSTM (pamięć krótkotrwała) lub jeden z jego wariantów pochodnych. Dane o przychodach i saldzie muszą być wykorzystywane w połączeniu z danymi o kosztach do szkolenia sieci w zakresie przewidywania wyników biznesowych dla dowolnej sekwencji proponowanych zleceń dotyczących zasobów (w pełni szczegółowy plan budżetowy).
Funkcja strat musi odpowiednio równoważyć sortowane terminy z średnio- i długoterminowymi celami finansowymi. Ujemne dostępne środki pieniężne powinny spowodować wyraźny wzrost funkcji straty, aby nauczyć się takiego unikania podstawowych zagrożeń dla reputacji i kosztów kredytu.
Które kolumny w Twoich danych mają silną korelację z zwrotem z inwestycji, trudno jest z góry ustalić. Możesz natychmiast wykluczyć kolumny spełniające jedno z poniższych kryteriów.
- Zawsze pusty
- Inne stałe, które mają tę samą wartość dla każdego wiersza
- Te, które zawsze można uzyskać z innych kolumn
Dane można zmniejszyć na inne sposoby
- Pełny opis danych poprzez proste opisywanie trendów
- Używanie indeksów do określania długich łańcuchów ze 100% dokładnością poprzez przypisywanie każdemu łańcuchowi liczby
- Kompresja
- W przeciwnym razie zmniejsza się nadmiarowość danych
KMS (ograniczone maszyny Boltzmanna) mogą wyodrębniać funkcje z danych, a PCA mogą oświetlać kolumny o niskiej zawartości informacji, ale znaczenie kolumn pod względem ich korelacji z przychodami nie zostanie zidentyfikowane przy użyciu tych urządzeń w ich podstawowej formie.