Ostatnio dowiedziałem się, że jednym ze sposobów znajdowania lepszych rozwiązań problemów ML jest tworzenie funkcji. Można to zrobić, na przykład sumując dwie funkcje.
Na przykład, mamy dwie cechy: „atak” i „obrona” jakiegoś bohatera. Następnie tworzymy dodatkową funkcję o nazwie „total”, która jest sumą „ataku” i „obrony”. Teraz wydaje mi się dziwne, że nawet trudny „atak” i „obrona” są prawie idealnie skorelowane z „całkowitą”, wciąż zdobywamy przydatne informacje.
Jaka jest matematyka? Czy może moje rozumowanie jest błędne?
Ponadto, czy nie jest to problemem dla klasyfikatorów takich jak kNN, że „suma” będzie zawsze większa niż „atak” lub „obrona”? Zatem nawet po standaryzacji będziemy mieć funkcje zawierające wartości z różnych zakresów?