Zmienna binarna o wartościach 0, 1 może (zwykle) być skalowana do (wartość - średnia) / SD, co jest prawdopodobnie twoim wynikiem-Z.
Najbardziej oczywistym ograniczeniem jest to, że jeśli zdarzy ci się dostać wszystkie zera lub wszystkie z nich, to zaślepienie SD na ślepo oznaczałoby, że wynik Z jest nieokreślony. Istnieją przypadki, w których przypisuje się również zero, o ile wartość - średnia wynosi identycznie zero. Ale wiele rzeczy statystycznych nie ma większego sensu, jeśli zmienna jest naprawdę stałą. Mówiąc bardziej ogólnie, jeśli SD jest mała, istnieje większe ryzyko, że wyniki będą niestabilne i / lub słabo określone.
Problem z udzieleniem lepszej odpowiedzi na twoje pytanie polega właśnie na tym, jaki „algorytm uczenia maszynowego” rozważasz. Brzmi tak, jakby to był algorytm, który łączy dane dla kilku zmiennych, dlatego zwykle sensowne jest dostarczanie ich w podobnych skalach.
(PÓŹNIEJ) Ponieważ oryginalny plakat dodaje komentarze jeden po drugim, ich pytanie zmienia się. Nadal uważam, że (wartość - średnia) / SD ma sens (tzn. Nie jest nonsensowny) dla zmiennych binarnych, o ile SD jest dodatnie. Jednak regresja logistyczna została później nazwana aplikacją i do tego nie ma teoretycznego ani praktycznego zysku (a nawet pewnej utraty prostoty) do niczego innego niż podawanie zmiennych binarnych jako 0, 1. Twoje oprogramowanie powinno być w stanie dobrze sobie poradzić z że; jeśli nie, porzuć to oprogramowanie na rzecz programu, który potrafi. Jeśli chodzi o pytanie tytułowe: można, tak; powinienem nie