Jak nazywa się operator, który przyjmuje wektor kategoryczny i przekształca go w reprezentację binarną za pomocą kodowania „na gorąco”? Zastanawiam się, skoro piszę artykuł naukowy i potrzebuję do tego odpowiedniej nazwy.
Jak nazywa się operator, który przyjmuje wektor kategoryczny i przekształca go w reprezentację binarną za pomocą kodowania „na gorąco”? Zastanawiam się, skoro piszę artykuł naukowy i potrzebuję do tego odpowiedniej nazwy.
Odpowiedzi:
Statystycy nazywają kodowanie „na gorąco” jako kodowanie pozorowane . Jak sugerowali inni (w tym Scortchi w komentarzach), nie jest to dokładny synonim, ale jest to termin, który byłby zwykle używany w przypadku zmiennych kategorialnych zakodowanych w zakresie 0-1.
Zobacz także: „Zmienna manekina” kontra „zmienna wskaźnikowa” dla danych nominalnych / kategorialnych
To zależy od grupy docelowej.
Jak powiedział Tim , statystycy nazywają to kodowaniem pozornym i tego właśnie oczekiwałbym, opisując coś w rodzaju modelu regresji. „Uwzględniono zmienne kodowane jako atrapy, aby dostosować się do lokalizacji sklepu”. Wydaje mi się, że nazwanie go „gorącym kodowaniem” wydaje się nieco dziwne.
Jednak, jak powiedział inny Tim , kodowanie na gorąco jest dość powszechne w literaturze dotyczącej uczenia maszynowego. Słabo implikuje istnienie węzłów (jak w sieci neuronowej), fizycznych przewodów (w urządzeniu) lub czegoś podobnego, przynajmniej dla mnie.
Formalnie myślę, że stosujesz zestaw funkcji wskaźnikowych , ale prawdopodobnie jest to zbyt formalne poza dowodem.
Termin pochodzi od inżynierii elektronicznej. Pomyśl tylko, kto nazwałby 1 „gorącym”? Tylko ci, którzy pracują z elektrycznością, gdzie „gorący” lub „pod napięciem” oznacza, że drut ma potencjał elektryczny . „Jeden gorący” odnosi się do konstrukcji obwodu, w której poziom dyskretnego sygnału elektrycznego na jednym przewodzie byłby dekodowany na gorącym / zimnym na zestawie przewodów. Podejrzewam, że niektórzy uczący się maszynami z wykształceniem EE uznali tę analogię za przekonującą.
W ekonometrii i statystykach można napotkać dummy
lub indicator
zmienne, które są dość podobne, ponieważ służą one do reprezentowania odrębnych kategorii za pomocą ich odrębnych wskaźników. Jest jednak subtelna różnica. Na przykład wykonujesz manekiny K-1 dla kategorii K, ponieważ kategoria podstawowa odpowiada wszystkim manekinom ustawionym na 0. W przeciwieństwie do tego, myślę, że w jednym kodowaniu na gorąco masz K drutów, gdzie kategoria podstawowa będzie miała własny drut ( zmienna).
Jestem wyszkolony statystycznie, a ostatnio słyszałem o „kodowaniu na gorąco” w uczeniu maszynowym / comp sci lit. Zwykle określałem macierz jednopunktową jako macierz projektową / macierz danych / ramkę projektową.
W naukach fizycznych i inżynierii nazywa się to (uogólnioną) deltą Kroneckera .
W najprostszej formie, delta Kronekera jest zdefiniowana jako choć to w sposób trywialny uogólnione na δ [ warunek ] ≡ { 1 jeśli [ warunek ] 0 jeszcze .
Delta Kroneckera jest naprawdę przydatna w Sigma / Pi / Einstein / etc. notacje, ponieważ umożliwia warunkowe określenie warunków.
Aby odnieść to do typowych struktur programowania, delta Kroneckera condition?1:0
, gdzie ?:
jest operatorem warunkowym .
Pattern Recognition i Uczenia Maszynowego Christopher Bishop używa terminu-z- schemat.
Oto cytat z książki
Zmiennych binarnych można użyć do opisania wielkości, które mogą przyjąć jedną z dwóch możliwych wartości. Często jednak spotykamy zmienne dyskretne, które mogą przyjąć jedną z nichmożliwe wzajemnie wykluczające się stany. Chociaż istnieją różne alternatywne sposoby wyrażania takich zmiennych, wkrótce przekonamy się, że szczególnie dogodną reprezentacją jest-z- schemat, w którym zmienna jest reprezentowana przez a -wymiarowy wektor w którym jeden z elementów równa się , a wszystkie pozostałe elementy są równe . Na przykład, jeśli mamy zmienną, która może przyjąć stanów i szczególna obserwacja zmiennej odpowiada stanie, w którym , następnie będzie reprezentowany przez,