Jaka jest różnica między funkcją a etykietą?


101

Śledzę samouczek dotyczący podstaw uczenia maszynowego i jest wspomniane, że coś może być funkcją lub etykietą .

Z tego, co wiem, cecha to właściwość używanych danych. Nie wiem, co to za etykieta, znam znaczenie tego słowa, ale chcę wiedzieć, co to znaczy w kontekście uczenia maszynowego.


Funkcje to pola używane jako dane wejściowe, a etykiety są używane jako dane wyjściowe. Jako prosty przykład zastanów się, jak przewidzieć, czy należy sprzedać samochód na podstawie przebiegu samochodu, roku itp. Tak / nie jest etykietą, a przebieg i rok będą cechami.
amcneil206

Odpowiedzi:


201

Krótko mówiąc, cechą jest wejście; etykieta jest drukowana. Dotyczy to zarówno problemów klasyfikacyjnych, jak i regresyjnych.

Cecha to jedna kolumna danych w zestawie wejściowym. Na przykład, jeśli próbujesz przewidzieć typ zwierzaka, który ktoś wybierze, Twoje dane wejściowe mogą obejmować wiek, region zamieszkania, dochód rodziny itp. Ostatnim wyborem jest etykieta, np. Pies, ryba, iguana, kamień, itp.

Po wytrenowaniu modelu, przekażesz mu zestawy nowych danych wejściowych zawierających te funkcje; zwróci przewidywaną „etykietę” (typ zwierzaka) dla tej osoby.


1
Zatem [wiek, region zamieszkania, dochód rodziny] będą „3 wektorami cech”. A w Keras macierz NumPy dla sieci LSTM byłaby [próbki, kroki czasowe, 3]?
naisanza

1
@naisanza: to z pewnością jedna możliwość. Nie jestem zaznajomiony z Kerasem, ale ta organizacja wysokiego szczebla z pewnością mogłaby być początkiem prawidłowego wdrożenia.
Prune

czy funkcja i zmienna to to samo?
Debadatta

Chciałbym stwierdzić, że „etykieta” zależy również od kontekstu; na przykład do uczenia modelu będą używane dane „oznaczone”. W tym przypadku etykieta jest podstawową prawdą, z którą porównywane są dane wyjściowe.
N.Atanasov

łał. świetna odpowiedź, dziękuję, to wyjaśnia wiele pytań na ten temat.
Andrew Ray

31

Funkcja:

W funkcji uczenia maszynowego oznacza właściwość danych szkoleniowych. Możesz też podać nazwę kolumny w zestawie danych treningowych.

Załóżmy, że to jest Twój zestaw danych treningowych

Height   Sex   Age
 61.5     M     20
 55.5     F     30
 64.5     M     41
 55.5     F     51
 .     .     .
 .     .     .
 .     .     .
 .     .     .

To tutaj Height, Sexa Ageto cechy.

etykieta:

Wynik uzyskany z modelu po przeszkoleniu nazywa się etykietą.

Załóżmy, że karmione powyższy zestaw danych do pewnego algorytmu i generuje model do przewidywania płci męskiej lub żeńskiej, jak w powyższym modelu przechodzą cechy jak age, heightetc.

Więc po obliczeniu zwróci płeć jako Mężczyzna lub Kobieta. To się nazywa etykieta


5

Oto bardziej wizualne podejście do wyjaśnienia koncepcji. Wyobraź sobie, że chcesz sklasyfikować zwierzę pokazane na zdjęciu.

Możliwe klasy zwierząt to np. Koty lub ptaki. W takim przypadku etykietą byłyby możliwe skojarzenia klas, np. Kot lub ptak, które przewiduje algorytm uczenia maszynowego.

Te cechy są wzór, kolory, formy, które są częścią obrazów np Furr, pióra lub więcej interpretacja niskiego poziomu, wartości pikseli.

Ptak Wytwórnia: Ptaki
Cechy: Pióra

Kot

Wytwórnia: Kot
Cechy: Furr


5

Weźmy przykład, w którym chcemy wykryć alfabet za pomocą odręcznych zdjęć. Dostarczamy te przykładowe obrazy do programu, a program klasyfikuje te obrazy na podstawie posiadanych funkcji.

Przykładem cechy w tym kontekście jest: litera 'C'może być traktowana jak wklęsły skierowany w prawo.

Pojawia się teraz pytanie, jak przechowywać te funkcje. Musimy je nazwać. Oto rola powstającej wytwórni. Etykieta daje się takimi cechami, aby odróżnić je od innych funkcji.

W ten sposób otrzymujemy etykiety jako dane wyjściowe, gdy są dostarczane z funkcjami jako danymi wejściowymi .

Etykiety nie są związane z uczeniem się bez nadzoru.


4

Warunek wstępny: podstawowe statystyki i ekspozycja na ML (regresja liniowa)

Można odpowiedzieć w zdaniu -

Są do siebie podobni, ale ich definicja zmienia się w zależności od potrzeb.

Wyjaśnienie

Pozwólcie, że wyjaśnię moje oświadczenie. Załóżmy, że masz zbiór danych, w tym celu rozważ exercise.csv. Każda kolumna w zestawie danych jest nazywana funkcjami. Płeć, wiek, wzrost, tętno, temperatura ciała i kalorie mogą stanowić jedną z różnych kolumn. Każda kolumna przedstawia różne cechy lub właściwości.

exercise.csv

User_ID  Gender Age  Height  Weight Duration    Heart_Rate  Body_Temp   Calories
14733363 male   68  190.0   94.0    29.0           105.0    40.8        231.0
14861698 female 20  166.0   60.0    14.0            94.0    40.3        66.0
11179863 male   69  179.0   79.0    5.0             88.0    38.7        26.0

Aby utrwalić zrozumienie i wyjaśnić zagadkę, weźmy dwa różne problemy (przypadek przewidywania).

PRZYPADEK 1: W tym przypadku możemy rozważyć użycie - Płeć, Wzrost i Waga, aby przewidzieć kalorie spalone podczas ćwiczeń. Ta prognoza (Y) Kalorii jest tutaj etykietą . Kalorie to kolumna, którą chcesz przewidzieć przy użyciu różnych funkcji, takich jak - x1: płeć, x2: wysokość i x3: waga .

PRZYPADEK2: W drugim przypadku tutaj możemy chcieć przewidzieć Heart_rate, używając funkcji Gender and Weight. Tutaj Heart_Rate to etykieta przewidywana przy użyciu funkcji - x1: Płeć i x2: Waga .

Gdy zrozumiesz powyższe wyjaśnienie, nie będziesz już tak naprawdę mylony z etykietą i funkcjami.


3

Krótko wyjaśnioną funkcją byłoby wejście, które wprowadziłeś do systemu, a etykieta byłaby oczekiwanym wyjściem. Na przykład karmiłeś wiele cech psa, takich jak wzrost, kolor sierści itp., Więc po obliczeniu zwróci on rasę psa, którego chcesz poznać.


0

Załóżmy, że chcesz przewidzieć klimat, a następnie otrzymane funkcje to historyczne dane klimatyczne, aktualna pogoda, temperatura, prędkość wiatru itp., A etykiety to miesiące. Powyższa kombinacja może pomóc w prognozowaniu.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.