Skąd nazwa „jądro” w statystykach i ML?


21

Zostało to zadane na innych stronach SE w kontekście systemów operacyjnych i algebry liniowej, ale to samo pytanie mnie martwi w odniesieniu do metod jądra używanych w statystyce i uczeniu maszynowym.

Często mówi się, że jądra, np. W szacowaniu gęstości jądra lub SVM, reprezentują pewne podobieństwo, ale nie rozumiem, skąd pochodzi nazwa „jądro” i jaka jest jego symbolika.

Jaka jest etymologia jąder w kontekście statystyki i uczenia maszynowego?

Żeby było jasne, doskonale zdaję sobie sprawę z tego, czym jest jądro i jakie są jego główne właściwości, jestem ciekawy nazwy, ponieważ nie widzę, co ma wspólnego z ziarnem lub rdzeniem, ponieważ jest to najczęściej zdefiniowane w słowniki. A przynajmniej nie widzę głębszego znaczenia niż „istotna część metody”.

Odpowiedzi:


13

Możesz znaleźć informacje na ten temat, sprawdzając witrynę pod kątem najwcześniejszych znanych zastosowań niektórych słów matematyki prowadzonych przez matematyka Jeffa Millera. Informacje na temat etymologii słowa „jądro” można również znaleźć w standardowych źródłach słownika.

Pisząc po francusku, Fredholm (1903) użył słowa „noyau” (rdzeń), a Hilbert (1904) przyjął ten termin, ale napisał po niemiecku, uzyskując niemieckie słowo „kern” (rdzeń). Terminy te zostały użyte w kontekście pisania o równaniach całkowych w analizie funkcjonalnej. Wkrótce potem Bôcher (1909), pisząc po angielsku, używa terminu „jądro” w odniesieniu do tych samych obiektów. Termin rozprzestrzenia się następnie w anglojęzycznej literaturze na temat analizy funkcjonalnej, analizy Fouriera, a później prawdopodobieństwa i statystyki.

Według powyższego słownika, to słowo pochodzi od staroangielskiego i proto-germańskiego. Może odnosić się albo do nasienia, albo do rdzenia, centrum lub esencji przedmiotu. Wydaje się, że podobieństwo językowe między niemieckim „jądrem” a „jądrem” wynika z podobnych pochodnych historycznych. Słowo „jądro” ma pochodzić z hipotetycznego (zrekonstruowanego) proto-germańskiego słowa „kurną” (kukurydza). Opierając się na tej historii, wydaje się, że etymologicznie słowo „jądro” odnosi się do ziarna, rdzenia lub esencji i opiera się na anglikalizacji starego niemieckiego słowa oznaczającego kukurydzę.

AKTUALIZACJA: Ta odpowiedź została mocno zmodyfikowana, aby odzwierciedlić nowe informacje, na które zwróciłem uwagę użytkowników cbeleites i RM . Początkowo myślałem, że może to być ostatnia anglikacja słowa „kern”, ale źródła słownika sugerują, że słowo „kernel” w języku angielskim jest bardzo stare. Nie jestem językoznawcą, więc jedynie przedstawiam informacje z powyższych źródeł.


Nigdy nie słyszałem o Maxime Bôcher. Najpierw pomyślałem, że może to literówka dla Salomona Bochnera, który kilka lat później był między innymi bardzo duży (gigant) w integralnych jądrach.
Mark L. Stone,

To moja wina - nie jestem pewien, jak wpisać akcent. Jak to zrobiłeś?
Przywróć Monikę

1
Skopiowałem i wkleiłem z aukcji Wikipedii.
Mark L. Stone,

1
Chodziło mi o to, że wiedziałem, że Bochner był gigantem w ziarnach, ale nigdy nie słyszałem o Bocheru. Bochner był doradcą naukowym Samuela Karlina, od którego zacząłem kurs Total Positivity (całkowicie pozytywne jądra powodujące zmiany zmniejszające zmiany i tak dalej) jazz).
Mark L. Stone,

1
Nie jestem pewien, czy jądro jest anglikowaną wersją jądra, przynajmniej nie w sensie czegoś, co wydarzyło się nieco ponad 100 lat temu. Zawsze traktowałem to jako tłumaczenie: merriam-webster.com/dictionary/kernel definicja 1 nazywa się po niemiecku „Kern”. Np. Dla jabłka nasiona = Kerne, podczas gdy rdzeń = Kerngehäuse (dosłownie obudowa jądra).
cbeleites wspiera Monikę

13

Jądro jest używane wiele razy w uczeniu maszynowym i statystykach. Oto kilka przykładów:

  1. W Wsparcia Vector Machines jądro jest funkcją, która odwzorowuje dane do wyższej wymiarowej przestrzeni, gdzie problem staje się liniowo rozwiązywalne (oglądanie tego ).

  2. Szacowanie gęstości jądra

    Oszacowanie gęstości jądra jest nieparametrycznym sposobem oszacowania funkcji gęstości prawdopodobieństwa zmiennej losowej.

W tym kontekście jądro jest po prostu funkcją ważenia używaną do szacowania gęstości jądra. Ostatni link ma także kilka innych zastosowań słowa „ jądro” w statystykach.

  1. W Convolutional Neural Networks jądro to mała matryca, która służy do wykonania splotu obrazu z samym sobą. Zobacz tutaj .

We wszystkich tych przykładach jądro jest funkcją matematyczną używaną do pewnego rodzaju transformacji danych. Jądro jest zasadniczo stałą częścią tej transformacji. W zależności od wyboru jądra używanego do każdej transformacji możemy uzyskać inny efekt.


5
βeβxeβx

7
OP szuka etymologii jąder.
Franck Dernoncourt,

2
Czy użycie „jądra” w odniesieniu do pustej przestrzeni w algebrze liniowej ma jakiś związek z którymkolwiek z tych zastosowań w uczeniu maszynowym?
syntonicC
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.