Norms - Co jest specjalnego w ?


13

normą jest unikalny (przynajmniej częściowo), ponieważ znajduje się na granicy między uwypuklony i wypukłe. normą jest „najbardziej rzadki” norma wypukły (prawda?). p = 1 L 1L1p=1L1

Rozumiem, że norma euklidesowa ma korzenie w geometrii i ma jasną interpretację, gdy wymiary mają te same jednostki. Ale nie rozumiem, dlaczego jest stosowany preferencyjnie w porównaniu z innymi liczbami rzeczywistymi : ? ? Dlaczego nie wykorzystać pełnego ciągłego zakresu jako hiperparametru?p > 1p=2p>1p = πp=1.5p=π

czego mi brakuje?


1
„Które aplikacje są używane preferencyjnie”? Normy są wszechobecne w matematyce, statystyce i fizyce; w niektórych podpólach niektóre normy są bardziej rozpowszechnione niż inne, ponieważ są bardziej znaczące lub prostsze w obsłudze. Z tego powodu odpowiedzi na to pytanie będą prawdopodobnie liczne i różnorodne (tak różnorodne, że osobiście uważam, że nie da się odpowiedzieć). Dlatego uczyniłem z tego post „Community Wiki” (CW); ale jeśli masz na myśli konkretną aplikację lub wąskie pole, uściślając swoje pytanie, powinno być możliwe usunięcie statusu CW.
whuber

Odpowiedzi:


12

Bardziej matematycznym wyjaśnieniem jest to, że przestrzeń , składająca się ze wszystkich szeregów zbiegających się w p-normie, to tylko Hilbert z i bez żadnej innej wartości. Oznacza to, że ta przestrzeń jest kompletna, a norma na tej przestrzeni może być indukowana przez produkt wewnętrzny (pomyśl o znanym iloczynie w ), więc jest trochę przyjemniej pracować. p = 2 R nlpp=2Rn


4

Oto kilka powodów:

  1. Jest to związane w bardzo szczególny sposób z produktem wewnętrznym: jest to jego własna podwójna norma (tj. Jest „podwójna”).
    Oznacza to, że jeśli weźmie się pod uwagę wszystkie wektory wewnątrz jednostkowej , ich maksymalny iloczyn wewnętrzny z dowolnym wektorem jest normą samej . Mniej fantazyjnie spełnia właściwość, że . Żadna inna norma zachowuje się w ten sposób.2z2zx22=xxp

  2. Ma bardzo dogodnie płynny gradient: Naprawdę nie możesz tego pokonać!

    x f(x)22=2 f(x)f(x)

2

Chociaż może być wiele innych powodów, ale AFAIK p = 2 jest preferowany z następujących powodów:

  • Miara podobieństwa / niepodobieństwa: dla p = 2 norma euklidesowa podaje miarę podobieństwa lub odmienności między dwoma wektorami, które można następnie wykorzystać do uzyskania lepszego wglądu w dane. Bardziej szczegółowe odpowiedzi na ten temat można znaleźć tutaj .
  • Regularyzacja: Norma L2 jest używana do regularyzacji w uczeniu maszynowym i jest preferowana z dwóch powodów: 1) Można ją łatwo rozróżnić 2) W przypadku regularyzacji L2 wagi mają tendencję do zmniejszania się proporcjonalnie do wag. W związku z tym regularyzacja L2 penalizuje większe ciężary w porównaniu do mniejszych ciężarów.

1

Błędy kwadratowe w modelach liniowych są często preferowane z powodu:

  • związek z ortogonalnością, który zachowuje się dobrze w odniesieniu do niektórych zjawisk losowych uważanych za hałas (nieskorelacja)
  • jest wypukły i zróżnicowany, nieL1
  • daje sprawdzalne algorytmy optymalizacji, gdy pochodna zamienia się w układ liniowy

L1 jest często uważane za wygodne zastępstwo lub wypukłe rozluźnienie do ścisłej rzadkości (liczba niezerowych terminów), co jest kombinatorycznie skomplikowane, patrz na przykład dla większości dużych nieokreślonych układów równań liniowych, minimalne rozwiązanie -normalne jest również Najrzadsze rozwiązanie1 . Niektórzy używają , aby wymusić większą rzadkość, kosztem „utraty” wypukłości.p0<p<1

Jednak zliczania jest niewrażliwa na skalowanie niezerowe. Pomnóż wektor przez stałą niezerową, liczba haseł niezerowych pozostanie taka sama. Zatem jest jednorodny na , podczas gdy wszystkie normy lub quasi-normy są jednorodne na poziomie . Nawet jeśli w jakiś sposób jako , ta rozbieżność wydaje mi się luką.0 0 p 1 p0 p 000p1p0p0

Tak więc, zgodnie z normami, niektórzy biorą pod uwagę (nie wypukłe) stosunki norm, takie jak , zobacz na przykład odniesienia w Euclid w Taxicab: Sparse Blind Deconvolution with Smoothed Regularization .1 / 21/21/2

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.