Odpowiedzi:
p = 2
(Istnieją również normy , które są definiowane analitycznie, z wyjątkiem funkcji zamiast wektorów lub sekwencji - tak naprawdę to samo, ponieważ wektory są funkcjami o domenach skończonych).
Nie znam żadnego zastosowania normy w aplikacji do uczenia maszynowego, gdzie , z wyjątkiem sytuacji, gdy . Zwykle widzisz lub , lub czasami gdzie chcesz złagodzić przypadek ; nie jest ściśle wypukły w , alep = ∞ p = 2 p = 1 1 < p < 2 p = 1 ‖ → x ‖ 1 → x ‖ → x ‖ p jest dla . W niektórych przypadkach może to ułatwić znalezienie rozwiązania.
W kontekście regulacji, jeśli dodasz do funkcji celu, mówisz, że oczekujesz, że będzie rzadki , to znaczy składa się głównie z zer. To trochę techniczne, ale w zasadzie, jeśli istnieje→ x gęste rozwiązanie, prawdopodobnie istnieje rzadsze rozwiązanie z tą samą normą. Jeśli oczekujesz, że twoje rozwiązanie będzie gęste, możesz dodać do celu, ponieważ wtedy znacznie łatwiej jest pracować z jego pochodną. Oba służą do tego, aby rozwiązanie nie miało zbyt dużej wagi.
Mieszana norma pojawia się, gdy próbujesz zintegrować kilka źródeł. Zasadniczo chcesz, aby wektor rozwiązania składał się z kilku elementów , gdzie jest indeksem jakiegoś źródła. normą jest po prostu -norm wszystkich -norms zbiera się w wektorze. Tj.
Celem tego nie jest „nadmierne sparsowanie” zestawu rozwiązań, powiedzmy za pomocą . Poszczególne elementy są rzadkie, ale nie ryzykujesz, że nukniesz cały wektor rozwiązania, biorąc normę ze wszystkich rozwiązań. Zamiast tego używasz norm na zewnątrz.
Mam nadzieję, że to pomaga.
Zobacz ten artykuł, aby uzyskać więcej informacji.