Relaksacja Lagrangian w kontekście regresji kalenicowej


15

W „Elementach uczenia statystycznego” (wydanie drugie), s. 63, autorzy podają następujące dwa sformułowania problemu regresji kalenicy:

β^ridge=argminβ{i=1N(yiβ0j=1pxijβj)2+λj=1pβj2}

i

β^ridge=argminβi=1N(yiβ0j=1pxijβj)2, subject to j=1pβj2t.

Uważa się, że te dwa są równoważne, i że istnieje przyporządkowanie jeden-do-jednego między parametrami i .λt

Wydaje się, że pierwsze sformułowanie jest lagranżowskim rozluźnieniem drugiego. Jednak nigdy nie miałem intuicyjnego zrozumienia, jak i dlaczego działają relaksacje Lagrangian.

Czy istnieje prosty sposób wykazania, że ​​te dwa preparaty są rzeczywiście równoważne? Gdybym musiał wybrać, wolałbym intuicję niż rygor.

Dzięki.


Jeśli potrzebujesz jedynie intuicyjnego wyjaśnienia, przejdź do 1.03.26 tego filmu (do końca), istnieje intuicyjne wyjaśnienie, w jaki sposób ograniczenia odnoszą się do funkcji celu.
user603

Odpowiedzi:


3

Korespondencję można najłatwiej pokazać za pomocą twierdzenia o kopercie .

λtλ

ttβλt

t

Zakładam, że taka jest korespondencja Hastie i in. odnoszą się do.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.