Wszyscy dobrze znamy dobrze udokumentowane w literaturze pojęcie, że optymalizacja LASSO (dla uproszczenia ogranicza tu uwagę na przypadek regresji liniowej) jest równoważny modelowi liniowemu z błędami Gaussa, w którym parametrom nadawany jest Laplace przed \ exp (- \ lambda \ | \ beta \ | _1) Wiemy również, że wyższy ustawia parametr strojenia, \ lambda , tym większa część parametrów zostaje ustawiona na zero. Biorąc to pod uwagę, mam następujące pytanie myślowe:
Weź pod uwagę, że z Bayesowskiego punktu widzenia możemy obliczyć prawdopodobieństwo późniejsze, że powiedzmy, niezerowe oszacowania parametrów leżą w dowolnym zbiorze przedziałów, a parametry ustawione na zero przez LASSO są równe zeru. Co mnie pomyliło, biorąc pod uwagę, że przeor Laplace'a jest ciągły (a właściwie absolutnie ciągły), to w jaki sposób na dowolnym zbiorze będącym iloczynem przedziałów i singletonów w \ {0 \} może być jakakolwiek masa ?