Jedną z motywów elastycznej siatki było następujące ograniczenie LASSO:
W przypadku lasso wybiera co najwyżej n zmiennych przed nasyceniem, ze względu na naturę problemu optymalizacji wypukłej. Wydaje się, że jest to cecha ograniczająca metodę wyboru zmiennych. Co więcej, lasso nie jest dobrze zdefiniowane, chyba że granica normy L1 współczynników jest mniejsza niż pewna wartość.
( http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9868.2005.00503.x/full )
Rozumiem, że LASSO jest kwadratowym problemem programistycznym, ale można go również rozwiązać za pomocą LARS lub elementarnego spadku gradientu. Ale nie rozumiem, gdzie w tych algorytmach napotykam problem, jeśli gdzie jest liczbą predyktorów, a jest wielkością próbki. I dlaczego ten problem rozwiązano za pomocą elastycznej siatki, w której zwiększam problem do zmiennych , które wyraźnie przekraczają .p n p + n p