Mam kilka pytań dotyczących kary za kalenicę w kontekście najmniejszych kwadratów:
1) Wyrażenie to sugeruje, że macierz kowariancji X jest zmniejszona w kierunku macierzy diagonalnej, co oznacza, że (zakładając, że zmienne są znormalizowane przed procedurą) korelacja między zmiennymi wejściowymi zostanie obniżona. Czy ta interpretacja jest poprawna?
2) Jeśli jest to aplikacja skurczowa, dlaczego nie jest sformułowana w liniach , zakładając, że możemy w jakiś sposób ograniczyć lambda do [0,1] zakresu za pomocą normalizacji.
3) Co może być normalizacją dla aby można ją było ograniczyć do standardowego zakresu, takiego jak [0,1].
4) Dodanie stałej do przekątnej wpłynie na wszystkie wartości własne. Czy lepiej byłoby atakować tylko wartości pojedyncze lub zbliżone do liczby pojedynczej? Czy jest to równoważne ze stosowaniem PCA do X i zachowaniem głównych składników N przed regresją, czy też ma inną nazwę (ponieważ nie modyfikuje obliczeń kowariancji krzyżowej)?
5) Czy możemy uregulować kowariancję krzyżową, czy też ma ona jakieś zastosowanie, co oznacza
gdzie mała obniży kowariancję krzyżową. Oczywiście obniża to wszystkie jednakowo, ale być może istnieje mądrzejszy sposób, taki jak progowanie twarde / miękkie w zależności od wartości kowariancji.