Kiedy czytamy książkę, zrozumienie zapisów odgrywa bardzo ważną rolę w zrozumieniu treści. Niestety różne społeczności mają różne konwencje zapisu w odniesieniu do formułowania modelu i problemu optymalizacji. Czy ktoś mógłby tutaj streścić niektóre zapisy formuł i podać możliwe powody?
Podam tutaj przykład: w literaturze algebry liniowej klasyczna książka jest wstępem Strang'a do algebry liniowej . Najczęściej używanym zapisem w książce jest
Gdzie jest macierzą współczynników , to zmienne do rozwiązania, a to wektor po prawej stronie równania . Powodem książka wybrać ten zapis jest głównym celem algebry liniowej rozwiązuje system liniowy i dowiedzieć się, co to jest wektor . Biorąc pod uwagę takie sformułowanie, istnieje problem optymalizacji OLS
W statystykach lub umiejętnościach uczenia maszynowego (z książki Elements of Statistics Learning ) ludzie używają różnych notacji, aby reprezentować to samo:
Gdzie to matryca danych , to współczynniki lub wagi, których należy się nauczyć , to odpowiedź. The reason ludzie używają to dlatego, że ludzie w statystykach lub społeczności uczenia maszynowego jest dane napędzane , więc dane i odpowiedzi są najbardziej interesującą rzeczą dla nich, gdzie używają i reprezentują.
Teraz możemy zobaczyć wszystkie możliwe zamieszanie: w pierwszym równaniu jest takie samo jak w drugim równaniu. I w drugim równaniu X nie jest czymś, co trzeba rozwiązać. Także dla terminów: A jest macierzą współczynników w algebrze liniowej, ale jest to dane w statystyce. β jest również nazywany „współczynnikami”.
Ponadto wspomniałem, że nie jest dokładnie tym, czego ludzie powszechnie używają w uczeniu maszynowym, ludzie używają wersji w połowie wektorowej, która podsumowuje wszystkie punkty danych. Jak na przykład
Myślę, że powodem tego jest to, że dobrze jest mówić o stochastycznym spadku gradientu i innych różnych funkcjach strat. Również zwięzła notacja macierzowa znika dla innych problemów niż regresja liniowa.
Notacja macierzowa dla regresji logistycznej
Czy ktoś mógłby podać więcej streszczeń zapisów w różnych literaturach? Mam nadzieję, że mądre odpowiedzi na to pytanie mogą być wykorzystane jako dobry punkt odniesienia dla osób czytających książki z różnych literatury.
proszę nie ograniczaj się do mojego przykładu oraz X β = y . Jest wiele innych. Jak na przykład
Dlaczego istnieją dwa różne formuły / notacje dotyczące utraty logistyki?