Mam doświadczenie w programowaniu komputerowym i elementarnej teorii liczb, ale nie mam prawdziwego treningu statystycznego, a ostatnio „odkryłem”, że niesamowity świat całej gamy technik jest w rzeczywistości światem statystycznym. Wydaje się, że faktoryzacje macierzy, kompletacja macierzy, tensory wielowymiarowe, osadzanie, szacowanie gęstości, wnioskowanie bayesowskie, partycje Markowa, obliczenia własne, PageRank są technikami wysoce statystycznymi, a algorytmy uczenia maszynowego, które wykorzystują takie rzeczy, używają wielu statystyk .
Moim celem jest umiejętność czytania artykułów omawiających takie rzeczy oraz wdrażania lub tworzenia algorytmów, przy jednoczesnym zrozumieniu notacji, „dowodów” i użytych argumentów statystycznych. Wydaje mi się, że najtrudniejszą rzeczą jest śledzenie wszystkich dowodów, które dotyczą macierzy.
Jakie podstawowe dokumenty mogą mi pomóc? A może dobry podręcznik z ćwiczeniami, które warto przepracować?
W szczególności niektóre artykuły, które chciałbym całkowicie zrozumieć, to:
- Dokładne uzupełnienie macierzy poprzez Convex Optimization, Candes, Recht, 2008
- Szybka transformacja Cauchy'ego i szybsza solidna regresja liniowa, Clarkson i in., 2013
- Random Projections for Support Vector Machines, Paul i in., 2013
- Wysoko-wymiarowe oszacowanie prawdopodobieństwa za pomocą modeli o dużej gęstości, Rippel, Adams, 2013
- Uzyskiwanie oszacowań minimalizujących błędy i uniwersalnych limitów błędów wejściowych dla ukończenia macierzy niskiej rangi, Király, Theran, 2013