Czy silne doświadczenie matematyczne to całkowity wymóg ML? - odpowiedź i spekulacje na temat ML rozumianego jako statystyki ;-)
Około 1990 roku miałem nadzieję, że algebra komputerowa będzie pomocna, myślę, że jest, ale jest dość ograniczona. Ale z pewnością pomaga to w przyspieszeniu uczenia się matematyki (mniejsza potrzeba rozwijania umiejętności manipulacyjnych poprzez praktykę lub próba radzenia sobie z tym po prostu poprzez wykonywanie prostych ćwiczeń). Algebra liniowa Freda Szabo z Mathematica była tego doskonałym przykładem (ale wziąłem już zaawansowany kurs algebry liniowej na poziomie teorii).
Pracuję od 1988 r. (Wykorzystywanie intensywnych metod komputerowych do „konkretyzacji” twierdzeń i zasad ze statystyki - właśnie), aby odpowiedź była „nie” lub przynajmniej nie była konieczna (do celów statystycznych). Zawsze będzie można zrozumieć szybciej i bardziej ogólnie dzięki dodatkowym umiejętnościom matematycznym i zrozumieniu. Myślę, że zaczynam się zbliżać, ale trzeba manipulować reprezentacją modeli generujących prawdopodobieństwo i wnioskowania, które są ważne i przydatne w więcej niż tylko problemach z zabawkami.
Czy powinienem spróbować wypełnić puste pola matematyki przed kontynuowaniem ML?
To trudne przedsięwzięcie - w MHO prawie każdy, kto rozumie statystykę, doszedł do tego, ponieważ bardzo wygodnie manipulował standardem, a zwłaszcza niezbyt standardowymi reprezentacjami matematycznymi modeli generujących prawdopodobieństwo i matematycznych charakterystyk wnioskowania (górny x% statystyki matematycznej Phds). Więc nie chodzi tylko o zapoznanie się z podstawami, ale także o to, by czuć się komfortowo z matematyką. (Nawiasem mówiąc, dla mnie niezbędna była teoria Fouriera.)
Dlaczego te reprezentacje są trudne (nawet z dużą ilością matematyki)?
Gerd Gigerenzer w zasadzie ustalił, że nie ma problemu z prostą chorobą pozytywną / negatywną, biorąc pod uwagę test pozytywny / negatywny przy użyciu częstotliwości naturalnych ”. Wydaje się, że odniesienie do powiązanego pytania dobrze wykorzystuje ten http://www.autonlab.org/tutorials/prob18.pdf
Dlaczego trudno to uogólnić?
Dla testów k (powtórzonych i innych) - 2 ^ k
Dla testów, które przyjmują wartości v - v ^ k
Tak więc dla binarnych nieznanych - prawdopodobieństwo ścieżki próbki 2 * v ^ k
Dla p wielu niewiadomych binarnych 2 ^ p * v ^ k
Dla p wielu racjonalnych niewiadomych Q ^ p * v ^ k
Szybko przechodzi się do matematyki z licznymi i niepoliczalnymi nieskończonościami, aby sobie z tym poradzić, co nawet przy wiedzy matematycznej prowadzi do wielu nieporozumień i pozornych paradoksów (np. Paradoksu Borela?)
Ponadto występują niebezpieczne nieporozumienia od liniowego do nieliniowego (np. Ukryte niebezpieczeństwa związane z określeniem nieinformacyjnych osób, które wygrały Winbugs i inne MCMC bez informacji o wcześniejszej dystrybucji ) oraz interakcje i efekty losowe itp.