Nie mogę powiedzieć z twojego pytania, jak jesteś biegły w matematyce lub gdzie kończysz naukę. Zakładam, że skoro jesteś inżynierem oprogramowania komputerowego, znasz algebrę, geometrię i być może rachunek różniczkowy.
Polecam rozpocząć naukę od czytania statystyk i rozumienia takich pojęć, jak opisy, eksploracyjna analiza danych, korelacja, rozkłady i tak dalej. Widzę, że wolisz książki niż filmy, więc spotkamy się w połowie drogi i dam ci kilka książek online, a także książkę lub dwie, które możesz kupić w formie drukowanej.
Po pierwsze, poleciłbym internetowy program studiów Penn State w zakresie statystyki . Możesz przeglądać każdy z ich kursów, korzystając z menu po lewej stronie. Po wybraniu kursu przewiń w dół jego stronę internetową i kliknij link z napisem „notatki z kursu online”. Notatki z tych kursów są czymś więcej niż notatkami i są czytane jak pełne książki. Są bardzo pouczające. Sprawdź także internetowy program studiów licencjackich Penn State w statystyce , na wypadek, gdybyś znalazł coś na kursie dla absolwentów, który jest zbyt zaawansowany i potrzebujesz „prostszego” wyjaśnienia.
Po drugie, przejrzyj Handbook of Biological Statistics autorstwa John H. McDonald. Nie daj się zwieść tytułowi; ta książka jest doskonałym podkładem do statystyki i analizy danych, które można zastosować w każdej dziedzinie.
Po trzecie, przejrzyj The Little Handbook of Statistics autorstwa Gerarda Dallala. Ponownie, nie daj się zwieść tytułowi; ta książka to kolejny klejnot, który poprowadzi cię przez kilka ważnych podstaw statystyki.
Po czwarte, sprawdź książkę Think Stats Allena Downeya. Istnieje darmowa wersja online wcześniejszej edycji; najnowsza edycja, którą musisz kupić. Warto jednak, szczególnie jeśli pracujesz w Pythonie. W tej książce autor uczy statystyki i analizy danych przy użyciu Pythona do analizy zestawów danych w świecie rzeczywistym (zabawkowych). To naprawdę świetna książka do opracowania.
Na koniec sprawdź Data Science od zera Joela Grusa. Ta książka koncentruje się bardziej na analizie danych (zamiast podstaw statystyki) i kładzie większy nacisk na uczenie maszynowe i modelowanie. Wykorzystuje Python (i stos nauki danych w Pythonie), aby przeprowadzić Cię przez analizę i analizę predykcyjną zestawów danych w świecie rzeczywistym (zabawkowych). Kolejna świetna książka do opracowania.