Pracując jako specjalista ds. Danych w jednej z największych firm konsultingowych na świecie, mogę dać dwa centy, które są przydatne w pracy takiej jak moja. Wszystkie kursy są fajne i mają zastosowanie zarówno w badaniach, rozwoju, jak i doradztwie. Jednak niektóre kursy mogą być ważniejsze dla praktycznego zastosowania. Oświadczenie: To nie odzwierciedla opinii mojego pracodawcy i widziałem tylko kilka działów w Niemczech.
NAJBARDZIEJ PRZYDATNE KURSY:
- Wprowadzenie do szeregów czasowych
Jeśli pracujesz jako Data Scientist, na pewno od czasu do czasu sporządzisz prognozę. Ważne jest, aby zrozumieć wzorce, takie jak trendy, pierwiastki, sezonowość itp.
W praktyce będziesz mieć do czynienia z danymi o różnych częstotliwościach, takimi jak dane miesięczne lub kwartalne.
Przeczytaj zasadę i praktykę prognozowania , aby zrozumieć zastosowania prognozowania.
- Nowoczesne prognozy statystyczne i uczenie maszynowe
Ten kurs zwiększy Twoje szanse na uzyskanie dobrze płatnej pracy. Uczenie maszynowe jest skorelowane z wyższymi wynagrodzeniami niż statystyki klasyczne. Zdecydowanie warto wiedzieć takie rzeczy, jak dane dotyczące treningu i testów. Zawsze zbudujesz model i przetestujesz go.
Ze względu na znaczenie uczenia maszynowego ta strona nazywa się CrossValidated. hahahaha
PRZYDATNE TAKŻE:
- Modelowanie liniowe: teoria i zastosowania
- Wprowadzenie do analizy ekonometrycznej (rejestracja krzyżowa między statystykami i ekonem)
Te kursy wydają mi się bardzo podobne. Zakładam, że oba dotyczą głównie danych podłużnych i danych paneli. Jednak większość problemów związanych z regresją, z jakimi będziesz się borykać, gdy naukowiec zajmujący się danymi zajmuje się szeregami czasowymi. Miałem tylko jeden projekt z modelem selekcji Heckmana / regresją Tobita i kilkoma małymi rzeczami, w których spotkałem Count Data i Survival Analysis. Ogólne zadania klasyfikacyjne są bardziej rozpowszechnione w mojej firmie niż zadania regresyjne.
Najprawdopodobniej będziesz pracować w zespole z matematykami, statystykami i informatykami. Nie będą trzymać się modeli ekonometrycznych. Niemniej jednak solidne zrozumienie modeli liniowych i analiza ekonometryczna pomoże ci poradzić sobie z szeregami czasowymi i problemami z prognozowaniem.
Zależy to również od preferowanego języka programowania. R (a zwłaszcza Stata) są bardzo przydatne w modelach regresji. Python jest raczej przydatny do innych zadań.
Jak już stwierdził Michael Chernick, w ubezpieczeniach szeroko stosuje się zagadnienia mikroekonometryczne. Jeśli pracujesz w dziale ubezpieczeń na życie, kluczowe znaczenie będzie miała analiza przeżycia. Jednak większość badaczy danych nie ma takich zadań.
Możesz przejść przez ten zastosowany kurs podstaw ekonometrycznych przez UCLA i zastanowić się, jak daleko napotkasz takie pytania w swojej przyszłej pracy.
RATHER IRRELEVANT:
- Procesy stochastyczne (losowe spacery, dyskretne łańcuchy Markowa w czasie, procesy Poissona)
Nie będzie to przydatne jako Data Scientist. Być może możesz spotkać się z takimi modelami, jeśli pracujesz w dziale finansów ilościowych banku.
Teoria gier jest koncepcją teoretyczną, która praktycznie nie jest bezpośrednio stosowana w praktyce. W badaniach ekonomicznych i psychologicznych może być to pomocne, jednak nie leży to w klasycznym zakresie danych.
Nie wahaj się zapytać, czy powinienem być bardziej szczegółowy na temat niektórych kursów.