Jakie obszary statystyki matematycznej są wysoce przydatne?


13

Zaraz kończę moje wyróżnienia w statystyce i naprawdę chcę zrobić doktorat, ponieważ uważam, że statystyki matematyczne są niezwykle interesujące. Obszary badań, w których najbardziej chcę zrobić doktorat, to procesy stochastyczne i szeregi czasowe.

Jednak po doktoracie chcę także kontynuować karierę w sektorze prywatnym. Zastanawiałem się, jakie obszary statystyki matematycznej są najczęściej wykorzystywane w sektorze prywatnym i w jakich rodzajach miejsc pracy?

Oczywiście nie zamierzam robić doktoratu tylko dlatego, że można go zatrudnić, ale czuję, że zdecydowanie jest to coś, co muszę rozważyć i dlatego potrzebuję porady.


4
Witamy w CV! Na tej stronie nie ma potrzeby mówić „dziękuję” na końcu swojego postu - może to początkowo wydawać się niegrzeczne, ale częścią filozofii tej witryny ( wycieczki ) jest „zadawanie pytań, uzyskiwanie odpowiedzi, brak rozpraszania uwagi” i oznacza to, że przyszli czytelnicy twojego pytania nie muszą czytać uprzejmości. Podobnie nie ma potrzeby podpisywania swojego imienia i nazwiska - nazwa użytkownika i link do strony użytkownika pojawiają się automatycznie u dołu każdego postu
Silverfish

6
Pytanie, które powinieneś zadać, to „jakie obszary będą poszukiwane za 5-6 lat?” Prawidłowa odpowiedź to: „Nie mamy pojęcia”.
Aksakal

@Aksakal, to pytanie nie powinno być dozwolone w CV, ponieważ byłoby oparte na opiniach, jak słusznie zauważyłeś. Odpowiedzi na to pytanie powinny być w miarę możliwości obiektywne i oparte na statystykach zatrudnienia. Biuro Statystyki Pracy w USA może być dobrym miejscem do rozpoczęcia PO.
StatsStudent

2
Zauważam, że istnieje tutaj rozdźwięk między pytaniem, które wydaje się koncentrować na tematach statystyki matematycznej, a odpowiedziami, które głównie koncentrują się na umiejętnościach . Nie jestem pewien, czy dzieje się tak, ponieważ pytanie nie jest do końca jasne, czego chce, ludzie nie czytają pytania, czy to sposób, w jaki ludzie mówią, że umiejętności są ważniejsze niż tematy!
Silverfish,

2
@Silverfish, co jeśli odpowiedzi są błędne? W rezultacie OP straci 6 lat życia. To tak wysoka cena, że ​​nawet nie próbowałbym mu odpowiedzieć. To także powinno mu powiedzieć, że może wcale nie powinien zadawać tego pytania. Może powinien wybrać obszar, który jest dla niego najbardziej interesujący. Jego życie nie zatrzyma się na 6 lat doktoratu. Ważne jest, aby żył tymi latami i cieszył się tym, co robi. Kto wie, jak długo mamy na Ziemi, każda chwila się liczy
Aksakal

Odpowiedzi:


22

Odpowiadam jako ktoś, kto rutynowo ocenia i zatrudnia analityków danych.

Jako osoba przechodząca ze studiów akademickich na karierę w sektorze prywatnym nie będziesz zatrudniony na podstawie umiejętności, które posiadasz. Świat badań akademickich w dziedzinie statystyki oraz dziedzina problemów danej firmy są zdecydowanie zbyt rozległe, aby zatrudniać je na podstawie bardzo precyzyjnie określonych konkretnych umiejętności.

Zamiast tego zostaniesz zatrudniony, ponieważ możesz wykazać się ogólną zdolnością do precyzyjnego myślenia, pragnieniem i talentem do rozwiązywania problemów, umiejętnością rozumienia i komunikowania abstrakcyjnych i złożonych pomysłów oraz różnorodnym zestawem umiejętności praktycznych i teoretycznych.

Tak więc, moja rada, a ja jestem tylko jednym facetem, rób to, co kochasz i rozwijaj pragnienie rozwiązywania problemów, niuansów i złożoności. Naucz się różnorodnego zestawu umiejętności i dobrze poznaj podstawy (lepiej niż temat badań)

Och, i naucz się programować.

To ma sens, dziękuję bardzo za przemyślaną odpowiedź. Czy są jakieś konkretne języki programowania, które poleciłbyś

Trudne pytanie bez odpowiedzi.

Moja osobista opinia jest taka, że ​​to naprawdę nie ma znaczenia, więc naucz się tego, który ci się podoba i który motywuje cię do dalszej nauki. Wielką przeszkodą jest naprawdę dobre uczenie się pierwszego języka. Po pierwszym nauczeniu się kolejnego (i innego i jeszcze innego) jest o wiele łatwiejsze, ponieważ już poradziłeś sobie z trudnymi wyzwaniami koncepcyjnymi.

Ale ucz się dobrze języka , dowiedz się, jak działa język i dlaczego został zaprojektowany tak, jak był. Napisz czysty kod, do którego nie boisz się wrócić. Traktuj pisanie kodu jako poważną odpowiedzialność, a nie niefortunną rzeczywistość. To sprawia, że ​​jest to zarówno bardziej satysfakcjonujące, jak i prawdziwa umiejętność, którą możesz reklamować.

Jeśli nadal potrzebujesz konkretnych porad, chciałbym powtórzyć @ssdecontrol, wolę język ogólnego przeznaczenia, który może wykonywać statystyki, niż język statystyk, który może (w pewnym sensie) wykonywać zadania ogólne.


3
@ Patty Znajomość języka ogólnego przeznaczenia jest wielkim atutem w firmach technologicznych, ponieważ pozwala „mówić tym samym językiem”, co programiści. Python to świetny wybór, ponieważ można go również używać do analizy danych i stanowi doskonałe wprowadzenie do „prawdziwego” programowania. SAS nie będzie cenny poza dużymi przedsiębiorstwami. I bez względu na to, dokąd się wybierasz, prawdopodobnie będziesz musiał znać trochę SQL. Skrypty powłoki to także dobre narzędzie, o którym należy przynajmniej wiedzieć.
shadowtalker

4
W odniesieniu zarówno do programowania, jak i rozwiązywania rzeczywistych problemów, jedną rekomendacją byłoby upewnienie się, że możesz poradzić sobie z niektórymi projektami z „surowymi” danymi (tj. Nie wszystkie zebrane i wstępnie przetworzone). Jeśli jesteś w stanie przeprowadzić syntezę danych / czyszczenie / kontrolę jakości w razie potrzeby, twoje umiejętności programowania będą dobrze przygotowane, niezależnie od wybranego języka.
GeoMatt22,

2
„Świat badań akademickich w statystyce i dziedzina problemów danej firmy jest zdecydowanie zbyt duża, aby zatrudnić ją na podstawie bardzo precyzyjnie określonych konkretnych umiejętności”. Tak i nie. Zdecydowanie możesz dostać pracę bez określonego zestawu umiejętności statystycznych (tzn. Doktorat jest zdecydowanie wystarczający, niezależnie od tematu badań), ale możesz też zostać agresywnie zatrudniony do określonego zestawu umiejętności. Jako anegdotę znam kogoś, kto odrzucił 4 oddzielne oferty od Google, ponieważ są zainteresowani jego pracą.
Cliff AB

2
@CliffAB To uczciwe. Ale myślę, że błędem Purse głębokie studium coś tylko dlatego, że firma będzie agresywnie cię zatrudnić.
Matthew Drury

2
Haha o „głębokich badaniach”, Matthew: Jestem pewien, że osoba @CliffAB wie, kto otrzymał cztery oferty od Google, pracuje nad głęboką nauką.
ameba mówi Przywróć Monikę

4

Jeśli interesują Cię umiejętności, które są „zbywalne”, powiedziałbym, że dowiesz się o różnych technikach modelowania (GLM, modele przeżycia zarówno ciągłe, jak i dyskretne, losowe lasy, wzmocnione drzewa), z naciskiem na przewidywanie, a nie szacowanie. Statystyka matematyczna może czasami zbyt mocno zawodzić w estymacji w modelach parametrycznych, próbując odpowiedzieć na pytania, które stają się nieistotne, gdy model nie jest dosłownie prawdziwy. Więc zanim zagłębię się zbyt głęboko w problem, zastanów się, czy nadal jest interesujący i ma zastosowanie, gdy model się nie trzyma, ponieważ nigdy nie będzie. Powinieneś być w stanie znaleźć wiele takich pytań w dziedzinie szeregów czasowych, jeśli właśnie tam leży jedno z twoich zainteresowań.

Proszę również docenić, że w analizie danych ze świata rzeczywistego występują wyzwania, do których może nie przygotować się sama edukacja statystyczna, dlatego rozważę uzupełnienie edukacji studium tematów takich jak relacyjne bazy danych i ogólne obliczenia. Te pola mogą być również bardzo fascynujące i oferują odświeżające spojrzenie na dane.

Wreszcie, jak już zauważył Matthew Drury, niezbędna jest umiejętność programowania. Pracowałbym nad tym, by stać się silnym z R i / lub Pythonem i zacząć uczyć się o SQL, z którym nieuchronnie się spotkasz. Wiele firm nadal korzysta z SAS, ale czy naprawdę chcesz dla niego pracować? Skompilowany język, taki jak C lub Java, również nie boli, ale nie jest to tak naprawdę krytyczne.


1
Zdecydowanie zgadzam się, że „Wszystkie modele są złe, niektóre modele są przydatne”. Jednak czy zgodziłbyś się, że formułowanie mechanistycznych modeli wyjaśniających (generatywnych) może mieć wartość, która może obejmować ukryte (nieobserwowane) parametry? Na przykład przy określaniu strategii generowania / gromadzenia danych. Mam wrażenie, że jest to może (miękki?) Podział na statystyki i uczenie maszynowe. Albo mogę się mylić. (Jestem w branży, ale technicznie nie jestem „naukowcem danych”).
GeoMatt22,

3

Jako ktoś, kto spędził karierę habilitacyjną w przemyśle, powiedziałbym to.

  1. Odpowiedź Matthew Drury'ego jest na pierwszym miejscu. Uwagi dsaxton na temat prognozowania i szacowania są również dobre.
  2. Naucz się programować za pomocą czegokolwiek, co pomoże ci szybko przejść szkołę. Bądź w tym dobry. Gdy jesteś biegły w jednym języku, inne są łatwe do odebrania i prawdopodobnie możesz to zrobić na koszt pracodawcy.
  3. Bazy danych nie będą się zmniejszać i prawdopodobnie nie uzyskają żadnego czystszego. Przewiduję, że techniki radzenia sobie z gigantycznymi, bałaganiarskimi / brakującymi danymi są przyzwoitym zakładem na następne dwie lub trzy dekady.

2

Większość obecnych odpowiedzi jest ukierunkowana na „naukę danych”, która jest zdecydowanie obszarem o wysokim poziomie zatrudnienia. Ponieważ w oryginalnym plakacie wspomniano o szczególnym zainteresowaniu procesami stochastycznymi i szeregami czasowymi, innym obszarem statystyki matematycznej *, który może być istotny, jest szacowanie przestrzeni stanu .

Służy to do oszacowania modeli, w których system ewoluuje w wyniku sprzężenia zwrotnego między wysoce ustrukturyzowanymi (quasi-) deterministycznymi procesami a wymuszaniem stochastycznym. Na przykład szacowanie przestrzeni stanu jest wszechobecne w pojazdach autonomicznych .

(* Obszar ten jest powszechnie uważany za część inżynierii lub innych dziedzin , ale z pewnością obejmuje statystyki matematyczne).


1

Nie sugerowałbym czegoś radykalnie nowego, ale jako profesjonalny zbieracz danych chciałbym podkreślić kilka kwestii.

  1. Wszystkie umiejętności rynkowe to nie tylko pakiet pojedynczych umiejętności izolowanych, ale stanowią one cały zsynchronizowany pakiet. A przez paczkę mam na myśli,

  2. Zestaw praktycznych umiejętności o bardzo wysokiej biegłości. Jak można sformułować sensowną ocenę, biorąc pod uwagę stos danych. A dla faceta z doktoratem (lub dla każdego, kto do niego przyjdzie), pracodawcy byliby bardziej zainteresowani wprowadzeniem rzeczywistego dopasowania poznawczego, które można przynieść z danym zestawem danych. Aby wyjaśnić, jako przykład,

  3. Zestaw umiejętności, które możesz wykorzystać do wydobywania danych z API, pisania kodeków i sterowników w procesie, jeśli okaże się, że proces jest trudny do tego stopnia, że ​​możesz nie być w stanie w pełni wykorzystać swojego potencjału. Następnie wykorzystując elementy analizy statystycznej do przekształcenia danych w informację. Ten proces jest tak surowy i tak autentyczny, że im bardziej zróżnicowana i głęboka jest nauka, tym lepsze informacje można uzyskać. Powiedziano mi kiedyś, że opanowanie matematyki, która może dać odpowiedź na problem, to jedno, ale interpretacja tej odpowiedzi w prawdziwym świecie to kolejna umiejętność.

  4. Na koniec, niezwykle ważne, czy możesz przedstawić wizualizacje swoich wniosków, aby każdy mógł je zobaczyć i zrozumieć, bez zadawania sobie więcej niż 3 pytań kontrolnych bez osoby spoza dziedziny pokrewnej. I tutaj podajesz swoją analogię do procesów w świecie rzeczywistym. Jest to trochę trudne, ale po opanowaniu zazwyczaj przynosi dobre dywidendy przez całą karierę.

Dla wszystkich tych, z mojego punktu widzenia, użyteczną wskazówką jest ciągłe zadawanie sobie pytania podczas studiowania nowych rzeczy, w jaki sposób można je zastosować w prawdziwym świecie. Tak, czasami robi się niezręcznie, gdy człowiek zagłębia się głęboko w abstrakcje, ale mimo to jest to nawyk bardzo warty tego, i często oddziela to, co jest nadające się do zatrudnienia, od tego, co bardzo wykształcone. Powodzenia!

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.