Zrobię to, chociaż nie jestem statystykiem, ale ląduję, wykonując wiele „modelowania” - statystycznego i niestatystycznego.
Najpierw zacznijmy od podstaw:
Czym dokładnie jest model?
Model jest reprezentacją rzeczywistości, choć bardzo uproszczoną. Pomyśl o „modelu” wosku / drewna dla domu. Możesz go dotknąć / poczuć / powąchać. Teraz model matematyczny jest przedstawieniem rzeczywistości za pomocą liczb.
Czym jest ta „rzeczywistość”, o której słyszę, że pytasz? W porządku. Pomyślcie więc o tej prostej sytuacji: gubernator waszego stanu wdraża politykę mówiącą, że cena paczki papierosów w przyszłym roku kosztowałaby teraz 100 USD. „Celem” jest zniechęcenie ludzi do kupowania papierosów, a tym samym ograniczenie palenia, a tym samym uczynienie palaczy zdrowszymi (ponieważ rzucili palenie).
Po 1 roku gubernator pyta cię - czy to był sukces? Jak możesz tak mówić? Przechwytujesz takie dane, jak liczba sprzedanych pakietów na dzień lub rok, odpowiedzi w ankiecie, wszelkie mierzalne dane, które możesz uzyskać, które są istotne dla problemu. Właśnie zacząłeś „modelować” problem. Teraz chcesz przeanalizować, co mówi ten „model” . Tutaj przydaje się modelowanie statystyczne. Możesz uruchomić prosty wykres korelacji / rozproszenia, aby zobaczyć, jak model „wygląda”. Możesz mieć ochotę określić przyczynowość, tj. Jeśli wzrost ceny doprowadziłby do zmniejszenia palenia lub czy w grę wchodziły inne mylące czynniki (np. Może to coś zupełnie innego, a twój model może tego nie zauważył?).
Teraz zbudowanie tego modelu odbywa się za pomocą „zestawu reguł” (bardziej przypominających wytyczne), tj. Co jest / nie jest legalne lub co ma / nie ma sensu. Powinieneś wiedzieć, co robisz i jak interpretować wyniki tego modelu. Budowanie / wykonywanie / interpretacja tego modelu wymaga podstawowej wiedzy statystycznej. W powyższym przykładzie musisz wiedzieć o wykresach korelacji / rozproszenia, regresji (jedno- i wielowymiarowej) i innych rzeczach. Sugeruję, aby przeczytać intuicyjną lekturę na temat rozumienia statystyk: co to jest wartość p To jest humorystyczne wprowadzenie do statystyki i nauczy cię „modelowania” od prostych do zaawansowanych (tj. Regresji liniowej). Następnie możesz kontynuować czytanie innych rzeczy.
Pamiętaj więc, że model jest reprezentacją rzeczywistości i że „Wszystkie modele są błędne, ale niektóre są bardziej przydatne niż inne” . Model jest uproszczoną reprezentacją rzeczywistości i prawdopodobnie nie możesz wziąć pod uwagę wszystkiego, ale musisz wiedzieć, co i czego nie należy uważać za dobry model, który może dać znaczące wyniki.
To się nie kończy. Możesz także tworzyć modele symulujące rzeczywistość! Tak zmieni się wiązka liczb w czasie (powiedzmy). Te liczby odwzorowują pewną sensowną interpretację w Twojej domenie. Możesz również stworzyć te modele, aby wydobywać dane, aby zobaczyć, jak różne środki odnoszą się do siebie (zastosowanie tutaj statystyk może być wątpliwe, ale na razie się nie martw). Przykład: Patrzysz na sprzedaż artykułów spożywczych w sklepie miesięcznie i zdajesz sobie sprawę, że ilekroć kupowane jest piwo, to jest też pakiet pieluszek (budujesz model, który przegląda zestaw danych i pokazuje ci to skojarzenie). To może być dziwne, ale może sugerować, że głównie ojcowie kupują to w weekend, kiedy dziecko siedzi swoje dzieci? Umieść pieluchy w pobliżu piwa, a możesz zwiększyć sprzedaż! Aaaa! Modelowanie :)
Są to tylko przykłady i w żadnym wypadku nie odniesienia do profesjonalnej pracy. Zasadniczo budujesz modele, aby zrozumieć / oszacować, jak funkcjonuje / działała rzeczywistość i podejmować lepsze decyzje na podstawie wyników. Statystyki czy nie, prawdopodobnie modelujesz całe życie, nie zdając sobie z tego sprawy. Powodzenia :)