Przede wszystkim istnieje wiele, wiele różnych rodzajów symulacji w statystykach, a nawet więcej w otaczających polach. Samo powiedzenie „Symulacja” jest tak samo użyteczne jak powiedzenie „Model” - to znaczy niewiele.
Opierając się na pozostałej części twojego pytania, przypuszczam, że masz na myśli symulację Monte Carlo, ale nawet to jest trochę niejasne. Zasadniczo, co się dzieje, jest wielokrotnie pobierają próbki z pomocą dystrybucji (nie musi być normalny), aby wykonać niektóre analizy statystycznej na sztucznej populacji znana, ale losowe właściwości.
Cel tego dzieli się na dwie kategorie:
Czy moja metoda obsługuje X? : Zasadniczo symulujesz serię wielu losowych populacji ze znaną „właściwą” odpowiedzią, aby sprawdzić, czy nowa technika daje ci odpowiedź właściwą. Jako podstawowy przykład załóżmy, że opracowałeś nowy sposób pomiaru korelacji między dwiema zmiennymi, X i Y. Symulowałbyś dwie zmienne, w których wartość Y zależy od wartości X, wraz z jakiś losowy hałas. Na przykład Y = 0,25x + szum. Następnie utworzyłbyś populację z pewnymi losowymi wartościami X, niektórymi wartościami Y, które były równe 0,25x + liczbą losową, prawdopodobnie wiele tysięcy razy, a następnie pokazałeś, że przeciętnie, twoja nowa technika wydziela liczbę, która poprawnie pokazuje, że Y = 0,25x.
Co się zdarzy jeśli? Symulację można przeprowadzić jako analizę wrażliwości dla istniejącego badania. Powiedzmy na przykład, że przeprowadziłem badanie kohortowe, ale wiem, że mój pomiar ekspozycji nie jest zbyt dobry. Niepoprawnie klasyfikuje 30% moich pacjentów jako narażonych, kiedy nie powinni być, i klasyfikuje 10% moich pacjentów jako nienaświetlonych, kiedy nie powinni. Problem polega na tym, że nie mam lepszego testu, więc nie wiem, który jest który.
Wziąłbym moją populację i dałbym każdemu narażonemu podmiotowi 30% szansy na przejście na nienaświetlony, a każdemu nienaświetlonemu podmiotowi 10% szansy na przejście na narażony. Następnie tworzyłem tysiące nowych populacji, losowo ustalając, które podmioty się zmieniają, i ponownie przeprowadzałem analizę. Zakres tych wyników da mi dobre oszacowanie, jak bardzo mój wynik badania mógłby się zmienić, gdybym mógł poprawnie sklasyfikować wszystkich.
Oczywiście, jak zawsze, istnieje większa złożoność, niuans i użyteczność symulacji, w zależności od tego, ile chcesz kopać.