Oto o wiele łatwiejszy sposób na zrozumienie:
Możesz spojrzeć na rozkład dwumianowy jako „matkę” większości rozkładów. Rozkład normalny jest jedynie przybliżeniem rozkładu dwumianowego, gdy n staje się wystarczająco duże. W rzeczywistości Abraham de Moivre zasadniczo odkrył rozkład normalny, próbując przybliżyć rozkład dwumianowy, ponieważ szybko wymyka się obliczeniom rozkładu dwumianowego, ponieważ n rośnie, zwłaszcza gdy nie masz komputerów ( odniesienie ).
Rozkład Poissona jest także kolejnym przybliżeniem rozkładu dwumianowego, ale utrzymuje się znacznie lepiej niż rozkład normalny, gdy n jest duże, a p jest małe, a dokładniej, gdy średnia jest w przybliżeniu taka sama jak wariancja (pamiętaj, że dla rozkładu dwumianowego średnia = np i var = np (1-p)) ( odniesienie ). Dlaczego ta szczególna sytuacja jest tak ważna? Wygląda na to, że dużo się to dzieje w prawdziwym świecie i dlatego mamy to „specjalne” przybliżenie. Poniższy przykład ilustruje scenariusze, w których przybliżenie Poissona działa naprawdę świetnie.
Przykład
Mamy centrum danych obejmujące 100 000 komputerów. Prawdopodobieństwo awarii dowolnego komputera dzisiaj wynosi 0,001. Średnio np. 100 komputerów ulega awarii w centrum danych. Jakie jest prawdopodobieństwo, że dzisiaj tylko 50 komputerów ulegnie awarii?
Binomial: 1.208E-8
Poisson: 1.223E-8
Normal: 1.469E-7
W rzeczywistości jakość aproksymacji dla rozkładu normalnego spada w dół, gdy idziemy na ogon rozkładu, ale Poisson nadal trzyma się bardzo ładnie. W powyższym przykładzie zastanówmy się, jakie jest prawdopodobieństwo, że dzisiaj tylko 5 komputerów ulegnie awarii?
Binomial: 2.96E-36
Poisson: 3.1E-36
Normal: 9.6E-22
Mamy nadzieję, że daje to lepsze intuicyjne zrozumienie tych 3 dystrybucji.