Wikipedia ma stronę z listą wielu rozkładów prawdopodobieństwa z linkami do bardziej szczegółowych informacji o każdej dystrybucji. Możesz przeglądać listę i podążać za linkami, aby lepiej poznać rodzaje aplikacji, w których zwykle używane są różne dystrybucje.
Pamiętaj tylko, że te rozkłady są używane do modelowania rzeczywistości i jak powiedział Box: „wszystkie modele są złe, niektóre modele są przydatne”.
Oto niektóre z typowych dystrybucji i niektóre z powodów, dla których są one przydatne:
Normalny: Przydaje się to do patrzenia na średnie i inne kombinacje liniowe (np. Współczynniki regresji) z powodu CLT. Związane jest to z tym, że jeśli wiadomo, że powstaje coś z powodu addytywnego działania wielu różnych małych przyczyn, wówczas normalna może być rozsądnym rozkładem: na przykład wiele biologicznych miar jest wynikiem wielu genów i wielu czynników środowiskowych, a zatem często są w przybliżeniu normalne .
Gamma: Odpowiednio wypaczona i przydatna w przypadku rzeczy o naturalnym minimum 0. Powszechnie stosowana w przypadku upływu czasu i niektórych zmiennych finansowych.
Wykładniczy: szczególny przypadek gamma. Jest bez pamięci i łatwo się skaluje.
Chi-kwadrat ( ): specjalny przypadek gammy. Powstają jako suma kwadratowych zmiennych normalnych (tak używanych dla wariancji).χ2)
Beta: Zdefiniowana między 0 a 1 (ale może być przekształcona tak, aby zawierała inne wartości), przydatna w przypadku proporcji lub innych wielkości, które muszą zawierać się w przedziale od 0 do 1.
Dwumianowy: Ile „sukcesów” z danej liczby niezależnych prób z takim samym prawdopodobieństwem „sukcesu”.
Poisson: wspólny dla zliczeń. Ładne właściwości, że jeśli liczba zdarzeń w danym okresie lub obszarze jest zgodna z Poissonem, to liczba w dwukrotności czasu lub obszaru nadal odpowiada Poissonowi (z dwukrotnością średniej): działa to na dodanie Poissons lub skalowanie z wartościami innymi niż 2)
Należy zauważyć, że jeśli zdarzenia występują w czasie, a czas między wystąpieniami następuje wykładniczo, to liczba występująca w danym okresie następuje po Poissonie.
Ujemny dwumianowy: Liczy się z minimum 0 (lub inną wartością w zależności od wersji) i bez górnej granicy. Koncepcyjnie jest to liczba „awarii” przed k „sukcesami”. Ujemny dwumian jest także mieszaniną zmiennych Poissona, których średnie pochodzą z rozkładu gamma.
Geometryczny: szczególny przypadek dla ujemnego dwumianu, w którym jest to liczba „awarii” przed pierwszym „sukcesem”. Jeśli obetniesz (zaokrąglisz w dół) zmienną wykładniczą, aby była dyskretna, wynik będzie geometryczny.
EstimatedDistribution
.