Przynajmniej dla mnie założenie o normalności wynika z dwóch (bardzo potężnych) powodów:
Twierdzenie o granicy centralnej.
Rozkład Gaussa jest rozkładem maksymalnej entropii (w odniesieniu do ciągłej wersji entropii Shannona).
Myślę, że zdajesz sobie sprawę z pierwszego punktu: jeśli twoja próbka jest sumą wielu procesów, to dopóki spełnione są pewne łagodne warunki, rozkład jest prawie gaussowski (istnieją uogólnienia CLT, w których tak naprawdę nie należy założyć, że wartości RV sumy są identycznie rozłożone, patrz np. CLT Lyapunova).
Drugi punkt to taki, który dla niektórych osób (szczególnie fizyków) ma większy sens: biorąc pod uwagę pierwszy i drugi moment rozkładu, rozkład, który zakłada mniej informacji (tj. Najbardziej konserwatywny) w odniesieniu do ciągłej miary entropii Shannona (która jest nieco arbitralne w przypadku ciągłym, ale, przynajmniej dla mnie, całkowicie obiektywne w przypadku dyskretnym, ale to inna historia), rozkład Gaussa. Jest to forma tak zwanej „zasady maksymalnej entropii”, która nie jest tak rozpowszechniona, ponieważ faktyczne użycie formy entropii jest nieco arbitralne ( więcej informacji na temat tego środka można znaleźć w tym artykule w Wikipedii ).
Oczywiście to ostatnie stwierdzenie jest prawdziwe również w przypadku wielowymiarowym, tzn. Maksymalny rozkład entropii (ponownie, w odniesieniu do ciągłej wersji entropii Shannona) podany jako pierwszy ( ) i informacje drugiego rzędu ( tj. macierz kowariancji ), można wykazać jako zmienną gaussowską na wielu odmianach. Σμ⃗ Σ
PD: Muszę dodać do zasady maksymalnej entropii, że zgodnie z tym artykułem , jeśli zdarzy ci się znać zakres zmienności swojej zmiennej, musisz dokonać korekty rozkładu, który otrzymujesz zgodnie z zasadą maksymalnej entropii.