Krótka odpowiedź
Gęstość prawdopodobieństwa wieloczynnikowej zmiennej rozkładowej Gaussa , ze średnią jest związana z kwadratem euklidesa odległość między średnią a zmienną ( ), czyli innymi słowy suma kwadratów.x=(x1,x2,...,xn)μ=(μ1,μ2,...,μn)|μ−x|22
Długa odpowiedź
Jeśli pomnożysz wiele rozkładów Gaussa dla swoich błędów, przy założeniu równych odchyleń, otrzymasz sumę kwadratów.n
L(μj,xij)=P(xij|μj)=∏ni=112πσ2√exp[−(xij−μi)22σ2]=(12πσ2√)nexp[−∑ni=1(xij−μi)22σ2]
lub w wygodnej formie logarytmicznej:
log(L(μj,xij))=nlog(12πσ2−−−−√)−12σ2∑i=1n(xij−μj)2
Zatem optymalizacja celu zminimalizowania sumy kwadratów jest równa maksymalizacji prawdopodobieństwa (log) (tj. Iloczynu wielu rozkładów Gaussa lub wielowymiarowego rozkładu Gaussa).μ
Jest to zagnieżdżony kwadrat różnicy wewnątrz struktury wykładniczej, , którego inne rozkłady nie mają.(μ−x)exp[(xi−μ)2]
Porównaj na przykład z przypadkiem dla rozkładów Poissona
log(L)=log(∏μxijjxij!exp[−μj])=−∑μj−∑log(xij!)+∑log(μj)xij
która ma maksimum, gdy zminimalizowane są:
∑μj−log(μj)xij
która jest inną bestią.
Ponadto (historia)
Historia rozkładu normalnego (ignorowanie przejścia deMoivre do tego rozkładu jako przybliżenia rozkładu dwumianowego) jest w rzeczywistości odkryciem rozkładu, które sprawia, że MLE odpowiada metodzie najmniejszych kwadratów (a nie metodzie najmniejszych kwadratów, która jest metodą które mogą wyrażać MLE rozkładu normalnego, najpierw pojawiła się metoda najmniejszych kwadratów, a następnie rozkład Gaussa)
Zauważ, że Gauss, łącząc „metodę największego prawdopodobieństwa” z „metodą najmniejszych kwadratów”, wymyślił „rozkład Gaussa”, , jako jedyny rozkład błędów, który prowadzi nas do wykonaj to połączenie między dwiema metodami.e−x2
Z przekładu Charlesa Henry'ego Davisa (Teoria ruchu ciał niebieskich poruszających się wokół Słońca w odcinkach stożkowych. Tłumaczenie „Theoria motus” Gaussa z dodatkiem) ...
Gauss definiuje:
W związku z tym prawdopodobieństwo przypisania do każdego błędu będzie wyrażone przez funkcję którą oznaczymy przez .ΔΔψΔ
(Italizacja wykonana przeze mnie)
I kontynuuje ( w sekcji 177 s. 258 ):
... stąd łatwo wywnioskować, że musi być stałą wielkością. które oznaczymy przez . Stąd mamy oznaczająca podstawę logarytmów hiperbolicznych przez i przyjmującψ′ΔΔklog ψΔ=12kΔΔ+Constant
ψΔ=xe12kΔΔ
eConstant=logx
kończąc (po normalizacji i realizacji ) wk<0
ψΔ=hπ−−√e−hhΔΔ
Napisane przez StackExchangeStrike