Jak wyjaśniłbyś funkcję generowania momentu (MGF) w kategoriach laika?


15

Co to jest funkcja generowania momentu (MGF)?

Czy potrafisz to wytłumaczyć laikiem wraz z prostym i łatwym przykładem?

Ogranicz w miarę możliwości formalne notacje matematyczne.


1
Chcesz prosty, łatwy przykład ... ale bez notacji matematycznej? Nie jestem pewien, czy coś takiego byłoby bardzo łatwe do zrobienia - przynajmniej nie bez narażania się na mylące wrażenie tego, z czym masz do czynienia. Przypuszczam, że można podać mgf zdegenerowanej zmiennej losowej, która zawsze wynosi 0 nie wymagając wiele na drodze zapisu matematycznego, ale będzie to niezrozumiałe, jeśli naprawdę chcesz zrozumieć mgfs.
Glen_b

1
Nie jestem pewien, czy istnieje intuicyjny sposób jego zrozumienia, możesz po prostu pomyśleć o tym jako o „kodowaniu” dystrybucji (przynajmniej, jeśli istnieje, ten pomysł działa trochę lepiej z charakterystycznymi funkcjami).
dsaxton,

1
Funkcja generowania momentu - jeśli istnieje - jest sposobem na zakodowanie wszystkich nieujemnych liczb całkowitych momentów zmiennej losowej w funkcji, z których można je ponownie wyodrębnić; mgfs może być używany do wykonywania określonych obliczeń, które czasem nie są tak łatwe do wykonania na inne sposoby. Nie oczekuję, że to bardzo pomoże.
Glen_b

1
Jestem pewien, że widziałeś, jak Joe Blitztein odpowiedział na to samo pytanie na Quora
Antoni Parellada,

Odpowiedzi:


18

Załóżmy, że intuicja pozbawiona równań nie jest możliwa, i nadal nalegamy na sprowadzenie matematyki do najistotniejszych rzeczy, aby zorientować się, co się dzieje: staramy się uzyskać momenty statystyczne , które po obowiązkowym nawiązaniu do fizyki definiujemy jako wartość oczekiwaną mocy zmiennej losowej. Dla ciągłej zmiennej losowej nieprzetworzony k -ty moment to LOTUS :

(1)mi[Xk]=-Xkpdfrex

Funkcja generowania momentu ,

M.X(t): =mi[mitX],
jest sposobem na obejście tej całki (równanie 1) poprzez wykonanie:

(2)mi[mitX]=-mitXpdfrex

Dlaczego? Ponieważ łatwiej i jest tam fantastyczna własność MGF, które mogą być postrzegane przez rozszerzenie serii Maclaurin o mitX

mitX=1+X1!t+X2)2)!t2)+X3)3)!t3)+

Biorąc pod uwagę oczekiwania obu stron tej serii mocy:

M.X(t)=mi[mitX](3)=1+mi[X]1!t+mi[X2)]2)!t2)+mi[X3)]3)!t3)+

momenty wydają się „osadzone” na tej wielomianowej „sznurku”, gotowe do unicestwienia przez różnicowanie k razy i ocenę od zera, gdy przejdziemy przez łatwiejszą integrację (w równaniu (2)) tylko raz na wszystkie momenty! Fakt, że jest to łatwiejsza integracja jest najbardziej widoczny, gdy pdf jest wykładniczy.

Aby odzyskać k -ty moment:

M.X(k)(0)=rekretkM.X(t)|t=0

Fakt, że w końcu istnieje potrzeba różnicowania, sprawia, że ​​nie jest to darmowy lunch - w końcu jest to dwustronna transformata Laplace'a pdf ze zmienionym znakiem w wykładniku:

L.{pdf(x)}(s)=-mi-sxpdf(x)rex

takie, że

(4)MX(t)=L{pdf(x)}(s).

To w efekcie daje nam fizyczną ścieżkę do intuicji. Transformacja Laplace'a działa na pdf i rozkłada go na chwile. Podobieństwo do transformacji Fouriera jest nieunikniona : a FT odwzorowuje funkcję do nowej funkcji na prostej rzeczywistej, a Laplace odwzorowuje funkcję do nowej funkcji na płaszczyźnie zespolonej. Transformacja Fouriera wyraża funkcję lub sygnał jako ciąg częstotliwości, podczas gdy transformata Laplace'a rozkłada funkcję na swoje momenty . W rzeczywistości innym sposobem uzyskiwania momentów jest transformacja Fouriera ( funkcja charakterystyczna ). Wykładniczy określenie w transformaty Laplace'a wynosi na ogół od postaci est os=σ+iω , odpowiadającerzeczywistym wykładniczym i wyimaginowanym sinusoidom, i dając wykresy takie jakto:


[ Z przewodnika naukowca i inżyniera po przetwarzaniu sygnałów, Steven W. Smith ]


Dlatego funkcja MX(t) rozkłada jakoś pdf na jego „częstotliwości składowe”, gdy σ=0. Z równania. (4):

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

co pozostawia nam niewłaściwą całkę części wyrażenia na czerwono, odpowiadającą transformacie Fouriera w pdf.

Ogólnie, intuicja biegunów transformaty Laplace'a polega na tym, że dostarczają one informacji o wykładniczej (rozpadzie) i częstotliwościowej funkcji (w tym przypadku pdf).


Xketx(1)(2)k(2)k(3)0


2
E[etX]E[Xk]

2
Chciałbym, aby laicy, którzy rozumieją tę odpowiedź, byli moimi uczniami :)
Aksakal

3

M.(t)=mitμ+1/2)σ2)t2)
reretM.(t)|t=0=μ+σ2)t|t=0=μ

Co więcej, ponieważ ten MGF koduje wszystko o dystrybucji, jeśli wiesz, jak manipulować funkcją, możesz zastosować operacje na wszystkich cechach dystrybucji jednocześnie! Dlaczego nie zawsze używamy MGF? Po pierwsze, nie w każdej sytuacji MGF jest najłatwiejszym narzędziem. Po drugie, MGF nie zawsze istnieje.

Powyżej laika

f(x)=12πex2/2

Możesz obliczyć jego moment, taki jak średnia i odchylenie standardowe, i użyć go na transformowanych zmiennych i funkcjach na losowych normalnych itp.

Możesz pomyśleć o MGF normalnej dystrybucji jako alternatywie dla PDF. Zawiera tę samą ilość informacji. Już pokazałem, jak uzyskać średnią.

σ2=x212πex2/2dx=?
M(t)=et2/2
σ2=d2dt2M(t)|t=0=ddtt|t=0=1


1
Czy możesz rozwinąć „wszystko”, które koduje na temat dystrybucji?
ColorStatistics

2
Aby docenić argument dokonany przez @ColorStatistics, zobacz stats.stackexchange.com/questions/25010 .
whuber

@whuber: Dziękuję, whuber. Przestudiuję ten odnośnik. To jest temat, który chcę lepiej zrozumieć.
ColorStatistics

Jak możemy udowodnić, że MGF i PDF zawierają taką samą ilość informacji?
Aerin
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.