Znajdź oczekiwaną wartość za pomocą CDF


34

Zacznę od stwierdzenia, że ​​jest to zadanie domowe od samego początku. Spędziłem kilka godzin, szukając sposobu na znalezienie oczekiwanych wartości i zdecydowałem, że nic nie rozumiem.

Niech X ma CDF F(x)=1xα,x1 .
Znajdź E(X) dla tych wartości dla którychαE(X) istnieje .

Nie mam pojęcia, jak to rozpocząć. Jak mogę ustalić, które wartości istnieją? Nie wiem też, co zrobić z CDF (zakładam, że to oznacza funkcję dystrybuowania skumulowanego). Istnieją formuły do ​​znalezienia oczekiwanej wartości, gdy masz funkcję częstotliwości lub funkcję gęstości. Wikipedia twierdzi, że CDF X można zdefiniować w funkcji gęstości prawdopodobieństwa f w następujący sposób:αXf

F(x)=xf(t)dt

To jest tak daleko, jak to możliwe. Gdzie mogę się stąd udać?

EDYCJA: Chciałem umieścić x1 .

Odpowiedzi:


19

Edytowane dla komentarza z probabilislogic

Zauważ, że F(1)=0 w tym przypadku, więc rozkład ma prawdopodobieństwo, że 0 będzie mniejsze niż 1 , więc x1 , a także będziesz potrzebować α>0 dla rosnącego cdf.

Jeśli masz plik cdf, to chcesz anty-całki lub pochodnej, która ma ciągły rozkład taki jak ten

f(x)=dF(x)dx

i na odwrót dla x 1 .F(x)=1xf(t)dtx1

Następnie, aby znaleźć oczekiwanie, które musisz znaleźć

E[X]=1xf(x)dx

pod warunkiem, że to istnieje. Rachunek pozostawiam tobie.


3
@henry - , więc obsługa nie może być mniejsza niż 1 (ponieważ CDF jest funkcją nie malejącą)F(1)=11α=11=0
prawdopodobieństwo jest

@probabilityislogic: Być może masz rację co do książki. Zmienię swoją odpowiedź.
Henry

Dzięki za odpowiedzi. Co oznacza f (x)? Funkcja gęstości prawdopodobieństwa? Czy pochodna cdf jest zawsze f (x)?
styfle 30.04.2011

1
rzeczywiście ma być funkcją gęstości prawdopodobieństwa. Jeśli plik cdf ma pochodną, ​​to jest to gęstość, choć istnieją rozkłady (na przykład dyskretne), w których plik cdf nie ma pochodnej wszędzief(x)
Henry

1
@styfle: Jeśli istnieje, i podobnie dla oczekiwań innych funkcji x . E[X2]=1x2f(x)dxx
Henry

71

Użycie funkcji gęstości nie jest konieczne

Zintegruj 1 minus CDF

Jeśli masz losową zmienną która ma podparcie, które nie jest ujemne (to znaczy, że zmienna ma niezerową gęstość / prawdopodobieństwo tylko wartości dodatnich), możesz użyć następującej właściwości:X

E(X)=0(1FX(x))dx

Podobna właściwość ma zastosowanie w przypadku dyskretnej zmiennej losowej.

Dowód

Ponieważ ,1FX(x)=P(Xx)=xfX(t)dt

0(1FX(x))dx=0P(Xx)dx=0xfX(t)dtdx

Następnie zmień kolejność integracji:

=00tfX(t)dxdt=0[xfX(t)]0tdt=0tfX(t)dt

Uznając, że jest zmienną fikcyjną, lub przyjmując proste podstawienie t = x i d t = d x ,tt=xdt=dx

=0xfX(x)dx=E(X)

Przypisanie

Użyłem Formuły do ​​specjalnych przypadków w artykule Oczekiwana wartość na Wikipedii, aby odświeżyć moją pamięć na dowodzie. Ta sekcja zawiera również dowody dla dyskretnego przypadku zmiennej losowej, a także dla przypadku, w którym nie istnieje funkcja gęstości.


1
+1 świetny wynik: całka cdf jest naprawdę prosta, ponadto mądrze jest unikać pochodnych, ilekroć jest to możliwe (nie są tak dobrze zachowywane jak całki;)). Dodatkowo: używając cdf do obliczenia wariancji zobacz tutaj math.stackexchange.com/questions/1415366/…
loved.by.Jesus

2
Kiedy zmieniasz kolejność integracji, jak uzyskać ograniczenia integracji?
Zaz

Standardowy dowód nie zakłada, że ma gęstość. X
ae0709

@Zaz we set the integration limits so that the same part of (t, x) space is covered. The original constraints are x >0 and t > x. We can't have the outer limits depend on the inner variable, but we can define the same region as t > 0 and 0 < x < t. Good examples of this process here: mathinsight.org/…
fredcallaway

12

The result extends to the kth moment of X as well. Here is a graphical representation: enter image description here


8

x1F(1)=11α=11=0.

What you "know" about CDFs is that they eventually approach zero as the argument x decreases without bound and eventually approach one as x. They are also non-decreasing, so this means 0F(y)F(x)1 for all yx.

So if we plug in the CDF we get:

01xα111xα0xα1>0x1.

From this we conclude that the support for x is x1. Now we also require limxF(x)=1 which implies that α>0

To work out what values the expectation exists, we require:

E(X)=1xdF(x)dxdx=α1xαdx

And this last expression shows that for E(X) to exist, we must have α<1, which in turn implies α>1. This can easily be extended to determine the values of α for which the r'th raw moment E(Xr) exists.


(+1) Particularly for the sharp-eyed recognition that the given support was incorrect.
cardinal

Thanks for the response. I fixed the question. I meant to put x>=1. How did you know to first differentiate the cdf to get the density function?
styfle

@styfle - because that's what a PDF is, whenever the CDF is continuous and differentiable. You can see this by looking at how you have defined your CDF. Differentiating an integral just gives you the integrand when the upper limit is the subject of the differentiation.
probabilityislogic

1
@styfle - PDF można również postrzegać jako prawdopodobieństwo, że RV leży w nieskończenie małym przedziale. P.r(x<X<x+rex)=fa(x+rex)-fa(x)refa(x)rexrex=fa(x)rex tak jak rex0. This way holds more generally, even for discrete RV and RV without a density (the limit is just something other than a derivative)
probabilityislogic

1

The Answer requiring change of order is unnecessarily ugly. Here's a more elegant 2 line proof.

udv=uvvdu

Now take du=dx and v=1F(x)

0[1F(x)]dx=[x(1F(x))]0+0xf(x)dx

=0+0xf(x)dx

=E[X]


I think you mean to let du-dx so that u=x.
Michael R. Chernick
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.