Dlaczego funkcja skumulowanej dystrybucji (CDF) jednoznacznie definiuje rozkład?

Zawsze mówiono mi, że CDF jest wyjątkowy, jednak PDF / PMF nie jest wyjątkowy, dlaczego? Czy możesz podać przykład, w którym plik PDF / PMF nie jest unikalny?

— DKangeyan
źródło

Jeśli chodzi o wyjątkowość, możesz zastanowić się nad różnicą między PDF jednolitego rozkładu na a jednolitym rozkładem na jego wnętrzu, . Innym zabawnym ćwiczeniem - które dotyczy pytania, czy plik PDF w ogóle istnieje - jest zastanowienie się, jak wyglądałby plik PDF z rozkładem liczb wymiernych. Na przykład, niech za każdym razem, gdy ,

, a

jest nieparzyste.

[0, 1]

$[0,1]$

(0, 1)

$(0,1)$

Pr (j 2^{- i}) = 2^{1 - 2 i}

$\Pr(j2^{-i})=2^{1-2i}$

0 < j 2^{- i} < 1

$0\lt j2^{-i}\lt 1$

i \geq 1

$i\ge 1$

j

$j$

— whuber

Nie wszystkie dystrybucje mają nawet pliki PDF lub PMF, podczas gdy patrzenie na CDF daje jednoczący widok rzeczy. Zmienne ciągłe mają gładko wyglądające CDF, zmienne dyskretne mają „schody”, a niektóre CDF są mieszane.

— Silverfish,

@Silverfish: ... a niektóre z nich nie są żadnymi z powyższych! :-)

— kardynał

Aby zająć się tytułem (być może nieco luźno), CDF definiuje rozkład, ponieważ CDF (lub równoważnie tylko DF / „funkcja dystrybucji”; „C” działa tylko w celu wyjaśnienia, że o tym mówimy) jest tym terminem „dystrybucja” dosłownie odnosi się do; „D” jest wskazówką w tej części. To, że jest unikalne, wynika z „F” - funkcje są jednowartościowe, więc jeśli dwie funkcje rozkładu są identyczne, obiekt, który definiują, jest taki sam; gdyby DF różniły się gdziekolwiek, to, czym są, byłyby w tych punktach różne. Czy to tautologia? Myślę, że to jest.

— Glen_b

@Glen_b Jest tautologiczny tylko dla wyszkolonej intuicji. Funkcja rozkładu podaje tylko prawdopodobieństwa postaci podczas gdy cała dystrybucja określa prawdopodobieństwo postaci dla dowolnych mierzalnych zestawów Musisz pokazać, że określa rozkład. Jak zauważa NicholasB, jest to kwestia przedłużenia pomiaru wstępnego z pół-pierścienia (półotwartych przedziałów), , do pełnego pola sigma Lebesgue'a i pokazanie, że jest wyjątkowy

F

$F$

F (x) = Pr {ω \in Ω | X (ω) \leq x}

$F(x)=\Pr\{\omega\in\Omega\,|\,X(\omega)\le x\}$

Pr ({ω \in Ω | X (ω) \in B}

$\Pr(\{\omega\in\Omega\,|\,X(\omega)\in\mathcal{B}\}$

B \subset R

$\mathcal{B}\subset\mathbb R$

F

$F$

μ ((a, b]) = F (b) - F (a)

$\mu((a,b])=F(b)-F(a)$

— whuber

Odpowiedzi:

Przypomnijmy kilka rzeczy. Niech $(\Omega,A,P)$ będzie przestrzeń prawdopodobieństwo , $\Omega$ jest nasz przykładowy zestaw, jest nasz -algebra, a jest funkcją prawdopodobieństwa określona na . Zmienna losowa jest mierzalna Funkcja tj dla każdego podzbioru w Lebesgue'a mierzalne $A$ $\sigma$ $P$ $A$ $X:\Omega \to \mathbb{R}$ $X^{-1}(S) \in A$ $\mathbb{R}$ . Jeśli nie znasz tej koncepcji, wszystko, co powiem później, nie będzie miało sensu.

Ilekroć mamy zmienną losową, $X:\Omega \to \mathbb{R}$ , indukuje ona miarę prawdopodobieństwa na przez kategoryczne przesunięcie w przód. Innymi słowy, . Sprawdzenie, czy jest miarą prawdopodobieństwa na jest proste . Nazywamy na dystrybucję z . $X'$ $\mathbb{R}$ $X'(S) = P(X^{-1}(S))$ $X'$ $\mathbb{R}$ $X'$ $X$

Z tą koncepcją wiąże się coś, co nazywa się funkcją rozkładu zmiennej funkcyjnej. Biorąc pod uwagę zmienną losową $X:\Omega \to \mathbb{R}$ definiujemy $F(x) = P(X\leq x)$ . Funkcje dystrybucyjne $F:\mathbb{R} \to [0,1]$ mają następujące właściwości:

$F$ jestciągłe w prawo.
$F$ nie maleje
i . $F(\infty) = 1$ $F(-\infty)=0$

Wyraźnie losowe zmienne, które są równe, mają ten sam rozkład i funkcję rozkładu.

Odwrócenie procesu i uzyskanie pomiaru za pomocą danej funkcji rozkładu jest dość techniczne. Powiedzmy, że otrzymujesz funkcję dystrybucyjną . Zdefiniuj . Musisz pokazać, że jest miarą na półalgebrze przedziałów . Następnie możesz zastosować twierdzenie o rozszerzeniu Carathéodory rozszerzyć do miary prawdopodobieństwa na . $F(x)$ $\mu(a,b] = F(b) - F(a)$ $\mu$ $(a,b]$ $\mu$ $\mathbb{R}$

— Nicolas Bourbaki
źródło

Jest to dobry początek odpowiedzi, ale może nieumyślnie przysłonić sprawę. Wydaje się, że głównym problemem jest to, że dwie miary o tej samej funkcji rozkładu są w rzeczywistości równe. Nie wymaga to nic więcej niż twierdzenie

Dynkina i fakt, że zestawy formy

tworzą system

który generuje borel

-algebrę. Wtedy niejednoznaczność gęstości (zakładając, że istnieje!) Może należy się odnieść do powyższego i skontrastować z nim

π

$\pi$

λ

$\lambda$

(- \infty, b]

$(-\infty, b]$

π

$\pi$

σ

$\sigma$

— kardynał

(Jedna dodatkowa drobna sprzeczka: Zmienne losowe są zwykle definiowane w kategoriach zestawów Borela, a nie zestawów Lebesgue'a). Myślę, że przy niektórych drobnych zmianach odpowiedź ta stanie się całkiem jasna. :-)

— kardynał

@ kardynał Najpierw myślę o analizie, a potem o prawdopodobieństwie. Dlatego może to wyjaśniać, dlaczego wolę myśleć o zestawach Lebesgue. W obu przypadkach nie wpływa to na to, co zostało powiedziane.

— Nicolas Bourbaki,

Aby odpowiedzieć na prośbę o przykład dwóch gęstości z tą samą całką (tj. Mieć tę samą funkcję rozkładu), rozważ te funkcje zdefiniowane na liczbach rzeczywistych:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

i wtedy;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

Nie są w ogóle równe x, ale oba są gęstościami dla tego samego rozkładu, dlatego gęstości nie są jednoznacznie określone przez (skumulowany) rozkład. Kiedy gęstości z rzeczywistą domeną różnią się tylko dla policzalnego zestawu wartości x, wówczas całki będą takie same. Analiza matematyczna tak naprawdę nie jest przeznaczona dla osób o słabych nerwach lub o zdecydowanie konkretnym umyśle.

— DWin
źródło

Nie zgadzam się ze stwierdzeniem: „funkcja rozkładu prawdopodobieństwa nie określa jednoznacznie miary prawdopodobieństwa”, którą wypowiadasz w pytaniu otwierającym. Jedynie to determinuje.

Niech będą dwiema funkcjami masy prawdopodobieństwa. Jeżeli, Dla dowolnego mierzalnego zestawu wówczas prawie wszędzie. To jednoznacznie determinuje pdf (ponieważ w analizie nie obchodzi nas, czy nie zgadzają się co do zestawu miary zero). $f_1,f_2:\mathbb{R}\to [0,\infty)$

\int_{E} f_{1} = \int_{E} f_{2}

$\int_E f_1 = \int_E f_2$

E

$E$

f_{1} = f_{2}

$f_1=f_2$

Powyższą całkę możemy przepisać na: Gdzie jest funkcją całkowitą.

\int_{E} g = 0

$\int_E g = 0$

g = f_{1} - f_{2}

$g=f_1-f_2$

Zdefiniuj , więc . Używamy dobrze znanego twierdzenia, że jeśli całka funkcji nieujemnej wynosi zero, to funkcja jest prawie wszędzie zerowa. W szczególności, AE na . Tak ae o . Teraz powtórz argument w innym kierunku, używając $E = \{ x \in \mathbb{R} ~ | ~ g \geq 0 \}$ $\int_E g = 0$ $g=0$ $E$ $f_1 = f_2$ $E$ $F = \{ x\in \mathbb{R} ~ | ~ g \leq 0 \}$ . Będziemy się, że ae na . Tak więc, i ekspozycję na . $f_1 = f_2$ $F$ $f_1 = f_2$ $E\cup F = \mathbb{R}$

— Nicolas Bourbaki
źródło