Pierwsza część pytania odpowiedzi w komentarzach do pytania: dużo „markowych” dystrybucje są multimodalny, taki jak każdy Beta dystrybucji z pomocą < 1 i b < 1 . Przejdźmy zatem do drugiej części pytania.( a , b )a < 1b < 1
Wszystkie dyskretne rozkłady są wyraźnie mieszaninami (atomów, które są jednomodalne).
Pokażę, że większość ciągłych rozkładów to także mieszanki rozkładów unimodalnych. Intuicja stojąca za tym jest prosta: możemy „wygładzić” nierówności z wyboistego wykresu PDF, jeden po drugim, aż wykres będzie poziomy. Guzki stają się składnikami mieszanki, z których każdy jest oczywiście jednomodalny.
W związku z tym, z wyjątkiem być może niektórych niecodziennych dystrybucji, których pliki PDF są wysoce nieciągłe, odpowiedź na pytanie brzmi „brak”: wszystkie rozkłady multimodalne, które są absolutnie ciągłe, dyskretne, lub kombinacja tych dwóch są mieszaninami rozkładów unimodalnych.
Rozważ ciągłe rozkłady których pliki PDF f są ciągłe (są to rozkłady „absolutnie ciągłe”). (Ciągłość nie stanowi większego ograniczenia; można ją rozluźnić poprzez dokładniejszą analizę, zakładając jedynie, że punkty nieciągłości są dyskretne.) fafa
Aby poradzić sobie z „plateau”, wartości stałych, które mogą wystąpić, określenie „stan”, aby być odstęp (który może być pojedynczy punkt, w którym x L = x U ) takie, żem = [ xl, xu]xl= xu
ma stałą wartość na m , powiedzmy y .fam ,y
nie jest stałe w żadnym przedziale, który ściśle zawiera m .fam
Istnieje liczba dodatnia taka, że maksymalna wartość f osiągnięta na [ x l - ϵ , x u + ϵ ] wynosi y .ϵfa[ xl- ϵ , xu+ ϵ ]y
Niech będzie dowolnym trybem f . Ponieważ f jest ciągły, istnieją przedziały [ x ′ l , x ′ u ] zawierające m, dla których f nie zmniejsza się w [ x ′ l , x l ] (co jest odpowiednim przedziałem, a nie tylko punktem) i nie wzrasta w [ x u , x ′ u ]m = [ xl, xu]fafa[x′l,x′u]mf[x′l,xl][xu,x′u](co jest również właściwym interwałem). Niech być infinimum wszystkich tych wartości, a x ' U supremum wszystkich tych wartości.x′lx′u
Konstrukcja ta zdefiniowała jeden „garb” na wykresie rozciągający się od x ′ l do x ′ u . Niech Y jest większe od f ( x " l ) i F ( x " u ) . Z założenia zbiór punktów x w [ x ′ l , x ′ u ], dla którego f ( x ) ≥ y jest odpowiednim przedziałem m ′fx′lx′uyf(x′l)f(x′u)x[x′l,x′u]f(x)≥ym′ściśle zawierające (ponieważ zawiera albo całe [ x ′ l , x l ] lub [ x u , x ′ u ] ).m[x′l,xl][xu,x′u]
Na tej ilustracji multimodalnego pliku PDF tryb jest identyfikowany przez czerwoną kropkę na osi poziomej. Poziomy zasięg czerwonej części wypełnienia to przedział m ′ : jest to podstawa garbu określona przez tryb m . Podstawa tego garbu znajduje się na wysokości y ≈ 0,16 . Oryginalny plik PDF jest sumą czerwonego i niebieskiego wypełnienia. Zauważ, że niebieskie wypełnienie ma tylko jeden tryb w pobliżu 2 ; tryb oryginalny w [ 0 , 0 ] został usunięty.m=[0,0]m′my≈0.162[0,0]
Pisanie dla długości m ′ zdefiniuj|m′|m′
pm=PrF(m′)−y|m′|
i
fm(x)=f(x)−ypm
gdy i przeciwnym razie. ( sprawia to, że jest funkcją ciągłą.) Licznik jest wielkością, o jaką wzrasta powyżej a mianownik jest obszarem między wykresem i . Zatem jest nieujemne i ma całkowity obszar : jest to PDF rozkładu prawdopodobieństwa. Ze względu na budowę ma unikalny tryb .f m ( x ) = 0 f m f y p m f y f m 1 mx∈m′fm(x)=0fmfypmfyfm1m
Również przez budowę, funkcja
f′m(x)=f(x)−pmfm(x)1−pm
jest PDF . (Oczywiście, jeśli nie ma już nic z co na początku musiało być unimodalne.) Co więcej, nie ma trybów w przedziale (gdzie jest stały, dlatego poprzednia staranna definicja konieczny był tryb jako interwał). Ponadto,p m = 1 f , m ′pm<1pm=1f,m′
f(x)=pmfm(x)+(1−pm)f′m(x)
jest mieszanką unimodalnego PDF i PDF .f ′ mfmf′m
Powtórz tę procedurę za pomocą (która jako liniowa kombinacja funkcji ciągłych jest nadal funkcją ciągłą, umożliwiając nam kontynuowanie jak poprzednio), tworząc sekwencję trybów ; odpowiadające sekwencje wag ; oraz pliki PDF Wynik ograniczający istnieje, ponieważ (a) przedział, w którym jest spłaszczony, obejmuje odpowiedni przedział, który nie został spłaszczony w poprzednim m = m 1 , m 2 , ... P 1 = s m , p 2 = s m 2 , ... f 1 = f m , K 2 = f m 2 , ... . f i i - 1 ff′mm=m1,m2,…p1=pm,p2=pm2,…f1=fm,f2=fm2,….fii−1operacje i (b) liczb rzeczywistych nie można rozłożyć na więcej niż policzalną liczbę takich przedziałów. Limit nie może mieć żadnych modów, a zatem jest stały, który musi wynosić zero (w przeciwnym razie jego całka rozdzieliłaby się). W związku z tym zostało wyrażone (być może nie jednoznacznie, ponieważ kolejność wybierania trybów będzie miała znaczenie) jako mieszaninaf
f(x)=∑ipifi(x)
rozkładów jednomodalnych, QED.