Czy istnieje rozkład w kształcie płaskowyżu?


30

Szukam rozkładu, w którym gęstość prawdopodobieństwa szybko maleje po pewnym punkcie oddalonym od średniej lub, moim zdaniem, „rozkładem w kształcie płaskowyżu”.

Coś pomiędzy gaussowskim a mundurem.


8
Można zsumować RV gaussowską i RV jednolitą.
StrongBad,

3
Czasami słyszy się o tak zwanych rozkładach platykurtycznych .
JM nie jest statystykiem

Odpowiedzi:


53

Być może szukasz dystrybucji znanej pod nazwą uogólniona normalna (wersja 1) , dystrybucja subbotynowa lub wykładnicza dystrybucja mocy. Jest on parametryzowany przez położenie , skalę σ i kształt β za pomocą pdfμσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

jak widać, dla przypomina i zbiega się do rozkładu Laplace'a, przy β = 2 zbiega się do normalnego, a gdy β = do równomiernego rozkładu.β=1β=2β=

wprowadź opis zdjęcia tutaj

Jeśli szukasz oprogramowania, które ma to zaimplementowane, możesz sprawdzić normalpbibliotekę dla R (Mineo i Ruggieri, 2005). Co jest ładne na temat tego pakietu jest to, że między innymi realizuje regresji z błędami o rozkładzie normalnym uogólnionych, czyli minimalizowanie normę.Lp


Mineo, AM, i Ruggieri, M. (2005). Oprogramowanie do wykładniczej dystrybucji mocy: Pakiet normalp. Journal of Statistics Software, 12 (4), 1-24.


20

Komentarz StrongBada @ jest naprawdę dobrą sugestią. Suma jednolitego RV i gaussowskiego RV może dać ci dokładnie to, czego szukasz, jeśli odpowiednio wybierzesz parametry. I faktycznie ma całkiem dobre rozwiązanie w formie zamkniętej.

Plik PDF tej zmiennej jest podany w wyrażeniu:

14a[erf(x+aσ2)erf(xaσ2)]

jest „promieniem” równomiernego RV równego zeru. σ to odchylenie standardowe zerowej średniej RV gaussa.aσ

Pliki PDF


3
Odnośnik: Bhattacharjee, GP, Pandit, SNN i Mohan, R. 1963. Łańcuchy wymiarowe obejmujące rozkład prostokątny i normalny. Technometrics, 5, 404–406.
Tim

15

Istnieje nieskończona liczba rozkładów w kształcie płaskowyżu.

Czy szukałeś czegoś bardziej konkretnego niż „pomiędzy gaussowskim a mundurem”? To trochę niejasne.

Oto jedna prosta: zawsze możesz przykleić pół normalną na każdym końcu munduru:

Gęstość z jednolitym środkiem i ogonami Gaussa

Możesz kontrolować „szerokość” munduru w stosunku do skali normalnej, dzięki czemu możesz mieć szersze lub węższe płaskowyże, co daje całą klasę rozkładów, w tym przypadki Gaussa i mundur jako przypadki ograniczające.

Gęstość wynosi:

h2πσe12σ2(xμ+w/2)2Ixμw/2+h2πσIμw/2<xμ+w/2+h2πσe12σ2(xμw/2)2Ix>μ+w/2

gdzie h=11+w/(2πσ)

Gdy dla stałej w , zbliżamy się do munduru na ( μ - w / 2 , μ + w / 2 ), a jako w 0 dla stałej σ zbliżamy się do N ( μ , σ 2 ) .σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

Oto kilka przykładów (z w każdym przypadku):μ=0

Fabuła różnych przykładów tego munduru z ogonem gaussowskim

Być może moglibyśmy nazwać tę gęstość „mundurem gaussowskim”.


1
Ach! Ja uwielbiam uczestniczy kulki formalnych noszenie Gausian-tailed mundur! ;)
Alexis

7

Zobacz moją dystrybucję „Diabelskiej wieży” tutaj [1]:

, dla | x | < 0,9399 ; f ( x ) = 0,2945 / x 2 , dla 0,9399 | x | < 2,3242 ; i f ( x ) = 0 , dla 2,3242 | x | .f(x)=0.3334|x|<0.9399
f(x)=0.2945/x20.9399|x|<2.3242
f(x)=02.3242|x|

Diabelska funkcja gęstości wieży z płaskim blatem, wypukłymi bokami, odciętymi w skrajności

Dystrybucja „slip-dress” jest jeszcze bardziej interesująca.

Łatwo jest budować rozkłady o dowolnym kształcie.

[1]: Westfall, PH (2014)
„Kurtosis as Peakedness, 1905 - 2014. RIP”
Popr. Stat. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
publiczny dostęp pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Cześć Peter - Pozwoliłem sobie nadać funkcję i wstawić obraz, a także podać pełne odniesienie. (Jeśli pamięć służy, myślę, że Kendall i Stuart podają szczegóły podobnego debunkowania w swoim klasycznym tekście. Jeśli dobrze pamiętam
minęło sporo

Dzięki, Glen_b. Nigdy nie mówiłem, że kurtoza mierzy to, co mierzą liczby indeksu ogona. Raczej mój artykuł dowodzi, że kurtoza jest, dla bardzo szerokiej klasy rozkładów, prawie równa E (Z ^ 4 * I (| Z |> 1)). Zatem kurtoza wyraźnie nie mówi nic o „szczycie”, który zwykle znajduje się w zakresie {Z: | Z | <1}. Raczej zależy to głównie od ogonów. Nazwij to E (Z ^ 4 * I (| Z |> 1)), jeśli termin „ciężki ogoniasty” ma inne znaczenie.
Peter Westfall

Ponadto, @Glen_b, do którego indeksu ogonowego się odnosisz? Jest nieskończenie wiele. Skrzyżowanie ogonów nie definiuje właściwie „ogona”. Zgodnie z niektórymi definicjami ciężkości ogona, przecięcie N (0,1) jest bardziej „ciężkie” niż 0,9999 * U (-1,1) + .0001 * U (-1000,1000), chociaż ta ostatnia jest oczywiście cięższy ogon, mimo że ma skończone ogony. I BTW, ta ostatnia ma wyjątkowo wysoką kurtozę, w przeciwieństwie do N (0,1).
Peter Westfall,

Nigdzie w moim komentarzu nie mogę znaleźć słowa „indeks ogona”; Nie jestem do końca pewien, o czym tu mówisz, kiedy mówisz „do którego indeksu ogona masz na myśli”. Jeśli masz na myśli troskę o grubych ogonach, najlepiej jest sprawdzić, co naprawdę mówią Kendall i Stuart; Sądzę, że tam faktycznie porównują asymptotyczny stosunek gęstości dla symetrycznych znormalizowanych zmiennych, ale być może mogły to być funkcje ocalałych; chodziło o ich, nie o moje
Glen_b

Dziwne. W każdym razie Kendall i Stuart się mylili. Jak dowodzą moje twierdzenia, Kurtosis jest oczywiście miarą wagi ogona.
Peter Westfall,

5

f(x)

f(x)=k11+x2afor xR

gdzie:

  • a
  • kk=aπsin(π2a)

a

wprowadź opis zdjęcia tutaj

.

a

wprowadź opis zdjęcia tutaj


3

Kolejny ( EDYCJA : uprościłem go teraz. EDIT2 : uprościłem go jeszcze bardziej, chociaż teraz obraz tak naprawdę nie odzwierciedla tego dokładnego równania):

f(x)=13αlog(cosh(αa)+cosh(αx)cosh(αb)+cosh(αx))

log(cosh(x))x

alphaa=2b=1


Oto przykładowy kod w R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fto nasza dystrybucja. Wykreślmy to dla sekwencjix

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Dane wyjściowe konsoli:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

I fabuła:

Moja dystrybucja oparta na log cosh

Można zmienić ai bokoło początek i koniec stoku odpowiednio, ale potem dalej normalizacja byłaby potrzebna, a nie obliczać go (dlatego używam a = 2i b = 1na wykresie).


2

Jeśli szukasz czegoś bardzo prostego, z centralnym płaskowyżem i bokami rozkładu trójkątów, możesz na przykład połączyć N rozkładów trójkątów, N w zależności od pożądanego stosunku między płaskowyżem a zejściem. Po co trójkąty, ponieważ ich funkcje próbkowania istnieją już w większości języków. Losowo sortujesz według jednego z nich.

W R dałoby to:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

wprowadź opis zdjęcia tutaj wprowadź opis zdjęcia tutaj


2

Oto ładna: produkt dwóch funkcji logistycznych.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Ma to tę zaletę, że nie jest częściowe.

B dostosowuje szerokość, a A dostosowuje stromość opadania. Poniżej pokazano B = 1: 6 z A = 2. Uwaga: Nie zastanawiałem się, jak właściwie to znormalizować.

Dystans plateau

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.