Wizualizuj dwuwymiarowy rozkład dwumianowy


11

Pytanie: jak wygląda dwumianowy rozkład dwumianowy w przestrzeni trójwymiarowej?

Poniżej znajduje się konkretna funkcja, którą chciałbym wizualizować dla różnych wartości parametrów; mianowicie , p 1 i p 2 .np1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

Zauważ, że istnieją dwa ograniczenia; oraz p 1 + p 2 = 1 . Ponadto n jest liczbą całkowitą dodatnią, powiedzmy 5 .x1+x2=np1+p2=1n5

W podjąłem dwie próby wykreślenia funkcji przy użyciu LaTeX (TikZ / PGFPLOTS). W ten sposób uzyskać wykresy poniżej dla następujących wartości: , P 1 = 0,1 i P 2 = 0,9 , a n = 5 , P 1 = 0,4 i P 2 = 0,6 , odpowiednio. Nie udało mi się wdrożyć ograniczenia wartości domeny; x 1 + x 2 = n , więc jestem trochę zakłopotany.n=5p1=0.1p2=0.9n=5p1=0.4p2=0.6x1+x2=n

Wizualizacja wykonana w dowolnym języku byłaby w porządku (R, MATLAB itp.), Ale pracuję w LaTeX z TikZ / PGFPLOTS.

Pierwsze podejscie

, P 1 = 0,1 i P 2 = 0,9n=5p1=0.1p2=0.9

wprowadź opis zdjęcia tutaj

Drugie podejście

, P 1 = 0,4 i P 2 = 0,6n=5p1=0.4p2=0.6

wprowadź opis zdjęcia tutaj

Edytować:

Dla porównania, tutaj jest artykuł zawierający kilka wykresów. Tytuł pracy to „Nowa dwuwymiarowa dystrybucja dwumianowa” autorstwa Atanu Biswasy i Jing-Shiang Hwanga. Statystyka i listy prawdopodobieństwa 60 (2002) 231–240.

Edycja 2: Dla jasności i w odpowiedzi na @GlenB w komentarzach poniżej znajduje się migawka tego, jak dystrybucja została mi przedstawiona w mojej książce. Książka nie odnosi się do przypadków zdegenerowanych / nie zdegenerowanych i tak dalej. Po prostu przedstawia to w ten sposób i starałem się to wyobrazić. Twoje zdrowie! Ponadto, jak zauważył @JohnK, prawdopodobnie wystąpi literówka w odniesieniu do x1 + x1 = 1, co sugeruje, że powinno to być x1 + x1 = n.

wprowadź opis zdjęcia tutaj

Obraz równania z:

Spanos, A (1986) Statystyczne podstawy modelowania ekonometrycznego. Cambridge University Press


5
Ale nie powinno to być ciągłe, prawda? Obie zmienne losowe są dyskretne.
JohnK,

1
Więc x1 i x2 są niezależne, prawda? Potrzebujesz fabuły pseudo-3D? Czy mapa termiczna byłaby akceptowalna?
gung - Przywróć Monikę


2
x1+x2=np1+p2=1X1Binomial(n,p1)X2nX1

3
Nie masz specyfikacji dwuwymiarowego dwumianu w swoim pytaniu. (Jest więcej niż jeden sposób określenia rozkładu dwuwymiarowego, który można by prawdopodobnie nazwać „dwumianowym”. Nie masz żadnego z nich, chociaż twój zdegenerowany byłby szczególnym przypadkiem niektórych z nich.) ... rysunki w twoje referencje Biswasa i Hwang nie są odpowiednimi wskazaniami dyskretnej dwuwymiarowej pmf. Krótko mówiąc, twoje pytanie nie ma nic do narysowania, a twoje odniesienie jest przydatne głównie jako przykład tego, czego należy unikać.
Glen_b

Odpowiedzi:


8

Są w tym dwa elementy: najpierw musisz dowiedzieć się, jakie są poszczególne prawdopodobieństwa, a potem jakoś je wykreślić.

ni=nj=506×6=36

Możemy najpierw obliczyć krańcowe dwumianowe PMF, ponieważ jest to takie proste. Ponieważ zmienne są niezależne, każde wspólne prawdopodobieństwo będzie po prostu iloczynem krańcowych prawdopodobieństw; to jest algebra macierzowa. Tutaj demonstruję ten proces za pomocą Rkodu:

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

W tym momencie mamy dwie wymagane macierze prawdopodobieństw. Musimy tylko zdecydować, w jaki sposób chcemy je wykreślić. Szczerze mówiąc, nie jestem wielkim fanem wykresów słupkowych 3D. Ponieważ Rwydaje się, że zgadzam się ze mną, stworzyłem te wykresy w Excelu:

b19:

wprowadź opis zdjęcia tutaj

b46:

wprowadź opis zdjęcia tutaj


Dziękujemy za prezentację plus kod R. To prowadzi mnie do pytania o x1 + x2 = n. Jeśli ten warunek się utrzymuje, czy powinna istnieć tylko jedna linia filarów, jak przedstawiono tutaj: reference.wolfram.com/language/ref/MultinomialDistribution.html Zakładam, że wykres wolfram jest tym, co @Glen_b nazwał przypadkiem zdegenerowanym? Czy to oznacza, że ​​przedstawiłeś przypadek nie zdegenerowany?
Graeme Walsh

1
GraemeWalsh, moja prezentacja nie pokazuje dwuwymiarowego dwumianu, gdzie x1 + x2 = n. Jak @Glen_b obszernie omawiał w komentarzach i jego odpowiedzi, tak naprawdę nie nazwałbym tego „dwuwymiarowym rozkładem dwumianowym” bez kwalifikowania go. Co więcej, oznaczałoby to, że x1 i x2 nie są niezależne, jak powiedziałeś w komentarzu, ale całkowicie zależne. Prawdę mówiąc, nie zauważyłem, że był to taki dziwny wariant (możesz mnie winić za to, że nie czytałem wystarczająco dokładnie). Jak pokazał Glen_b, ta wersja byłaby pojedynczą linią filarów. To, co przedstawiłem, to przypadek nie zdegenerowany.
gung - Przywróć Monikę

@gung Lubię twoje nowe działki. Myślę, że twoja dyskusja dobrze opisuje przypadek zdegenerowany („musisz dowiedzieć się, jakie są indywidualne prawdopodobieństwa” naprawdę mówi wszystko; rzeczywiste obliczenia dla przypadku zdegenerowanego są banalne); Właśnie przeprowadziłem te trywialne obliczenia.
Glen_b

7

Odpowiedź Gunga jest dobrą odpowiedzią na rzeczywisty dwumianowy dwumian, dobrze wyjaśniający problemy (zaleciłbym zaakceptowanie go jako dobrej odpowiedzi na pytanie tytułowe, najprawdopodobniej przydatne dla innych).

x1n

Zdefiniujmy więc rzeczy poprawnie. Zauważ, że w rzeczywistości nie jest dostępna żadna definicja zmiennej losowej, więc pozostaje nam trochę zgadywania.

Y1binomial(n,p1),P(Y1=y1)y1y1=0,1,...,nX1=Y1/nx1=0,16,26,...,1

P(X1=x1)x2=nx1p2=1p1

n=6,p1=0.3

wprowadź opis zdjęcia tutaj

x2x11x1x2

Możemy uznać to za dwumianowy dwuwymiarowy (skalowany) zdegenerowany dwuwymiarowy:

wprowadź opis zdjęcia tutaj

ale naprawdę trudno jest nazwać to, co jest zdefiniowane w książce, dwumianowym dwumianowym (ponieważ jest to faktycznie dwumianowy jednowymiarowy).

Zakładając, że ktoś będzie chciał wygenerować wykres podobny do wykresu 3D, ten kawałek kodu (R) zbliża się do drugiego wykresu powyżej:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

(Potrzebujesz scatterplot3dpakietu, który zawiera funkcję o tej samej nazwie.)

Dwumianowy „prawdziwy” (nie zdegenerowany) dwuwymiarowy ma zmienność obu zmiennych jednocześnie. Oto przykład jednego szczególnego dwuwymiarowego dwumianowego (w tym przypadku nie niezależnego). Uciekłem się do użycia różnych kolorów w fabule, ponieważ w przeciwnym razie zbyt łatwo jest zgubić się w lesie „patyków”.

wprowadź opis zdjęcia tutaj

Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

X1X2

n0nynz=Xx1=x2x1+x2=n

[1]: Hamdan, MA (1972),
„Kanoniczna ekspansja dwuwymiarowej dwumianowej dystrybucji z nierównymi wskaźnikami krańcowymi”,
Międzynarodowy Przegląd Statystyczny , 40 : 3 (grudzień), s. 277–280


corr(X1,X2)=1

Glen_b. Dziękuję Ci bardzo. Bardzo pomocne było wskazanie, że obiekt matematyczny, który przedstawiłem (który został mi przedstawiony!) To dwuwymiarowy dwuwymiarowy (skalowany) zdegenerowany dwuwymiarowy. Nie wiedziałem tego od samego początku. Wreszcie elementarna prośba! Czy byłoby możliwe, abyś wyraził (za pomocą notacji matematycznej) o tym, jak zdefiniujesz dwumian dwumianowy prawdziwy lub faktyczny? Myślę, że byłoby to przydatne.
Graeme Walsh

1
Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

1
X1X2

@Graeme ... Planuję dodać więcej szczegółów.
Glen_b

4

Mathematicajest teraz dość silny w takich rzeczach - ma rozwiązanie twojego problemu bezpośrednio w dokumentacji . Z niewielkimi dodatkami stworzyłem model do zabawy (z p = p1 = 0.4lepszą prezentacją wizualną). Tak wygląda interfejs i jak można nim kontrolować.

wprowadź opis zdjęcia tutaj

Skrawek

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

Główną rzeczą jest to PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], co jest selfexplanatory, myślę. Multinomialpo prostu oznacza, że ​​możesz wziąć wiele rozkładów pidla każdej zmiennej dla każdej zmiennej. Prosta forma to BinomialDistribution. Oczywiście mogę to zrobić ręcznie, ale reguła jest taka, że ​​jeśli masz wbudowaną funkcję - powinieneś jej użyć.

Jeśli potrzebujesz komentarzy na temat struktury kodu, daj mi znać.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.