Skorelowane próby Bernoulliego, wielowymiarowy rozkład Bernoulliego?


15

Upraszczam pytanie badawcze, które mam w pracy. Wyobraź sobie, że mam 5 monet i zadzwońmy do głów sukcesu. Są to BARDZO stronnicze monety z prawdopodobieństwem sukcesu p = 0,1. Teraz, gdy monety były niezależne, to prawdopodobieństwo uzyskania co najmniej 1 lub więcej głowy jest bardzo prosta, . W moim scenariuszu moje próby Bernoulliego (rzuty monetą) nie są niezależne. Jedyne informacje, do których mam dostęp, to prawdopodobieństwo sukcesu (każda z nich to p = .1) i teoretyczne korelacje Pearsona między zmiennymi binarnymi.1(11/10)5

Czy jest jakiś sposób, aby obliczyć prawdopodobieństwo jednego sukcesu lub więcej tylko dzięki tej informacji? Staram się unikać podejścia opartego na symulacji, ponieważ te teoretyczne wyniki zostaną wykorzystane do ustalenia dokładności badania symulacyjnego. Przyglądałem się wielowymiarowemu rozkładowi Bernoulliego, ale nie sądzę, że mogę go w pełni określić tylko za pomocą korelacji i marginalnych prawdopodobieństw sukcesu. Mój przyjaciel zalecił skonstruowanie kopuły Gaussa z marginalami bernoulli (używając pakietu R copula), a następnie użycie pMvdc()funkcji na dużej próbce, aby uzyskać prawdopodobieństwo, którego chcę, ale nie jestem pewien, jak sobie z tym poradzić.


Wielowymiarowa dystrybucja Bernoulliego została opisana tutaj: arxiv.org/abs/1206.1874
Tim

Czy między próbami istnieje element czasowy, czy wszystkie są równoległe? Jeśli były, można dokonać upraszczające założenie, przy czym to tylko zależy od t r I do l í - n , gdzie n daje kolejność modelu Markowa? trialitrialinn
Zhubarb

Odpowiedzi:


17

Nie, jest to niemożliwe, gdy masz trzy lub więcej monet.

Przypadek dwóch monet

Zobaczmy najpierw, dlaczego działa dla dwóch monet, ponieważ zapewnia to pewną intuicję na temat tego, co psuje się w przypadku większej liczby monet.

Niech i Y oznaczają zmienne rozproszone Bernoulliego odpowiadające dwóm przypadkom, X B e r ( p ) , Y B e r ( q ) . Najpierw przypomnij sobie, że korelacja X i Y jestXYXBer(p)YBer(q)XY

corr(X,Y)=E[XY]E[X]E[Y]Var(X)Var(Y),

E[X]E[Y]Var(X)Var(Y)E[XY]XY=1X=1Y=1

E[XY]=P(X=1,Y=1).

p=P(X=1,Y=0)+P(X=1,Y=1)q=P(X=0,Y=1)+P(X=1,Y=1)P(X=1,Y=1)P(X=1,Y=0)P(X=0,Y=0)

P(X=1,Y=0)+P(X=0,Y=1)+P(X=1,Y=1).

Pij=P(X=i,Y=j)

P11

Sprawa trzech monet

6=3+323=877>6

XYZ

Pijk=P(X=i,Y=j,Z=k).

W takim przypadku obraz z góry wygląda następująco:

wprowadź opis zdjęcia tutaj

Wymiary zostały zderzone o jeden: czerwony wierzchołek stał się kilkoma kolorowymi krawędziami, a krawędź pokryta niebieskim prostokątem stała się całą twarzą. Niebieska płaszczyzna wskazuje tutaj, że znając margines, znasz sumę prawdopodobieństw w nim; dla tego na zdjęciu

P(X=0)=P000+P010+P001+P011,

corr(X,Y)E[XY]

E[XY]=P(X=1,Y=1)=P110+P111.

To nakłada pewne ograniczenia na możliwe rozkłady połączeń, ale teraz ograniczyliśmy ćwiczenie do ćwiczenia kombinatorycznego polegającego na umieszczaniu liczb na wierzchołkach sześcianu. Bez zbędnych ceregieli, podajmy dwa wspólne rozkłady, których marginesy i korelacje są takie same:

wprowadź opis zdjęcia tutaj

1001/2Ber(1/2)

1P0001P000

P111

Ber(1/10)

Cztery lub więcej monet

Wreszcie, gdy mamy więcej niż trzy monety, nie powinno dziwić, że możemy przygotować przykłady, które zawiodły, ponieważ mamy teraz jeszcze większą rozbieżność między liczbą parametrów wymaganych do opisania wspólnego rozkładu a parametrami dostarczonymi nam przez marginalnych i korelacje.

Konkretnie, dla dowolnej liczby monet większych niż trzy, możesz po prostu wziąć pod uwagę przykłady, których pierwsze trzy monety zachowują się jak w dwóch powyższych przykładach i dla których wyniki dwóch ostatnich monet są niezależne od wszystkich innych monet.


3

Skorelowane próby Bernoulliego prowadzą do rozkładu dwumianowego dla zliczonych wyników. Powinna istnieć możliwość parametryzacji tego rozkładu w celu uzyskania określonej wartości korelacji, a następnie obliczenia pożądanego prawdopodobieństwa.


Czy beta-dwumian nie jest tylko dwumianem, którego parametrem prawdopodobieństwa sukcesu jest zmienna losowa po wersji Beta? Jak to się odnosi do problemu PO?
AG

1
Tak, to jedna charakterystyka rozkładu. Jest to również jedno z rozwiązań skorelowanych prób Bernoulliego (patrz np. Hisakado i in. 2006 )
Ben - Przywróć Monikę

Tak jest! Pozytywne.
AG

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.