Rozkład i wariancja liczby trójkątów na losowym wykresie


10

Rozważmy losowy wykres Erdosa-Renyi . Zbiór wierzchołków jest oznaczony . Zbiór krawędzi jest konstruowany losowo.G=(V(n),E(p))nVV={1,2,,n}E

Niech będzie prawdopodobieństwem , wtedy każda nieuporządkowana para wierzchołków ( ) występuje jako krawędź w z prawdopodobieństwem , niezależnie od innych par.p0<p<1{i,j}ijEp

Trójkąt w to nieuporządkowany potrójny różnych wierzchołków, taki że , i są krawędziami .G{i,j,k}{i,j}{j,k}{k,i}G

Maksymalna liczba możliwych trójkątów to (n3) . Określić zmienną losową X być obserwowana liczba trójkątów na wykresie G .

Prawdopodobieństwo obecności trzech łączy jednocześnie wynosi p3 . Dlatego oczekiwaną wartość X podaje E(X)=(n3)p3 . Naiwnie można się domyślać, że wariancję podaje E(X2)=(n3)p3(1p3) , ale tak nie jest.

Poniższy kod Mathematica symuluje problem:

n=50;
p=0.6;
t=100;
myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}];
N[Mean[myCounts]] // 4216. > similar to expected mean
Binomial[n,3]p^3 // 4233.6
N[StandardDeviation[myCounts]] // 262.078 > not similar to "expected" std
Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612
Histogram[myCounts]

Jaka jest wariancja X ?

Odpowiedzi:


4

Niech iff utworzy trójkąt. Następnie i każdy . Właśnie tego użyłeś do obliczenia oczekiwanej wartości.Yijk=1{i,j,k}X=i,j,kYijkYijkBernoulli(p3)

W przypadku wariancji problem polega na tym, że nie są niezależne. Rzeczywiście, napisz Musimy obliczyć , czyli prawdopodobieństwo, że oba trójkąty są obecne. Istnieje kilka przypadków:Yijk

X2=i,j,ki,j,kYijkYijk.
E[YijkYijk]
  • Jeśli (te same 3 wierzchołki), to . W podwójnej sumie będzie takich warunków.{i,j,k}={i,j,k}E[YijkYijk]=p3(n3)
  • Jeśli zestawy i mają dokładnie 2 wspólne elementy, to potrzebujemy 5 krawędzi, aby uzyskać dwa trójkąty, tak aby . w sumie będzie takich warunków.{i,j,k}{i,j,k}E[YijkYijk]=p512(n4)
  • Jeśli zestawy i mają wspólny 1 element, to potrzebujemy 6 krawędzi, aby . W będzie takich warunków.{i,j,k}{i,j,k}E[YijkYijk]=p630(n5)
  • Jeśli zestawy i mają wspólny element 0, to potrzebujemy 6 krawędzi, aby . W będzie takich warunków.{i,j,k}{i,j,k}E[YijkYijk]=p620(n6)

Aby zweryfikować, że uwzględniliśmy wszystkie sprawy, zauważ, że suma sumuje się do .(n3)2

(n3)+12(n4)+30(n5)+20(n6)=(n3)2

Pamiętanie o odjęciu kwadratu oczekiwanej średniej, zebranie tego razem daje:

E[X2]E[X]2=(n3)p3+12(n4)p5+30(n5)p6+20(n6)p6(n3)2p6

Korzystając z tych samych wartości liczbowych co w przykładzie, poniższy kod R oblicza odchylenie standardowe, które jest dość zbliżone do wartości 262 z twojej symulacji.

n=50
p=0.6
sqrt(choose(n, 3)*p^3+choose(n, 2)*(n-2)*(n-3)*p^5+(choose(n, 3)*choose(n-3, 3)+n*choose(n-1, 2)*choose(n-3, 2))*p^6-4233.6^2)
298.7945

Poniższy kod Mathematica oblicza również odchylenie standardowe, co daje ten sam wynik.

mySTD[n_,p_]:=Sqrt[Binomial[n,3]p^3+12Binomial[n,4]p^5+30 Binomial[n,5]p^6+20Binomial[n,6]p^6-(Binomial[n,3]p^3)^2]
mySTD[50,0.6] // gives 298.795

2
Właściwie dość proste. Dobra robota! Lekko zaktualizowałem twoją odpowiedź, upraszczając wyrażenia i dodając kod Mathematica . Uruchomiłem także moją symulację 10 razy i uzyskałem std 295,37, bardzo zbliżony do oczekiwanej wartości.
LBogaardt,

1
Dzięki za edycję. Cieszę się, że symulacja z 10k iteracjami potwierdza odpowiedź!
Robin Ryder,

Znalazłem oryginalne odniesienie dla grafów ukierunkowanych: Holland (1970). Metoda wykrywania struktury w danych socjometrycznych.
LBogaardt

0

Podaję nieco inne podejście do wyprowadzania .X2

Z takim samym rozróżnieniem skrzynek jak Robin Ryder:

  • Jeśli tj. 3 wierzchołki są takie same, więc musimy wybrać 3 wierzchołki spośród n możliwych . Musimy mieć 3 krawędzie obecne . Połączone:{i,j,k}={i,j,k}(n3)p3(n3)p3

  • Jeśli i mają dwa wspólne wierzchołki, oznacza to, że dla którego i odwrotnie (każdy trójkąt ma jeden wierzchołek, który nie jest częścią drugiego trójkąta). Wlog wyobraża sobie, że oraz są wspomnianymi wierzchołkami rozłącznymi i = , = . Aby osiągnąć = , = , musimy wybrać te same dwa wierzchołki spośród n możliwych . Dla{i,j,k}{i,j,k}v{i,j,k}v{i,j,k}v=kv=kiijjiijj(n2)kkmusimy wybrać jeszcze dwa z pozostałych wierzchołków. Pierwszy: i drugi: . Ponieważ krawędzie i są takie same, musimy mieć 5 krawędzi . Łącznie:(n2)(n3){i,j}{i,j}p5(n2)(n2)(n3)p5

  • Jeśli i mają tylko jeden wspólny wierzchołek, wówczas 4 są rozłączne. Wyobraź sobie, wlog, że = . Oznacza to, że spośród n możliwych wierzchołków musimy wybrać 1 . Dla trójkąta wybieramy 2 wierzchołki z pozostałych . W przypadku trójkąta wybieramy 2 z pozostałych , wynika to z założenia, że i . Ponieważ mamy tylko jeden wspólny wierzchołek, musimy mieć 6 krawędzi{i,j,k}{i,j,k}iin{i,j,k}(n1)(n12){i,j,k}(n3)(n32)j{i,j,k}k{i,j,k}p6 . Łącznie:n(n12)(n32)p6

  • W ostatnim przypadku: jeśli i nie mają wspólnego wierzchołka, wówczas dwa trójkąty są rozłączne. Wybieramy pierwszy trójkąt, 3 wierzchołki z n możliwych . I drugiego trójkąta, 3 wierzchołki z pozostały . Trójkąty są rozłączne, tzn. Nie mają żadnych krawędzi i wierzchołków, dlatego musi być obecnych 6 krawędzi . Połączone:{i,j,k}{i,j,k}(n3)(n3)(n33)p6(n3)(n33)p6

Podobnie jak w podejściu Robina Rydera, możemy również zweryfikować, czy:

(n3)+(n2)(n2)(n3)+n(n12)(n32)+(n3)(n33)=(n3)2 trzyma.

To prowadzi do:

Var[X]=E[X2]E[X]2=(n3)p3+(n2)(n2)(n3)p5+n(n12)(n32)p6+(n3)(n33)p6(n3)2p6.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.