랜덤 그래프에서 삼각형 수의 분포 및 분산


10

고려 에르 도스 - RENYI 랜덤 그래프 G=(V(n),E(p)) . n 개의 정점 세트 VV={1,2,,n} 됩니다. 에지 세트 ( E 는 랜덤 프로세스에 의해 구성된다.

하자 p 확률 수 0<p<1 , 순서화하고 각 쌍 {i,j} 정점 ( ij )의 에지로 발생 E 확률과 p 서로 독립적 쌍.

의 삼각형 은 별개의 꼭짓점 G의 순서가없는 삼중 {i,j,k} 로, {i,j} , {j,k}{k,i} 모서리입니다 G.

가능한 삼각형의 최대 개수는 입니다. 그래프 에서 랜덤 변수 를 관측 된 삼각형 수로 정의하십시오 . XG(n3)XG

세 개의 링크가 동시에 존재할 확률은 입니다. 따라서, 예상 값 주어진다 . 당연히, 분산이 의해 주어진 것으로 추측 할 수 있지만, 그렇지 않습니다. X E ( X ) = ( np3XE(X2)= ( nE(X)=(n3)p3E(X2)=(n3)p3(1p3)

다음 Mathematica 코드는 문제를 시뮬레이션합니다.

n=50;
p=0.6;
t=100;
myCounts=Table[Length[FindCycle[RandomGraph[BernoulliGraphDistribution[n,p]],3,All]],{tt,1,t}];
N[Mean[myCounts]] // 4216. > similar to expected mean
Binomial[n,3]p^3 // 4233.6
N[StandardDeviation[myCounts]] // 262.078 > not similar to "expected" std
Sqrt[Binomial[n,3](p^3)(1-p^3)] // 57.612
Histogram[myCounts]

의 분산은 무엇입니까 ?X

답변:


4

하자 IFF를 삼각형을 형성한다. 그런 다음 및 각 입니다. 이것은 예상 값을 계산하는 데 사용한 것입니다.{ i , j , k } X = i , j , k Y i j k Y i j kB e r n o u l l i ( p 3 )Yijk=1{i,j,k}X=i,j,kYijkYijkBernoulli(p3)

차이의 경우, 문제는 가 독립적이지 않다는 것입니다. 실제로두 삼각형이 존재할 확률 인 을 계산해야합니다 . 몇 가지 경우가 있습니다. X 2 = Σ I , J , K의 Σ I ' , J ' , K ' Y I의 j 개의 K Y I ' , J ' K ' . E [ Y I J의 K Y I ' , J ' K ' ]Yijk

X2=i,j,ki,j,kYijkYijk.
E[YijkYijk]
  • 만약 (동일 세 꼭지점)을 . 이중 합계 에는 용어가 있습니다.{i,j,k}={i,j,k}E[YijkYijk]=p3(n3)
  • 만약 세트 과 , 우리는 두 개의 삼각형을 얻을 본 5 가장자리 필요한 공통 정확히 2 개 요소가되도록 . 있을 것이다 합 이러한 용어.{i,j,k}{i,j,k}E[YijkYijk]=p512(n4)
  • 세트하면 과 공통적 한 요소가, 우리는 6 가장자리 본 필요되도록 . 합계 에는 있습니다.{i,j,k}{i,j,k}E[YijkYijk]=p630(n5)
  • 세트하면 과 공통적으로 0 요소가, 우리는 6 가장자리 본 필요되도록 . 합계 에는 있습니다.{i,j,k}{i,j,k}E[YijkYijk]=p620(n6)

모든 사례를 다루었 음을 확인하기 위해 합계는 됩니다.(n3)2

(n3)+12(n4)+30(n5)+20(n6)=(n3)2

예상 평균의 제곱을 빼는 것을 기억하면이 모든 것을 종합하면 다음과 같습니다.

E[X2]E[X]2=(n3)p3+12(n4)p5+30(n5)p6+20(n6)p6(n3)2p6

예제와 동일한 숫자 값을 사용하여 다음 R 코드는 표준 편차를 계산하며 이는 시뮬레이션에서 262 값에 상당히 가깝습니다.

n=50
p=0.6
sqrt(choose(n, 3)*p^3+choose(n, 2)*(n-2)*(n-3)*p^5+(choose(n, 3)*choose(n-3, 3)+n*choose(n-1, 2)*choose(n-3, 2))*p^6-4233.6^2)
298.7945

다음 Mathematica 코드는 표준 편차를 계산하여 동일한 결과를 제공합니다.

mySTD[n_,p_]:=Sqrt[Binomial[n,3]p^3+12Binomial[n,4]p^5+30 Binomial[n,5]p^6+20Binomial[n,6]p^6-(Binomial[n,3]p^3)^2]
mySTD[50,0.6] // gives 298.795

2
실제로 매우 간단합니다. 잘 했어! 답을 약간 업데이트하여 표현을 단순화하고 Mathematica 코드를 추가했습니다 . 또한 시뮬레이션을 10k 회 실행하고 예상 값에 매우 가까운 std 295.37을 얻었습니다.
LBogaardt

1
편집 해 주셔서 감사합니다. 10k 반복 시뮬레이션으로 답을 확인하게되어 기쁩니다!
Robin Ryder

방향 그래프에 대한 원래 참조를 찾았습니다 : Holland (1970). 사회 측정 데이터에서 구조를 탐지하는 방법.
LBogaardt

0

파생하는 약간 다른 접근 방식을 제공합니다 .X2

Robin Ryder와 같은 경우로 :

  • 만약 즉, 3 개 정점 따라서 우리는 3 개 중 정점을 선택 N 가능하며, 동일 . 3 개의 모서리가 있어야합니다 . 결합 :{i,j,k}={i,j,k}(n3)p3(n3)p3

  • 만약 과 수단 것이 일반적인 두 정점을 있는 그리고 그 반대도 마찬가지입니다 (각 삼각형에는 다른 삼각형의 일부가 아닌 하나의 꼭지점이 있습니다). Wlog 및 가 언급 된 분리 된 정점이고 = , = 이라고 상상해보십시오 . = , = 를 달성하려면 n 개의 가능한 에서 동일한 두 꼭지점을 선택해야합니다 . 들어{i,j,k}{i,j,k}v{i,j,k}v{i,j,k}v=kv=kiijjiijj(n2)kk남겨진 정점에서 두 개를 더 선택해야합니다. 첫 번째 : 및 두 번째 : . 모서리 및 는 동일하므로 5 개의 모서리가 있어야합니다. . 결합 :(n2)(n3){i,j}{i,j}p5(n2)(n2)(n3)p5

  • 만약 과 공통적으로 하나의 정점이 다음 분리 된 4이다. wlog, = 라고 상상해보십시오 . 즉, 가능한 꼭지점 중에서 1 선택해야합니다 . 삼각형 의 경우 나머지 2 개의 정점을 선택 합니다. 삼각형 의 경우 나머지 중 를 선택합니다. 이는 및 입니다. 공통점은 하나뿐이므로 6 개의 모서리가 있어야합니다.{i,j,k}{i,j,k}iin{i,j,k}(n1)(n12){i,j,k}(n3)(n32)j{i,j,k}k{i,j,k}p6 . 결합 :n(n12)(n32)p6

  • 마지막 경우 : 및 에 공통된 꼭지점이없는 경우 두 삼각형이 분리됩니다. 우리는 n 개의 가능한 에서 3 개의 꼭짓점을 첫 번째 삼각형으로 선택합니다 . 그리고 두 번째 삼각형, 중 3 개의 꼭지점이 남아 있습니다. 삼각형은 분리되어 있습니다. 즉, 모서리와 정점을 공유하지 않으므로 6 개의 모서리가 있어야합니다 . 결합 :{i,j,k}{i,j,k}(n3)(n3)(n33)p6(n3)(n33)p6

Robin Ryder의 접근 방식과 마찬가지로 다음 사항도 확인할 수 있습니다.

(n3)+(n2)(n2)(n3)+n(n12)(n32)+(n3)(n33)=(n3)2 보유.

이것은 다음으로 이어진다 :

Var[X]=E[X2]E[X]2=(n3)p3+(n2)(n2)(n3)p5+n(n12)(n32)p6+(n3)(n33)p6(n3)2p6.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.