음수가 될 수없는 경우 연결 수는 가우시안 일 수 있습니까?


14

가상 네트워크가 아닌 소셜 네트워크를 분석하고 사람들 간의 연결을 관찰하고 있습니다. 어떤 사람이 무작위로 연결하기 위해 다른 사람을 선택한다면, 적어도 현재 읽고있는 책에 따라 한 그룹의 사람들 사이의 연결 수가 정상적으로 분배됩니다.

분포가 가우시안 (정상)인지 어떻게 알 수 있습니까? Poisson, Rice, Rayliegh 등과 같은 다른 분포가 있습니다. 이론상 Gaussian 분포의 문제점은 값이 에서 (확률이 0으로 향하지만)가되고 연결 수가 될 수 없다는 것입니다 부정.+ +

각 사람이 독립적으로 (임의로) 다른 사람을 연결하여 다른 사람과 연결할 경우 어떤 배포가 예상되는지 아는 사람이 있습니까?


1
설명 : "전체 그룹의 총 연결 수"또는 "한 사람의 총 연결 수"에 대한 질문입니까? 내 대답은 후자를 암시 적으로 가정합니다.

1
라일리 배포? 그것은 저에게 새로운 것입니다. 당신은 참조 또는 링크가 있습니까?
onestop

3
"레이 레이"?
whuber

답변:


6

이 경우 사용자 및 사용자에 의해 이루어지는 연결의 개수 , 1 N ,X 후 연결의 총 수는 S , N = Σ N = 1 X I / 2 . 이제 X i 를 임의의 변수로 가정하고, 변수가 독립적이면서 더 많은 사람들이 믹스에 추가 될 때 차이가 "너무 불균등하지 않다"고 가정하면 Lindeberg-Levy Central Limit Theorem이 적용됩니다. 그것은 주장 누적 분포 함수나는,1나는,엑스나는에스=나는=1엑스나는/2엑스나는표준화 정규 분포의 CDF에 합계 수렴. 이것은 대략 n의 히스토그램이 이 커짐에 따라 가우시안 ( "벨 곡선")처럼 점점 더 많이 보일 것임을 의미 합니다.

이것이 말하지 않은 것을 검토합시다 .

  • 그것은의 분포 주장하지 않습니다 있나이다 정확히 정상. 당신이 지적한 이유로 할 수 없습니다.에스

  • 예상되는 연결 수가 수렴한다는 것을 의미하지는 않습니다. 실제로, 그것은 분기되어야합니다 (무한대로 이동). 표준화는 배포판을 최근에 재조정 한 것입니다. 크기 조정의 크기는 제한없이 증가하고 있습니다.

  • 엑스나는


나는 모든 사람이 정확히 하나의 다른 사람을 연결하도록 선택 한다는 것을 나타 내기 위해 질문을 해석하지는 않습니다 . 대신 나는 네트워크에 들어갈 때 모든 사람들이 n 개의 연결 중에서 무작위로 연결을 선택하고 0에서 n 개의 연결까지 어디에서나 감기를 선언한다고 해석했습니다. 분산에 대한 가정은 신규 이민자가 할 연결 수에 제한이 있고 그 수에 "최소한"무작위성 이있을 때 보장됩니다 .
whuber

엑스나는

1
@Andy 사람이 아님 : 연결 수. 중요한 것은 개인이 만든 연결 수가 실제로 다양하고 일정하게 설정되지 않을 가능성이 있다는 것입니다. 이 경우 연결 수의 제한 분포는 변하는 유한 한 초기 연결 수에 따라 결정되므로 정규 분포에 무조건 접근 할 수 없습니다.
whuber

1

대답은 당신이 기꺼이 내린다는 가정에 달려 있습니다. 소셜 네트워크는 시간이 지남에 따라 끊임없이 진화하므로 정적 인 존재가 아닙니다. 따라서 시간이 지남에 따라 네트워크가 어떻게 진화하는지에 대한 몇 가지 가정을해야합니다.

아르 자형영형(개인에 대한 연결 수=1)=1

한 사람이 다른 사람을 무작위로 선택하여 연결하면 결국 모든 사람이 연결됩니다.

그러나 실제 네트워크는 이러한 방식으로 작동하지 않습니다. 사람들은 여러 측면에서 다릅니다.

  1. 사람은 항상 고정 된 네트워크 크기를 가지고 있고 다른 연결이 이루어질 가능성은 (사람들이 다른 사람을 소개하는 등) 자신의 네트워크 크기의 함수입니다.

  2. 어떤 사람은 내 향적 / 외향적 인 것처럼 연결을 형성하는 본질적인 경향이 있습니다.

이러한 확률은 시간, 상황 등에 따라 변합니다. 네트워크 구조 (예 : 네트워크 밀도, 사람들의 행동 방식 등)에 대해 몇 가지 가정을하지 않는 한 직접적인 대답이 확실하지 않습니다.


@Srikant "사소한 답변"을 도출하는 방법을 설명해 주시겠습니까? (그 뒤에는 언급되지 않은 몇 가지 가정이 있어야합니다.) 그리고 "결국에 모든 사람이 연결될 것"이라는 결론을 내릴 때 어떤 정리를 참조하십니까? 전혀 분명하지 않습니다!
whuber

@ whuber 네트워크 크기가 고정되어 있다고 가정합니다. 질문은 다음과 같이 말합니다. 한 사람이 임의로 다른 사람을 선택하여 연결을 만들고 아마도 이것이 진행중인 프로세스 일 것입니다. 따라서 시간이 무한대로되면서 모든 사람이 연결되어야합니다. 정리, 직관 아마도, 나는 부정확 한 언어를 사용하고있을 것입니다.

@Srikant 오랜 시간이 지난 후 "Prob (No of connections = n)"는 n = 3 일 때 1과 같고 그렇지 않으면 항상 0이기 때문에 여전히 혼란 스러워요. 결국, "모두 연결해야"할 때 연결 수는 n (n-1) / 2와 같습니다. 나는 당신이 동시에 여러 가지 무작위 프로세스를 염두에두고 있다고 생각합니다. 가정을 밝히고 좀 더 정확하게 설명하는 데 도움이 될 수 있습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.