다양한 다면체 주사위의 분포는 한 번에 무엇입니까?


15

던전 앤 드래곤 주사위 세트에서 5 개의 플라톤 고체를 가져 가십시오. 이들은 4면, 6면 (기존), 8면, 12면 및 20면 주사위로 구성됩니다. 모두 1에서 시작하여 총계에서 1까지 증가합니다.

한 번에 모두 굴려서 합계를 가져옵니다 (최소 합계는 5, 최대는 50입니다). 여러 번 그렇게하십시오. 분포는 무엇입니까?

분명히 그것들은 더 높은 숫자보다 더 낮은 숫자가 있기 때문에 저가로 향하는 경향이 있습니다. 그러나 개별 다이의 각 경계에 눈에 띄는 변곡점이 있습니까?

[편집 : 분명히 분명해 보이는 것은 그렇지 않습니다. 해설자 중 하나에 따르면 평균은 (5 + 50) /2=27.5입니다. 나는 이것을 기대하지 않았다. 그래도 그래프를보고 싶습니다.] [Edit2 : n 개의 주사위 분포가 각 주사위와 개별적으로 합쳐져 동일하다는 것을 알 수 있습니다.]


1
불연속 제복의 합 의 분포가 무엇 입니까? [1,4]+[1,6]+[1,8]+[1,12]+[1,20]
gung-모니 티 복원

2
그것을 검사하는 한 가지 방법은 시뮬레이션입니다. R에서 : hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE))). 실제로 로우 엔드쪽으로 향하지는 않습니다. 5에서 50 사이의 가능한 값 중 평균은 27.5이며 분포는 (시각적으로) 정상에서 멀지 않습니다.
David Robinson

2
내 D & D 세트에는 d10과 언급 한 5 개 (및 포함하지 않은 것으로 생각되는
억 달러

1
Wolfram Alpha 는 정답을 정확하게 계산합니다 . 여기입니다 확률 생성 함수를 직접 유통을 읽을 수있는가. BTW,이 질문은 stats.stackexchange.com/q/3614stats.stackexchange.com/questions/116792 에서 요청하고 철저히 답변 한 특별한 경우입니다 .
whuber

2
@AlecTeal : 터프 가이. 당신이 당신의 연구를했다면, 당신은 내가 직접 시뮬레이션을 실행할 omputer가 없었 음을 알 것입니다. 그리고 100 번 굴리는 것은 간단한 질문에 효과적이지 않은 것 같습니다.
Marcos

답변:


18

대수적으로하고 싶지는 않지만 pmf를 간단히 계산할 수 있습니다 ( 스프레드 시트에서 실제로 컨볼 루션 일뿐입니다 ).

스프레드 시트 *에서이를 계산했습니다.

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

여기서 은 각각의 총 i 를 얻는 방법의 수입니다 . p ( i ) 는 확률이며, 여기서 p ( i ) = n ( i ) / 46080 입니다. 가장 가능성이 높은 결과는 시간의 5 % 미만입니다.n(i)ip(i)p(i)=n(i)/46080

y 축은 확률로 백분율로 표시됩니다. 여기에 이미지 설명을 입력하십시오

* 내가 사용한 방법은 여기 에 설명 된 절차와 비슷 하지만 사용자 인터페이스 세부 사항이 변경 될 때 해당 설정을 수행하는 정확한 메커니즘이 변경됩니다 (이 게시물은 약 1 년 전에 업데이트되었지만 지금은 5 세 정도입니다). 그리고 이번에는 다른 패키지를 사용했습니다 (이번에는 LibreOffice의 Calc에서했습니다). 아직도, 그것은 그것의 요지입니다.


놀랍게도, 나는 대칭 분포를 전혀 기대하지 않았습니다. 내 직감이 왜 그렇게 멀리 떨어져 있는지 잘 모르겠습니다.
Marcos

6
독립 대칭 랜덤 변수의 합도 분포가 대칭입니다.
Glen_b-복지 주 모니카

좋은 규칙입니다. 어딘가에 출판 되었습니까?
Marcos

3
예,하지만 요점은 저널을 출판하기에 너무 사소한 것이지, 학생을위한 연습으로 만 설정 될 것입니다. 원점을 중심으로 대칭 인 랜덤 변수의 특성 함수가 실제적이고 고르다는 사실을 사용할 수 있습니다 (사실 특성 함수 의 위키 백과 페이지에서 확인할 수 있습니다 ). cfs 대 pmfs의 -to-one 속성 또는 이중 관계를 사용하여 짝수 cf도 대칭 pmf를 의미합니다.
Glen_b -Reinstate Monica

2
... 그리고 심지어 짝수 함수의 곱은 균등하지만 실제로는 항의 합계에 대한 모든 용어에 대해 두 개의 대칭 함수 (이 경우 PMfs)의 회선에서 회선의 작동 방식을 직접 고려하는 것만으로도 분명합니다. 한 쪽 끝에있는 제품은 다른 쪽 끝에 같은 크기의 해당 항이 중심 주위에 대칭으로 배치되어 있습니다.
Glen_b-복지 주 모니카

7

그래서 나는이 코드를 만들었다 :

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

결과는이 줄거리입니다. 여기에 이미지 설명을 입력하십시오

꽤 가우시안입니다. 우리는 (중간) 중심 한계 정리의 변형을 보여 주었다고 생각합니다.


2
흠, 시뮬레이션에서 가장 낮은 롤은 6입니다. 롤을 굴릴 확률 (또는 단일 ID를 유지하는 단일 롤)은 1 : 4 * 1 : 6 * 1 : 8 * 1 : 10 * 1 : 12 * 1 : 20입니다. = 1 : 460800. 내 절차에서는 모델링에 오류가 있음을 나타 내기 위해이 크기 (Nyquist 한도와 같은)의 최소 두 배 (아마도 4 배)의 샘플 크기 N을 요구합니다.
Marcos

Nyquist에 대한 나의 경험은 또한 최소 4 배라고 말합니다. ... 끝났다. 2 백만이면 충분하지 않다면 알려주세요.
EngrStudent-복직 모니카

3
n

1
@EngrStudent : BTW, 결과가 CLT를 확인하지 않습니까?
Marcos

1
@theDoctor 아니오, 여러 가지 이유로 CLT를 확인하지 않습니다
Glen_b -Reinstate Monica

7

직감에 약간의 도움 :

먼저, 하나의 다이의 모든면에 하나를 추가하면 어떻게되는지 고려하십시오 (예 : d4). 따라서 1,2,3,4 대신 얼굴에 2,3,4,5가 표시됩니다.

이 상황을 원본과 비교하면 총합이 이전보다 1 배 높다는 것을 쉽게 알 수 있습니다. 이것은 분포 의 형태 가 변하지 않고 단지 한 단계 씩 측면으로 이동 한다는 것을 의미합니다 .

이제 각 다이의 모든면에서 각 다이의 평균값을 뺍니다 .

이 주사위 표시

  • 32121232
  • 523212123252
  • 7252321212325272

기타

이제이 주사위들의 합은 여전히 ​​원래 모양과 같아야하며 아래쪽으로 만 이동해야합니다. 이 합은 0에 대해 대칭이라는 것이 분명해야합니다. 따라서 원래 분포도 대칭입니다.


4

P(X=i)=p(i)
Xi0,1,,n(0,1/6,1/6,1/6,1/6,1/6,1/6)p(t)=06p(i)tiq(j)j0,1,,mp(t)q(t)
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

(수동 계산으로) 올바른지 확인할 수 있습니다. 이제 진짜 질문으로 4,6,8,12,20면을 가진 다섯 개의 주사위가 있습니다. 각 주사위에 대해 균일 한 프로브를 가정하여 계산을 수행합니다. 그때:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

줄거리는 아래와 같습니다 :

여기에 이미지 설명을 입력하십시오

이제이 정확한 솔루션을 시뮬레이션과 비교할 수 있습니다.


1

중심 극한 정리는 귀하의 질문에 대답을 제공합니다. 세부 사항과 그 증거 (및 Wikipedia 기사)는 다소 구부러져 있지만 그 요지는 간단합니다. Wikipedia에 따르면

유한 분산을 갖는 다수의 독립적이고 동일하게 분포 된 랜덤 변수의 합은 변수의 수가 증가함에 따라 정규 분포를 따르는 경향이 있습니다.

귀하의 사례에 대한 증거 스케치 :

“한 번에 모든 주사위를 굴려 라”라고 말할 때, 모든 주사위의 각 롤은 무작위 변수입니다.

주사위에는 유한 번호가 인쇄되어 있습니다. 따라서 값의 합에는 유한 분산이 있습니다.

모든 주사위를 굴릴 때마다 결과의 확률 분포는 동일합니다. 주사위는 롤간에 바뀌지 않습니다.

주사위를 공정하게 굴리면 굴릴 때마다 결과는 독립적입니다. (이전 롤은 향후 롤에 영향을 미치지 않습니다.)

독립적 인? 검사. 동일하게 분배 되었습니까? 검사. 유한 분산? 검사. 따라서 합은 정규 분포를 향하는 경향이 있습니다.

모든 주사위의 한 롤에 대한 분포가 로우 엔드쪽으로 기울어 져 있는지는 중요하지 않습니다. 그 분포에 교두가 있는지는 중요하지 않습니다. 모든 합산은 그것을 부드럽게하고 대칭 가우시안으로 만듭니다. 그것을 보여주기 위해 대수 또는 시뮬레이션을 할 필요조차 없습니다! 이것이 CLT의 놀라운 통찰력입니다.


3
CLT는 관련성이 있고 다른 게시물에서 볼 수 있듯이 분포는 대략 가우스 모양이지만 5 개의 독립적 인 비 동일 분포의 합만 처리 합니다. 따라서 포인트 1) 5는 "무한대로"적용되는 정리를 호출하기에 충분히 크지 않습니다. 포인트 2) 합계하는 것이 iid가 아니기 때문에 바닐라 CLt를 사용할 수 없습니다. 당신은 Lyapunov CLT가 필요하다고 생각합니다.
Peter

2
각 중심에 대해 대칭 인 분포를 갖는 일부 독립 랜덤 변수의 합에 중심의 합에 대한 대칭 분포가 있다고 말하는 데에는 중앙 한계 정리가 필요하지 않습니다.
Henry

@ 피터 : 내 증거의 구조가 없습니다. OP는 "한 번에 모두 롤"이라고 말합니다. 나는 모든 주사위의 롤을 하나의 랜덤 변수로 사용하고 있습니다. 이러한 랜덤 변수는 동일한 분포를 갖습니다. Lyapunov가 필요하지 않습니다. 또한 OP는 "여러 번 수행"이라고 표시합니다. "제한"을 의미하므로 포인트 # 1이 유효하지 않습니다. 우리는 여기서 5 주사위 한 롤을 합한 것이 아닙니다.
Paul Cantrell

2
@PaulCantrell 모든 주사위의 각 롤은 5 개의 독립적 인 비 동일 분포 변수의 합입니다. OP는 해당 금액의 분포에 대해 묻고 있습니다. 당신은 5 주사위의 많은 롤을 할 수 있지만, 그것은 문제의 분포에서 샘플링 된 것입니다.
Peter

1
@PaulCantrell "여러 번 그렇게"해석하는 방법에 따라 다릅니다. 여러 번 수행하면 다시 합산되거나 (단일 값 가져 오기) 여러 번 수행하고 해당 샘플의 히스토그램 (여러 값 가져 오기)을 살펴 봅니다. 나는 후자의 해석을했다.
Peter
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.