균일하게 분포 된 숫자의 차이가 균일하게 분포되어 있습니까?


22

우리는 6면 주사위를 여러 번 굴립니다.

롤과 이전 롤 간의 차이 (절대 값)를 계산하면 차이가 균일하게 분포 될 것으로 예상됩니까?

10 개의 롤로 설명하려면 :

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

겠습니까 diff값이 균일하게 분포 할 수?


13
적어도 감각을 얻기 위해 히스토그램을
플로팅하십시오

2
포아송 분포를 확인하십시오 .
leftaroundabout

이것은 숙제처럼 보입니다 ....
Manu H

@ Manu H, 숙제 날이 뒤처 질 것입니다
HeyJude

답변:


37

아니 균일하지 않습니다

절대 차이에 대해 36 가능성을 똑같이 계산할 수 있습니다.

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

이는 절대 차이에 대한 확률 분포를 제공합니다.

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas이 답변의 표는 어설 션과 모순됩니다. 예를 들어, 가능한 차이 중 하나만 5 인 반면 6 개는 0이라는 것을 알 수 있습니다.
whuber

13
@onurcanbektas 나는 다시 한 번 당신을 초대합니다. 5의 절대 차이가 두 개뿐이므로 차이가 5와 같지 않다는 것이 분명하지 않습니까?
whuber

14
@onurcanbektas 간단한 차이 (예 : 부호, 따라서 -5 ~ +5의 정수)의 경우 분포는 0의 모드 (대부분 가능한 값)를 갖는 대칭 이산 삼각 분포입니다. 모드는 1입니다.
Henry

2
그러나 부호있는 차등 모듈로 6이 균일하게 분포되어 있음을 주목할 가치가 있습니다.
Federico Poloni

2
@FedericoPoloni 이것은 분명하지 않습니까? 나는 코멘트를 읽기 전에, 나는 그것에 대해 정말로 생각하지는 않지만, 이것이 단순히 사실이어야한다는 것이 명백하다
Cruncher

21

확률과 실수에 대한 가장 기본적인 공리 만 사용하면 훨씬 더 강력한 진술을 증명할 수 있습니다.

두 개의 독립적이고 동일하게 분포 된 일정 하지 않은 임의의 값 의 차이 는 이산 균일 분포를 갖지 않습니다 .XY

(연속 변수에 대한 유사한 진술은 Uniform PDF에서 두 rv의 차이에 대해 입증되었습니다 .)

아이디어는 기회이다 극단적 인 값이있는 가능성 미만이어야합니다 단 하나 개의 방법이 있기 때문에, 제로 (말) 극대화 차이 제로를 만들기 위해 여러 가지 방법이 있습니다 반면 때문에, 와 있다 동일한 분포이므로 서로 같을 수 있습니다. 자세한 내용은 다음과 같습니다.XYXYXYXY

먼저 문제 가되는 가상의 두 변수 와 는 각각 양의 확률 로 유한 수 의 값만 얻을 수 있다는 것을 관찰하십시오 . 왜냐하면 적어도 뚜렷한 차이가 있고 균일 한 분포가 모든 확률을 동일하게 할당하기 때문입니다. 경우 무한하고 있으므로 불가능 그 확률의 합이 무한 될 어디서 양극을 갖는 가능한 차이 동일한 확률의 개수 일 수있다.XYnnn

다음으로 , 차이의 수가 유한하기 때문에 그 중에서 가장 큰 차이가있을 것입니다. 가장 작은 값을 감산하면 큰 차이 만 달성 될 수있다 때문이죠의 통화가 및 가정 그것은 확률 갖는 --from의 최대 값 때문이죠의 호출이 하나 와 와 는 독립적 이기 때문에 이러한 차이의 가능성은 이러한 기회의 결과입니다.Ymq=Pr(Y=m)XMp=Pr(X=M).XY

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

마지막으로 , 와 의 분포가 동일 하기 때문에 차이가 값 생성 할 수있는 방법은 여러 가지가 있습니다. 이러한 방법 중 및 이 분포가 일정하지 않기 때문에 은 과 다릅니다 이는 두 경우가 분리 된 사건이므로 가 0 일 확률에 이상의 양을 기여해야 함 을 나타냅니다 . 그건,XY0.X=Y=mX=Y=M.mM.p 2 + q 2 X - Yp2+q2XY

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

번호 제곱 마이너스 아니므 우리가 어디서부터 추론 그0(pq)2,()

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

의 분포 가 균일하지 않다는 것을 보여주는 QED.XY

주석에 대한 응답으로 편집

절대 차이의 유사한 분석 와 의 분포가 동일 하기 때문에이를 위해서는 를 공부해야합니다동일한 대수 기법으로 거의 같은 결과를 얻을 수 있지만 및이 방정식 시스템에는 고유 한 해가 있습니다|XY|XYm=M.Pr(XY=|Mm|)=2pq.2pq=2pq+(pq)22pq+p2+q2=1.p=q=1/2공정한 동전 ( "양면 다이")에 해당합니다. 이 예외를 제외하고는 절대 차이의 결과는 차이의 결과와 동일하며 이미 주어진 동일한 이유 때문에 : 즉, 두 가지 이상의 차이가있을 때마다 두 개의 iid 랜덤 변수의 절대 차이를 균일하게 분포시킬 수 없습니다. 긍정적 인 확률로.

(편집 끝)


이 결과를 질문에 적용하여 조금 더 복잡한 것을 묻습니다.

임의의 변수 을 사용하여 다이의 각 독립적 인 롤 ( 불공정 한 다이 일 수 있음 )을 모델링합니다 이 롤 에서 관찰 된 차이점 은 이 숫자가 얼마나 균일하게 분포되어 있는지 궁금 할 것 입니다. 그것은 실제로 통계적 기대치에 대한 질문입니다. 예를 들어 예상되는 수는 0입니까? 예상 수 무엇이다 동일 ? Xi, i=1,2,,n.nΔXi=Xi+1Xi.n1ΔXiΔXi1

이 질문의 문제는 가 독립적 이지 않다는 것 입니다. 예를 들어 및 는 동일한 롤 포함합니다ΔXi Δ X 1 = X 2 - X 1 Δ X 2 = X 3 - X 2 X 2 입니다.ΔX1=X2X1ΔX2=X3X2X2.

그러나 이것은 실제로 어려움이 아닙니다. 통계적 기대 첨가제 모든 차이점은 우리가 임의의 가능한 값을 선택할 경우, 동일한 분포를 갖기 때문에 의 차이를 시간의 예상 수의 차이는 동일 전체 시퀀스에서 롤 그냥 의 배 예상 개수 프로세스의 단일 단계에서 차이와 를 곱한 값 즉, 단일 단계의 기대는 (임의위한 ). 단일 대해 동일한 경우에만 이러한 기대치는 모든 (즉, 균일 )에 대해 동일합니다kknn1kPr(ΔXi=k)ikΔ X i . Δ X iΔXi. 그러나 우리는 가 다이가 바이어스 될 때에도 균일 한 분포 를 갖지 않는 것을 보았습니다 . 따라서, 이러한 약한 기대 주파수 감각에서도 롤의 차이는 일정하지 않다.ΔXi


@Michael Good point : 나는 (절대적인 차이를 분명히 나타내는) 설명 된 것이 아니라 질문 된대로 ( "차이"에 관한) 질문에 대답했습니다. 동일한 기술이 적용됩니다. 최대 및 최소 차이를 모두 고려해야합니다. 그것들이 유일한 두 가지 가능성 (0과 함께) 인 경우, Bernoulli 결과가 나오는 곳에서 평등을 얻을 수 있습니다 독특한 예임을 보여줍니다). (1/2)
whuber

이것의 특정 버전을 증명하는 또 다른 대답이 여기 있습니다 .
모니카 복원

고마워, @Ben : 나는 그 실을 잊었다. 더 나은 참조이므로 이제이 답변에서 직접 연결됩니다.
whuber

12

직관적 인 수준에서 임의의 이벤트는 모든 결과가 똑같이 가능한 경우에만 균일하게 분배 될 수 있습니다.

문제가되는 임의의 사건에 대해서도 맞습니까? 두 주사위 롤 사이의 절대적인 차이입니까?

이 경우 극단을 보는 것으로 충분합니다.이 차이가 취할 수있는 가장 크고 작은 값은 무엇입니까?

분명히 0은 가장 작고 (절대적인 차이를보고 롤은 동일 할 수 있음) 5는 가장 큽니다 ( 6vs 1).

이벤트가 0보다 발생 가능성이 높거나 적음 을 보여줌으로써 이벤트가 일정하지 않음을 보여줄 수 있습니다 5.

첫 번째 주사위가 6이고 두 번째 주사위가 1 인 경우 또는 그 반대 인 경우 한 번에 5 가지 방법이 있습니다 . 0은 몇 가지 방법으로 발생할 수 있습니까?


1
+1 문제의 핵심이라고 생각합니다. 나는 궁극적으로 동일한 관찰에 의존하는 질문의 일반화를 게시했습니다.
whuber

5

Henry가 제시 한 바와 같이, 균일하게 분포 된 분포의 차이는 균일하게 분포되지 않습니다.

시뮬레이션 된 데이터로이를 설명하기 위해 매우 간단한 R 스크립트를 사용할 수 있습니다.

barplot(table(sample(x=1:6, size=10000, replace=T)))

여기에 이미지 설명을 입력하십시오

우리는 이것이 실제로 균일 한 분포를 만들어내는 것을 볼 수 있습니다. 이제이 분포에서 두 개의 임의 표본의 절대 차이 분포를 살펴 보겠습니다.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

여기에 이미지 설명을 입력하십시오


6
이것이 왜 많은 수의 iid 값에 대한 점근 적 분포에 관한 CLT와 관련이 있습니까?
whuber

2
나는 당신이 원래 CLT 로 만든 연결을 좋아합니다 . 하자 샘플의 개수가 원래 균일 분포로부터 추가 (또는 감산) 될 수. CLT 는 이 큰 경우 분포가 정상으로 향하는 경향이 있음을 의미합니다 . 이는 OP가 요구하는 와 같이 대해 분포가 균일하게 유지 될 수 없음을 의미합니다 . (자세한 설명이 아닌 경우 일 때 합계가 균일하게 분포 된 경우 재 인덱싱은 큰 포함하여, N , N > 1 , N = 2 , N = 2 , N = 4 , Nnnn>1n=2n=2n=4n
등일

3
@Krubo 원래의 질문은 주사위의 연속 롤 사이의 차이 분포에 대해 묻습니다. CLT는 그것에 대해 아무 말도하지 않습니다. 실제로, 주사위를 몇 번 굴려도 이러한 차이의 분포는 정규성에 도달하지 않습니다.
whuber

다이면의 수가 무한대가 될수록이 분포는 균일 한 경향이 있습니까? 어떻게 보여줄지 잘 모르겠지만, 직관적으로 그것은 그 방향으로 향하는 것처럼 느껴지지만, 충분히 평평 해지기 전에 어딘가에 무증상으로 "막히게"될지 모르겠습니다
Cruncher

@Cruncher R 코드에서 다이 페이스의 수를 쉽게 변경할 수 있습니다. 면이 많을수록 분포의 층계 특성이 더 분명해집니다. '1'은 항상 해당 계단의 최고점이며 차이가 클수록 확률은 거의 0입니다. 또한 '0'의 차이는 '1'보다 분명하지 않습니다. (적어도 다이의 가장 작은 값이 '1'인 경우)
LuckyPal

2

다른 사람들은 계산을 해왔으므로 더 직관적 인 답변을 드리겠습니다. 두 unifrom rv (Z = X + (-Y))의 합을 연구하려고합니다. 전체 분포는 (이산) 회선 곱입니다.

P(Z=z)=k=P(X=k)P(Y=zk)

이 합은 다소 직관적입니다. 를 얻을 확률은 X로 무언가를 얻을 확률 ( 여기서 로 표기)과 -Y 로 를 보완 하는 확률의 합입니다 .zkz

신호 처리에서 컨볼 루션 제품의 작동 방식을 알고 있습니다.

  • 두 개의 균일 함수 (두 개의 직사각형)의 컨볼 루션 곱은 삼각형을 제공합니다. 이것은 연속적인 기능을 위해 wikipedia에 의해 설명됩니다 :

여기에 이미지 설명을 입력하십시오

  • 여기서 일어나는 일을 이해할 수 있습니다 : 가 위로 이동하면 (수직 점선) 두 사각형의 공통 영역이 위 아래로 이동합니다. 이는 를 얻을 확률에 해당합니다 .zz

  • 더 일반적으로 우리는 컨볼 루션에 의해 안정된 유일한 기능은 가우시안 familly의 기능이라는 것을 알고 있습니다. 즉, 가우스 분포 만이 가산 (또는 일반적으로 선형 조합)에 의해 안정적입니다. 이는 균일 분포를 결합 할 때 균일 분포를 얻지 못함을 의미합니다.

왜 우리가 그 결과를 얻는 지에 대한 답은 그 함수의 Fourrier 분해에 있습니다. 컨볼 루션 제품의 Fourrier 변환은 각 함수의 Fourrier 변환의 단순 곱입니다. 이것은 사각형 함수와 삼각형 함수의 fourrier 계수 사이에 직접 링크를 제공합니다.


귀하의 주장의 타당성과 답변의 논리를 확인하십시오. 문제는 두 개의 균일 분포의 회선이 균일한지 여부가 아니라 일부 분포와 반전 의 회선 이 균일 할 수 있는지 여부 입니다. 그리고 컨볼 루션 하에서 안정된 가우시안보다 훨씬 더 많은 분포 패밀리가 있습니다 (물론 모듈로 표준화) : en.wikipedia.org/wiki/Stable_distribution
whuber

당신은 안정적인 분포에 대해 옳습니다. 질문에 대해, 이것이 균일 분포 (제목으로 표시)와 두 개의 임의 값의 차이에 관한 것입니다. 일부 분포의 컨볼 루션과 반전이 균일 할 수 있는지에 대한 질문은 여기에서 요구되는 것보다 큽니다.
lcrmorin

1

경우 와 두 개의 연속 주사위 롤, 당신은 시각화 할 수 있습니다 ( ) 각 색상은 의 다른 값에 해당합니다 .xy|xy|=kk=0,1,2,3,4,5k

연속 주사위 롤 차이 시각화

쉽게 알 수 있듯이 각 색상의 포인트 수는 동일하지 않습니다. 따라서 차이점이 균일하게 분산되지 않습니다.


0

하자 차이와 나타낸다 롤의 값을, 다음 DtXP(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

따라서 함수 는 에서 일정하지 않습니다 . 이는 분포가 균일하지 않음을 의미합니다.P(Dt=d)d

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.