다항 분포 계수의 합


10

공정한 주사위를 던지고 있습니다. 1, 2 또는 3을 얻을 때마다 '1'을 기록합니다. 4를 얻을 때마다 '2'를 기록합니다. 5 또는 6을 얻을 때마다 '3'을 기록합니다.

내가 적어 모든 숫자의 곱에 필요한 총 던지기 수를 이라고합시다 . . 을 계산하거나 근사값을 정규 분포의 함수로 제공 할 수 있습니다.N100000P(N25)

먼저 이므로 임을 알고 있습니다. 이제 , , 는 각각 1, 2, 3을 쓴 횟수입니다. 그때:P(N11)=1log3100.00010.48abc

P(a,b,cn)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise

내가 계산하고 싶은 것은 :

P(a+b+c252b3c100000)

이것을 어떻게 계산합니까?

--편집하다:

따라서 조건을 다음과 같이 바꿀 수 있다고 제안했습니다.

P(a+b+c25αa+βb+γcδ)

여기서 , , 및 입니다.α=0β=log2γ=log3δ=log100000

이것은 더 해결 가능해 보입니다! 불행히도 여전히 해결 방법을 모릅니다.


2
+1이 문제는 좀 더 친숙해 보일 수 있으며 여기서 및 입니다. αa+βb+γcδα=0,β=log(2),γ=log(3),δ=log(100000)
whuber

조건을 작성하는 새로운 방법을 추가했지만 불행히도 여전히이 문제를 해결하는 방법에 대한 가장 확실한 단서가 없습니다!
Pedro Carvalho

또 다른 힌트는 '2' 가 번 발생하면 멈추게 된다는 것입니다. 따라서 매개 변수 및 ( 및 ) 의 음 이항으로 근사 할 수 있습니다. 많은 조합이 없기 때문에 정확한 답변도 관리 할 수 ​​있습니다. 또한, 조건이 정확하지 않습니다 - 당신이 '2'또는 '3'은에 기록되었다 포함 할 필요가 번째 롤17170.5111/3N
probabilityislogic

답변:


1

현재 질문은 다항식 랜덤 변수의 선형 함수 인 수량을 다루는 특정한 경우입니다. 필요한 불평등을 만족하는 다항식 조합을 열거하고 해당 범위에 대한 분포를 합산하여 문제를 정확하게 해결할 수 있습니다. 이 큰 경우에는 계산 상 불가능할 수있다. 이 경우 다항식에 대한 정규 근사값을 사용하여 근사 분포를 구할 수 있습니다. 이 근사치의 일반화 된 버전이 아래에 나와 있으며 이는 특정 예에 적용됩니다.N


일반적인 근사 문제 : 범위가 인 교환 가능한 랜덤 변수 시퀀스가 ​​있다고 가정하십시오 . 어떤 옵션 계수 결과 벡터 형성 할 의 수를 카운트, 시퀀스 의 처음 값 에서 각 결과의 발생 . 기본 시퀀스가 ​​교환 가능하므로 카운트 벡터는 다음과 같이 분포됩니다.1,2,...,mnNXX(n)(X1,X2,...,Xm)n

X ~ Mu(n,θ)θ=limnX(n)/n.

이제 음이 아닌 가중치 가중치를 사용하여 선형 함수를 정의한다고 가정합니다.w=(w1,w2,...,wm)

A(n)i=1mwiXi.

가중치가 음수가 아니기 때문에이 새로운 수량은 로 감소하지 않습니다 . 그런 다음 숫자 는 선형 함수에 대해 지정된 최소값을 얻는 데 필요한 최소 관측치입니다. 이 값이 (확률 적으로) 큰 경우 의 분포를 근사화하려고합니다 .nN(a)min{nN|A(n)a}N(a)


일반적인 근사 문제 해결 : 첫째, 은 에서 감소하지 않기 때문에 (모든 가중치가 음이 아닌 것으로 가정했기 때문에 유지됨) 다음과 같은 이점이 있습니다.A(n)n

P(N(a)n)=P(N(a)>n1)=P(A(n1)<a).

따라서 의 분포는 의 분포와 직접 관련이 있습니다 . 전자의 양이 크다고 가정하면 불연속 랜덤 벡터 을 다변량 정규 분포의 연속 근사치 로 대체하여 후자의 분포를 근사 할 수 있습니다 . 이로 인해 선형 수량 대한 정규 근사가 발생하며이 수량 의 모멘트를 직접 계산할 수 있습니다. 이를 위해 , 및 입니다 . 기본적인 대수를 사용하면 다음과 같은 이점이 있습니다.NAXA(n)E(Xi)=nθiV(Xi)=nθi(1θi)C(Xi,Xj)=nθiθjij

μE(1nA(n))=i=1mwiθi,

σ2V(1nA(n))=i=1mwiθi(i=1mwiθi)2=μ(1μ).

다항식에 정규 근사를 취하면 근사 분포 됩니다. 이 근사값을 적용하면 다음과 같은 결과가 나타납니다.A(n) ~ N(nμ,nμ(1μ))

P(N(a)n)=P(A(n1)<a)Φ(a(n1)μ(n1)μ(1μ)).

(기호 표준 정규 분포 함수의 표준 표기한다.) 양에 관한 확률이 근사 찾아 적용하는 것이 가능하다 지정된 값 . 이것은 기본 다항식이며 기본 다항식 카운트 값의 값에 연속성 수정을 통합하려고 시도하지 않았습니다. 정확한 선형 함수와 동일한 처음 두 개의 중심 모멘트를 사용하여 정규 근사를 수행하여 얻습니다.ΦN(a)a


문제에 대한 응용 프로그램 : 문제에는 확률 , 가중치 및 컷오프 값 . 따라서 (소수점 6 자리) 입니다. 우리가 가진 위의 근사를 적용하면 (소수점 6 자리) :θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729

P(N(a)25)Φ(ln100000240.481729240.499666)=Φ(0.019838)=0.492086.

정확한 다항 분포를 적용하여 요구 사항을 충족하는 모든 조합을 정확한 결과는 . 따라서 우리는 근사치가 현재의 정확한 답과 매우 가깝다는 것을 알 수 있습니다.P(A(24)<a)P(N(a)25)=0.483500

이 답변이 특정 질문에 대한 답변을 제공하는 동시에 다항식 랜덤 벡터의 선형 함수에 적용되는 확률 적 결과의보다 일반적인 프레임 워크 내에 배치하기를 바랍니다. 현재 방법을 사용하면 직면하고있는 일반적인 유형의 문제에 대한 대략적인 솔루션을 얻을 수 있으므로 예제의 특정 숫자가 달라질 수 있습니다.


0

정규 근사를하겠습니다.

먼저, 문제를 로그로 완전히 바꾸어 보자. 시간 t = 0에서 0부터 시작합니다. 그런 다음 각 단계에서 다음을 추가하십시오.

  • 1/2 확률로 0

  • log(2)확률이 1/6 인

  • log(3)확률이 1/3 인

합계가 를 초과 할 때이 과정을 중단합니다 . 해당 지점에 도달하는 데 걸린 횟수는 ^입니다.log(105)N

내 계산기는 증분의 평균이 이고 분산이 임을 알려줍니다 . 참고로, 종료 지점은 이므로 대략 24 단계로 도달합니다.0.480.2511.51

우리가 25 단계를 수행했다는 사실에 따라 합의 분포는 대략 12.0을 중심으로하고 분산이 6.25입니다. 이것은 우리에게 대략 가우시안 근사값을줍니다.p(N25)0.5

가우스 근사값이 올바른지 여부를 확인하려면 N = 25의 합의 누적량을 살펴 봐야합니다. 증분이 대칭이 아닌 경우 근사값이 최고가 아닐 수 있습니다.


1
당신은 나를 위해 파생을 완료 할 수 있습니까? 그것을 보는 데 어려움을 겪고 있습니다. 또한 정확한 계산 방법이 없습니까?
Pedro Carvalho

1
log (1) 및 log (2)가있는 "log (2)"및 "log (3)"을 의미하지 않습니까?
Glen_b-복지 주 모니카

@GuillaumeDehaene는 다음과 같이 썼다 : .... 나의 계산에 의해 이는 0.5p(N25)0.5P(N25)=1P(N24)=1112729185663307164998372267786240.8266
늑대와

P (n \ leq24) \ approx 0.18을 어떻게 얻습니까?
기 illa 데 하네
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.