긴 꼬리의 푸 아송 누적 분포의 간단한 근사치?


10

주어진 대해 미만의 잔차 확률 이 오버플로 되도록 테이블 의 용량 를 결정하고 싶습니다. 항목 수가 주어진 Poisson 법칙을 따른 다고 가정합니다. 기대치 .2 - p p [ 40 120 ] E [ 10 310 12 ]C2pp[40120]E[1031012]

이상적으로, 나는 최소의 정수를 원하는 C같은 것을 1-CDF[PoissonDistribution[E],C] < 2^-p부여를 위해 pE; 그러나 나는 C그것보다 약간 높은 것에 만족 합니다. Mathematica는 수동 계산에는 적합하지만 컴파일 타임 과 컴파일 타임 에 계산 C하고 싶습니다 .64 비트 정수 산술로 제한됩니다.pE

업데이트 : Mathematica (버전 7) e = 1000; p = 40; c = Quantile[PoissonDistribution[e], 1 - 2^-p]1231옳고 보입니다 (@Procrastinator 덕분에). 그러나 모두에 대한 결과 p = 50p = 60입니다 1250안전하지 않은 측면에 잘못 (그리고 문제 : 내 실험과 같은 반복 배 이상, 나는 명백히 미만 원하는 실패의 전반적인 확률). 컴파일 타임에 C (++)에서 사용할 수있는 64 비트 정수 산술 만 사용하여 조잡하지만 안전한 근사치 원합니다 . 2 - (30)225230


1
어때요 C = Quantile[PoissonDistribution[E],1-2^p]?

1
푸 아송의 확률 질량 함수의 주요 용어는 꼬리에서 지배적입니다.
추기경

1
@Procrastinator : 매스 매 티카의 작품 (의 기호를 제외한 네 것을 p, 정밀 문제, 이름 EC그이 예약되어 있습니다). 그러나 64 비트 정수 arityhmetic 만 사용하여 원유 (그러나 안전한면)에 대한 간단한 근사가 필요합니다!
fgrieu

3
업데이트 : Mathematica 8은 대해 1262를 , 대해 1290을 반환합니다 . 다시 정규 근사 (@Proc) : 꼬리에서 잘 작동 할 것으로 예상 할 수 없으며 이는 계산에 중요합니다. p=50p=60
whuber

1
아마도 당신은 stackoverflow에 요청해야합니다. 나는 당신이 가진 제약에 익숙하지 않습니다. 동적 메모리 할당을 사용하지 못하게하는 이유 또는 분기를 사용하여 배열 크기를 결정할 수 있는지 또는 필요한 크기의 두 배인 배열을 정의하는 데 드는 비용은 무엇입니까? 그것의). 와 같은 함수 가 당신은 정확한 대답, 당신은 당신의 제약 조건 하에서 근사를 구현할 수 있습니까? 지금은 프로그래밍 문제처럼 보입니다. μ+loglogμlogμμ+pμlogμ
Douglas Zare

답변:


10

평균이 큰 포아송 분포는 대략 정규이지만 꼬리 경계를 원하고 꼬리 근처에서 정규 근사값이 비례 적으로 덜 정확해야합니다.

이 MO 질문 과 이항 분포에 사용되는 한 가지 접근 방식 은 테일이 기하 계열보다 더 빠르게 감소한다는 것을 인식하여 기하 계열로 명시적인 상한을 작성할 수 있습니다.

k=Dexp(μ)μkk!<k=Dexp(μ)μDD!(μD+1)kD=exp(μ)μDD!11μD+1<exp(μ)μD2πD(D/e)D11μD+1=exp(Dμ)(μD)DD+12πD(D+1μ)

2 행 3 행은 스털링의 공식과 관련이있다. 실제로 바이너리 검색을 사용하여 숫자 를 풀고 싶다고 생각합니다 . 의 초기 추측으로 시작하는 뉴턴의 방법작동해야합니다.plog2=log(bound)D=μ+cμ.

예를 들어 및 인 경우 얻는 숫자 솔루션은 1384.89입니다. 평균이 포아송 분포는 확률이 에서 사이 의 값을숫자 내지 확률로 발생할p=100μ=100010000138411/2100.06.0138311/299.59.


1
+1. 또 다른 접근법은 포아송 꼬리 확률 (오른쪽)과 감마 분포의 꼬리 확률 (왼쪽)을 새들 포인트 근사로 밀접하게 (과도하게) 추정 할 수있는 것과 관련이 있습니다.
whuber

64 비트 정수 연산 (exp, log, sqrt ..없이)으로 제한되는 것에 이르기까지 먼 길이 있지만, 나는 그것을 할 것입니다. 모두 감사합니다!
fgrieu

(+1)는 스털링의 근사치의 호출까지가 (무관하다)입니다 정확히 은 영업 이익 내 댓글에 참조 내가 (불투명)이었다 바인딩. (예를 들어, 여기를 참조하십시오 .)
추기경

2

P. Harremoës : Poisson 랜덤 변수의 꼬리 확률에 대한 날카로운 경계 https://helda.helsinki.fi/bitstream/handle/10138/229679/witmse_proc_17.pdf 주요 불평등은 다음과 같습니다. 하자 매개 변수 포아송 확률 변수가 될 . 넣어 하자 표준 정규 법에 대한 누적 분포 함수를 나타낸다. 그런 다음 모든 정수 에 대해 이는 와 같습니다. 모든 정수 대해Yλ

G(x)=2(xlnxλ+λx)  sign(xλ).
Φk0
P(Y<k)Φ(G(k))P(Yk),
Φ(G(k1))P(Y<k)Φ(G(k))
k>0. 또한, 의미하는 모든 정수 대해 입니다 .Φ(G(k+(1/2)))P(Yk)
Φ(G(k1/2))P(Y<k)Φ(G(k))
k>0


만약 당신이 한때 링크가 죽었을 때 도움이 될 주요 방정식 (하나 나 둘만 있다고 가정)을 쓸 수 있다면.
jbowman
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.