두 개의 독립 포아송 랜덤 변수의 가중치 합


10

Wikipedia를 사용하여 두 Poisson 랜덤 변수의 합으로 인한 확률 질량 함수를 계산하는 방법을 찾았습니다. 그러나 나는 내가 가지고있는 접근법이 잘못되었다고 생각합니다.

하자 평균 두 독립 와송 확률 변수 일 및 은 여기서 및 상수, 다음의 확률 생성 함수이다 주어진다 이제 포아송 랜덤 변수에 대한 확률 생성 함수가 이라는 사실을 사용하여 확률 확률 함수를 작성할 수 있습니다. 두 독립 포아송 랜덤 변수의 합은 X1,X2λ1,λ2S2=a1X1+a2X2a1a2S2

GS2(z)=E(zS2)=E(za1X1+a2X2)GX1(za1)GX2(za2).
GXi(z)=eλi(z1)
GS2(z)=eλ1(za11)eλ2(za21)=eλ1(za11)+λ2(za21).
도함수를 취함으로써 의 확률 질량 함수 가 회복 된 것 같습니다 , 여기서 .G S 2 ( z ) Pr ( S 2 = k ) = G ( k ) S 2 ( 0 )S2GS2(z) G ( k ) S 2 =dkG S 2 (z)Pr(S2=k)=GS2(k)(0)k!GS2(k)=dkGS2(z)dzk

이것이 맞습니까? 상수 및 때문에 확률 미분 함수를 얻기 위해 미분을 취할 수 없다고 생각합니다 . 이게 옳은 거니? 다른 접근법이 있습니까?a 2a1a2

이것이 정확하다면 이제 모든 k에 대해 무한 합을 잘라서 누적 분포의 근사치를 얻을 수 있습니까?


1
왜 과 하여 summand를 확장 합니까? 합은 이것없이 또 다른 포아송 분포 일뿐입니다. 변수는 양의 정수로 값을 가지므로 첫 번째에 곱한 후 에 두 번째를 곱하는 것은 일반적으로 부자연 스럽기 때문에 두 변수의 값을 모두 복구 할 수 있습니다. a 2 1 a1a212
Douglas Zare

3
여기서 어려움은 과 가 모두 정수가 가 정수 값만 취 한다는 것을 확신 할 수 없다는 것 입니다. 따라서, 안 단지 찾아야 정수 값에 대해 뿐만 아니라 각각 로 표현 될 수 음이 아닌 정수의가 및 . a 2 S 2 P ( S 2 = k ) k P ( S 2 = α ) α a 1 m + a 2 n m na1a2S2P(S2=k)kP(S2=α)αa1m+a2nmn
Dilip Sarwate

@DilipSarwate 가능합니까? 다른 접근 방법이 있습니까?
Michel

@ DouglasZare이 작업을 수행해야합니다 ... 어쩌면 부트 스트랩 방법으로 전환해야 할 수도 있습니다.
Michel

1
가 취할 수 있는 가능한 값을 다음 각 에 대해 사용 하는 무차별 접근 방식보다 훨씬 더 나은 방법은 없다고 생각합니다대부분의 및 선택의 경우 대부분의 합계가 단일 용어로 줄어들 것으로 예상됩니다. 경우 는 매개 변수가 포아송 랜덤 변수 라는 것을 알고 있습니다. α P { S 2 = α } = a 1 m + a 2 n = α P { X 1 = m } P { X 2 = n } = a 1 m + a 2 n = α exp ( λ 1 m ) λ m 1S2α
P{S2=α}=a1m+a2n=αP{X1=m}P{X2=n}=a1m+a2n=αexp(λ1m)λ1mm!exp(λ2n)λ2nn!.
a1a2a1=a2=1S2λ1+λ2
Dilip Sarwate

답변:


5

이 선형 조합에서 단일 값에 많은 확률이 집중되어 있지 않다면, Cornish-Fisher 확장 은 (역) CDF에 대한 근사치를 제공 할 수 있습니다.

이 확장은 의 처음 몇 누적을 사용하여 표준 정규 분포의 역 CDF를 조정합니다 . 그것의 비대칭 이다S2β1

a13λ1+a23λ2(a12λ1+a22λ2)3

첨도 는β2

a14λ1+3a14λ12+a24λ2+6a12a22λ1λ2+3a24λ22(a12λ1+a22λ2)2.

표준화 된 버전의 의 백분위 수 를 찾으려면 계산αS2

wα=z+16β1(z21)+124(β23)(z23)z136β12z(2z25z)124(β23)β1(z45z2+2)

여기서 는 표준 정규 분포 의 백분위 수입니다. 따라서 의 백분위 수는zαS2

a1λ1+a2λ2+wαa12λ1+a22λ2.

수치 실험에 따르면 과 가 모두 초과하면 입니다. 예를 들어, 및 (편의를 위해 제로 평균을 제공하도록 배열 됨)를 고려하십시오.λ1λ25λ1=5, λ2=5π/2, a1=π,a2=2

그림

파란색 음영 부분은 의 수치 적으로 계산 된 CDF이며 , 아래의 빨간색은 Cornish-Fisher 근사치입니다. 근사값은 본질적으로 실제 분포의 부드러운 정도이며 작은 체계적인 출발 만 보여줍니다.S2


2
자주 잊혀지는 도구를 잘 사용하는 것은 물론 또는 정도의 경우 무차별 대입법 방법이 그렇게 고통 않습니다. λ1λ25
jbowman

1

컨볼 루션을 사용하십시오.

하자 에 대한 , , 그렇지 않으면 및 용 , , 그렇지.fX1(x1)=λx1eλx1!x10fX1(x1)=0fX2(x2)=λx2eλx2!x20fX2(x2)=0

하자 때문에 전자를 컨볼 루션이라고합니다.Z=X1+X2X1=ZX2

fZ(z)=fx1,x2(zx2,x2)dx1dx2

경우 및 , 독립적 이렇게하면 두 개의 연속 랜덤 변수의 합의 분포를 얻을 수 있습니다.X1X2

fZ(z)=fX1(zx2)fX2(x2)dx1dx2

이산 형 포아송 분포의 경우 매개 변수가 포아송 분포이기도합니다.

fZ(z)=x2=0zλ1zx2eλ1(zx2)!λ2x2eλ2x2!
=e(λ1+λ2)(λ1+λ2)zz!
λ1+λ2

2
이것은 다른 질문, 즉 두 개의 포아송 분포를 추가하는 방법에 대한 답변으로 나타납니다. 특별한 경우는 (그러나 문제없이 로 확장 될 수 있음 ). 그러나 이면 어떻게하겠습니까? a1=a2=1a1=a2a1a2
whuber

0

해결책은 복식 포아송 분포의 개념이라고 생각합니다. 아이디어는 임의의 합 과 푸 아송 분포 및 및 의 순서와 무관 . 때 우리하는 경우에 restric 항상 우리가 설명 할 수 실수에 대한 와 푸 아송 분포 . pgf를 합 경우 밝히다

S=i=1NXi
NXiiidNXi=kkNkN
E[skN]=E[(sk)N]=GN(sk)=exp(λ(sk1))
Z=k1N1+k2N2
GZ(s)=exp(λ1(sk11)+λ2(sk21)).
λ=λ1+λ2 그리고 최종 해석 결과 RV는 강도 화합물 푸 아송 분포이다이다 및 분포 값 인출 확률 및 값 와 .
GZ(s)=exp(λ(λ1λ(sk11)+λ2λ(sk11))=exp(λ(λ1λsk1+λ2λsk11)).
λ=λ1+λ2Xik1λ1/λk2λ2/λ

분포가 복합 포아송임을 증명 및 가 양의 정수인 경우 Panjer 재귀를 사용할 수 있습니다 . 또는 pgf 형식에서 푸리에 변환을 쉽게 도출하고 역으로 배분할 수 있습니다. 점 질량이 있습니다.k1k20

토론 후 편집 :

당신이 할 수있는 최선은 MC라고 생각합니다. 이것이 Poisson distr 복합이라는 파생물을 사용할 수 있습니다.

  1. 샘플 N (매우 효율적)Pois(λ)
  2. 그런 다음 각 대해 인지 인지 , 첫 번째 확률이 인지 여부를 샘플링합니다 . 성공 확률 로 Bernoulli rv를 샘플링하여이를 수행하십시오 . 이 경우 다음 추가 샘플링 합 다른 추가로 .i=1,,NX1X2λ1/λλ1/λ1k1k2

당신은 초에 100 000의 샘플을 가질 것입니다.

또는 초기 표현에서 두 개의 summand를 별도로 샘플링 할 수 있습니다 ... 이것은 빠릅니다.

상수 계수 k1과 k2가 완전히 일반적인 경우 다른 모든 것 (FFT)은 복잡합니다.


1
인수가 정수인 경우 Panjer 알고리즘에서 최종 분포를 찾을 수 있습니다.
Ric

감사! I는 도착 그러나 , 이것부터 시작하여 일종의 분포를 얻을 수있는 방법을 찾고 싶습니다. Panjer 알고리즘을 언급 했습니까? 그러나이 경우 입니다. @DilipSarwate 다음 일반적으로 . GS2(z)=eλ1(za11)eλ2(za21)a1,a2R1P{S2=α}=a1m+a2n=αP{X1=m}P{X2=n}=a1m+a2n=αexp(λ1m)λ1mm!exp(λ2n)λ2nn!,a1,a2
Michel

안녕 미셸, 나는 내 응답을 편집했습니다. 예 Panjer는 제한적으로 사용됩니다. 그러나 푸리에 변환 접근법을 시도 할 수 있습니다. 그러나 정수가 아닌 단위는 문제가 있습니다 ...이 경우 어떻게 해야할지에 대해 더 많이 생각해야합니다. 어느 쪽이든 결과는 복합 포아송 분포 ( "단순"포아송 분포가 아님)라는 점에 유의해야합니다.
Ric

리차드 안녕하세요, 업데이트 주셔서 감사합니다! 내가 수치 적으로 계산해야한다는 것을 의미합니까? ? Pr(S2=x)=12πReitxGS2(eit)dt
Michel

무언가가 ... 우리가 특징적인 기능을 계산할 수있는 연속 분포가 있다면, 이것은 빠르고 좋은 결과를 가져옵니다. 우리의 경우에는 생각할 시간이 더 필요합니다. 더 쉬운 것이 있어야합니다.
Ric
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.