이 분포의 이름을 모르지만 총 확률 법칙에서 파생 할 수 있습니다. 각각 모수 ( r 1 , p 1 ) 및 ( r 2 , p 2 )를 갖는 음의 이항 분포를 가지고 있다고 가정하십시오 . X , Y 는 각각 r 1 '및 r 2 '실패 이전의 성공 횟수를 나타내는 매개 변수를 사용하고 있습니다. 그때,엑스, Y( r1, p1)( r2, p2)엑스, Y아르 자형1아르 자형2
피( X− Y= k ) = 전자와이( P( X− Y= k ) ) = E와이( P( X= k + Y) ) =∑와이= 0∞피( Y= y) P( X=k+y)
우린 알아
피( X= k + y) = ( k + y+ r1− 1k + y) (1-p1)아르 자형1피k + y1
과
피(Y=y) = ( y+ r2− 1와이) (1-p2)아르 자형2피와이2
그래서
피(X−Y= k ) = ∑와이= 0∞( y+ r2− 1와이) (1-p2)아르 자형2피와이2⋅ ( k + y+ r1− 1k + y) (1-p1)아르 자형1피k + y1
예쁘지 않아요. 내가 바로 보는 유일한 단순화는
피케이1( 1 - p1)아르 자형1( 1 - p2)아르 자형2∑와이= 0∞( p1피2)와이( y+ r2− 1와이) ( k+y+ r1− 1k + y)
여전히 추악합니다. 도움이되는지 확실하지 않지만 다음과 같이 다시 작성할 수도 있습니다.
피케이1( 1 - p1)아르 자형1( 1 - p2)아르 자형2( r1− 1 ) ! ( r2− 1 ) !∑와이= 0∞( p1피2)와이( y+ r2− 1 ) ! ( k + y+ r1− 1 ) !와이!(k+y)!
I'm not sure if there is a simplified expression for this sum but it could be approximated numerically if you only need it to calculate p-values
I verified with simulation that the above calculation is correct. Here is a crude R function to calculate this mass function and carry out a few simulations
f = function(k,r1,r2,p1,p2,UB)
{
S=0
const = (p1^k) * ((1-p1)^r1) * ((1-p2)^r2)
const = const/( factorial(r1-1) * factorial(r2-1) )
for(y in 0:UB)
{
iy = ((p1*p2)^y) * factorial(y+r2-1)*factorial(k+y+r1-1)
iy = iy/( factorial(y)*factorial(y+k) )
S = S + iy
}
return(S*const)
}
### Sims
r1 = 6; r2 = 4;
p1 = .7; p2 = .53;
X = rnbinom(1e5,r1,p1)
Y = rnbinom(1e5,r2,p2)
mean( (X-Y) == 2 )
[1] 0.08508
f(2,r1,r2,1-p1,1-p2,20)
[1] 0.08509068
mean( (X-Y) == 1 )
[1] 0.11581
f(1,r1,r2,1-p1,1-p2,20)
[1] 0.1162279
mean( (X-Y) == 0 )
[1] 0.13888
f(0,r1,r2,1-p1,1-p2,20)
[1] 0.1363209
I've found the sum converges very quickly for all of the values I tried, so setting UB higher than 10 or so
is not necessary. Note that R's built in rnbinom function parameterizes the negative binomial in terms of
the number of failures before the r'th success, in which case you'd need to replace all of the p1,p2's
in the above formulas with 1−p1,1−p2 for compatibility.