두 포아송 표본의 평균이 같은지 확인


30

이것은 기본적인 질문이지만 답을 찾을 수 없었습니다. 두 가지 측정이 있습니다 : 시간 t1의 n1 이벤트와 시간 t2의 n2 이벤트, 둘 다 람다 값이 다른 Poisson 프로세스에 의해 생성됩니다.

이것은 실제로 뉴스 기사에서 유래 한 것으로, 본질적으로 이기 때문에 두 가지가 다르다고 주장하지만 주장이 유효한지 확실하지 않습니다. 기간이 악의적으로 선택되지 않았다고 가정하십시오 (하나 또는 다른 이벤트를 최대화하기 위해).n1/t1n2/t2

t- 테스트 만 할 수 있습니까 , 아니면 적절하지 않습니까? 이벤트 수는 너무 작아서 배포판을 거의 정상적으로 배포 할 수 없습니다.



1
과학 저널리즘의 훌륭한 표본이 있습니다.
Matt Parker

1
그래 ... 왜 통계를 확인하고 싶은지 알 수 있습니다
Charles

답변:


25

푸 아송 평균을 검정하기 위해 조건부 방법은 Przyborowski와 Wilenski (1940)에 의해 제안되었습니다. X1 + X2가 주어진 X1의 조건부 분포는 성공 확률이 2λ 비율의 함수 인 이항 분포를 따릅니다. 따라서 이항성 성공 확률에 대한 추론을위한 정확한 방법을 통해 가설 검정 및 구간 추정 절차를 쉽게 개발할 수 있습니다. 이 목적을 위해 일반적으로 두 가지 방법이 고려됩니다.

  1. C 테스트
  2. 전자 테스트

이 두 테스트에 대한 자세한 내용은이 백서에서 찾을 수 있습니다. 두 포아송 평균을 비교하기위한보다 강력한 테스트


4
O(n1n2)

1
전자 시험 논문의 저자는 여기에 두 개의 포아송 수단에 대한 계산의 P-값에 대한 간단한 포트란 구현을 썼다 : ucs.louisiana.edu/~kxk4695 내가 MATLAB 여기에 자신의 포트란을 이식 git.io/vNP86
AndyL

11

어때요 :

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

이것은 1과 2의 포아송 비율을 서로 비교하고 ap 값과 95 % 신뢰 구간을 제공하는 테스트입니다.


2 표본 문제의 경우 이항 검정을 사용하여 비율을 비교합니다.
Jon

10

빠르고 쉬운 확인을 원합니다.

λt=t1+t2[0,t1]n1[t1,t1+t2]n2

λ^=n1+n2t1+t2

nitiλ^ni


1
감사합니다 (+1). 이런 종류의 커프를 제대로 점검하지 않아도됩니다. 결과적으로 매우 중요하여 (p = 0.005) 기사가 훌륭합니다. 그래도 다른 대답을 받아 들였다는 점을 신경 쓰지 않기를 바랍니다. 중요한 경우 '진정한'방법을 아는 것이 좋습니다.
찰스

5

ap 값보다 신뢰 구간에 더 관심이 있습니다. 여기에는 부트 스트랩 근사가 있습니다.

먼저 간격의 길이를 계산하고 확인하십시오.

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

이 검사는 출판물과 약간 다른 결과 (100.03 % 증가)를 제공합니다 (101 % 증가). 부트 스트랩으로 계속하십시오 (두 번 수행).

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

증가의 95 % 신뢰 구간은 31 %에서 202 %입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.