에는 Stouffer의 Z 점수 방법 : 우리는 합계 경우 어떻게 대신 ?


22

동일한 귀무 가설로 독립적 인 통계 테스트를 수행 하고 결과를 하나의 p 값 으로 결합하고 싶습니다 . Fisher의 방법과 Stouffer의 방법 이라는 두 가지 "허용되는"방법이있는 것 같습니다 .PNp

내 질문은 Stouffer의 방법에 관한 것입니다. 각각의 개별 테스트마다 z-score zi . 귀무 가설 하에서 이들 각각은 표준 정규 분포로 분포되므로, 합 Σzi 는 분산이 N 인 정규 분포를 따릅니다 N. 따라서 Stouffer의 방법은 \ Sigma z_i / \ sqrt {N} 을 계산 Σzi/N하여 단위 분산으로 정규 분포를 구한 다음이를 공동 z- 점수로 사용하도록 제안합니다 .

이것은 합리적이지만 여기에 내가 생각해 낸 또 다른 접근법이 있으며 나에게도 합리적입니다. 각 zi 는 표준 정규 분포에서 나오므로 , 제곱 S = \ Sigma z ^ 2_i 의 합은 N 자유도 S=Σzi2를 갖는 카이 제곱 분포에서 가져와야 합니다 . 따라서 N 자유도를 갖는 누적 카이 제곱 분포 함수를 사용하여 S 를 계산 하고이를 p- 값으로 변환 할 수 있습니다 ( p = 1−X_N (S) , 여기서 X_N 은 CDF 임).NSpNp=1XN(S)XN

그러나이 접근법을 언급 할 수있는 곳은 없습니다. 사용 된 적이 있습니까? 이름이 있습니까? Stouffer의 방법과 비교하여 장점 / 단점은 무엇입니까? 아니면 내 추리에 결함이 있습니까?


Stouffer의 방법은 z_i의 체계적인 변화를 감지 할 수 있다는 점에서 두드러진 결함이 있습니다 zi. 이는 z -i 제곱 법이 그렇게 할 힘이 덜한 것처럼 보이는 대안입니다. 빠른 시뮬레이션 ( N=100 , 104 반복)은 이것이 사실임을 보여줍니다. 카이 제곱 방법은 심각하게 일방적 인 대안을 감지 할 강력한.
whuber

2
고마워, whuber! 시뮬레이션을 좀 더 자세히 설명해 주시겠습니까? 반면에 가 다르지만 절대 값이 크면 Stouffer의 방법은 전체적으로 내 방법은 VERY 유의 p를 보고합니다 . 어떤 경우에는 훨씬 더 의미가 있다고 생각합니다 (제 경우에는 확실하지만 확실하지 않습니다). z 0 pziz0p
아메바는

1
당신이 옳습니다. 그래서 나는 내 의견을 답변으로 게시하지 않았습니다. 그러나 우연으로 인한 경우를 제외하고 는 대안이 방향 에서 널과 크게 다른 경우에는 어떤 종류의 상황이 있습니까?
whuber

내가 염두에 둔 상황은 Pearson의 카이 제곱 테스트와 비슷하며 경험적 분포가 널과 다른지 여부에 관심이 있습니다. 그런 다음 두 방향의 편차가 중요합니다. 그러나 두 번째 생각을 한 후에는 직감이 정확하고 내 경우에는 의심스러운 편차가 모두 한 방향으로 있다고 생각합니다. 귀하의 의견을 답변으로 게시하고 빠른 시뮬레이션에 대한 세부 정보를 제공하면 (카이 제곱 법이 덜 강력한 것으로 판명되는 이유가 매우 궁금합니다!), 나는 그것을 기꺼이 받아 들일 것입니다.
amoeba는

n Z 점수의 합은 분산이 n? 분산이 평균의 표준 오차의 제곱이 아닌 이유는 무엇입니까? 제목에 암시 된 의 합계에는 N의 분산이 있습니다. 어쩌면 분명한 것이 누락 되었을까요? Z2
russellpierce

답변:


17

튀어 나온 한 가지 결함은 Stouffer의 방법이 체계적인 변화를 감지 할 수 있다는 , 이는 하나의 대안이 일관되게 사실 일 때 일반적으로 일어날 것으로 예상되는 반면, 카이 제곱 법은 그렇게 할 힘이 덜한 것으로 보입니다. 빠른 시뮬레이션은 이것이 사실임을 보여줍니다. 카이 제곱 방법은 일방적 인 대안을 탐지하는 데 덜 효과적입니다. 다음은 독립 반복 및 없음에서 범위에 이르는 다양한 단측 표준화 효과 ( )에 대한 두 가지 방법 (빨간 = 스토퍼, 파랑 = 카이 제곱)에 의한 p- 값의 히스토그램입니다 SD 를 통해 ( )10 5 N = 10 μ μ = 0 0.6 μ = 0.6zi105N=10μμ=00.6μ=0.6

그림

더 좋은 절차는 더 많은 면적을 0에 가깝게합니다. 표시된 의 모든 양수 값에 대해 해당 절차는 Stouffer 절차입니다.μ


R 코드

여기에는 비교를위한 Fisher의 방법 (설명)이 포함됩니다.

n <- 10
n.iter <- 10^5
z <- matrix(rnorm(n*n.iter), ncol=n)

sim <- function(mu) {
  stouffer.sim <- apply(z + mu, 1, 
                    function(y) {q <- pnorm(sum(y)/sqrt(length(y))); 2*min(q, 1-q)})
  chisq.sim <- apply(z + mu, 1, 
                    function(y) 1 - pchisq(sum(y^2), length(y)))
  #fisher.sim <- apply(z + mu, 1,
  #                  function(y) {q <- pnorm(y); 
  #                     1 - pchisq(-2 * sum(log(2*pmin(q, 1-q))), 2*length(y))})
  return(list(stouffer=stouffer.sim, chisq=chisq.sim, fisher=fisher.sim))
}

par(mfrow=c(2, 3))
breaks=seq(0, 1, .05)
tmp <- sapply(c(0, .1, .2, .3, .4, .6), 
              function(mu) {
                x <- sim(mu); 
                hist(x[[1]], breaks=breaks, xlab="p", col="#ff606060",
                     main=paste("Mu =", mu)); 
                hist(x[[2]], breaks=breaks, xlab="p", col="#6060ff60", add=TRUE)
                #hist(x[[3]], breaks=breaks, xlab="p", col="#60ff6060", add=TRUE)
                })

다시 한 번 감사드립니다. 매우 좋습니다. Fisher의 방법을 주석 해제하면 어떻게됩니까? 이미 시도한 것 같습니다. Stouffer는 지속적으로 승리합니까? (내가 직접 시도하지 않아서 미안하지만 R에 대한 경험이 없으며 직접 가지고
있지도

업데이트 : Fisher와 Stouffer의 방법 비교와 관련하여 여기서 좋은 토론을 찾았 습니다 . 주장은 Stouffer는 null에서 일관된 편차에 더 민감하고 Fisher는 단일 (그러나 큰) 편차에 더 민감하다는 주장입니다. 시뮬레이션에서 일관된 편차 ( 모든 테스트 에서 와 동일 )가 맞습니까? 테스트 중 1 회만 큰 편차를 보이는 경우 어떻게 될지 궁금합니다 . N NμNN
아메바는

1
R시뮬레이션을 쉽게 수정하여 이를 테스트 할 수 있습니다 . 이 통계 컴퓨팅 플랫폼을 소개하는 좋은 방법입니다. :-)
whuber

2
matlab을 사용하여 시뮬레이션을 재현했습니다. 결론 : 모든 가 0에서 일관되게 벗어나면 Stouffer는 작은 마진으로 Fisher를 이기고 "나"방법은 절망적으로 . 중 하나만 0에서 많이 벗어나면 Fisher는 작은 마진으로 "my"방법을 이기고 Stouffer는 절망적으로 잃습니다. z zizi
amoeba는 Reinstate Monica가

훌륭한 토론과 품질 관리! 한 빠른 질문 : 어떤 하나 개의 형태로이 문제의 경우 이상치 (outlier) / 이상 탐지 등의 마할 라 노비스 거리와 후속 뭔가 계산하여 ?
NULL

10

테스트 통계에 대한 통찰력을 얻는 일반적인 방법 중 하나는 테스트 통계를 가장 강력하게 만드는 기본 가정을 도출하는 것입니다. 이 특별한 경우에 학생과 저는 최근에 이것을 수행했습니다 : http://arxiv.org/abs/1111.1210v2 (개정판은 Annals of Applied Statistics에 나타납니다).

아주 간단히 요약하고 (또 다른 답변의 시뮬레이션 결과와 일치) "진정한"기본 효과가 모두 같을 때 Stouffer의 방법이 가장 강력합니다. Z ^ 2의 합은 기본 효과가 일반적으로 0에 대해 분포 될 때 가장 강력합니다. 이는 세부 사항을 생략하는 약간의 단순화입니다. 자세한 내용은 위의 arxiv 프리 프린트의 섹션 2.5를 참조하십시오.


2
(+1) 어떻게 든 내가 오래 전에 쓴다고 생각했지만, 그렇지 않은 것 같습니다. 특별히 내 질문에 대답하기 위해 여기에 등록 해 주셔서 감사합니다! 감사합니다. 논문의 섹션 2.5는 실제로 매우 관련이 있습니다.
amoeba는 Reinstate Monica가

3

약간 o / t :이 두 가지 접근 방식의 문제점 중 하나는 자유도 (스토퍼의 경우 N, 피셔의 경우 2N)로 인한 전력 손실입니다. 이를 위해 더 나은 메타 분석 접근 방식이 개발되었습니다 (예를 들어, 역 분산 가중 메타 분석).

그룹 내에서 대안 테스트의 증거를 찾고 있다면 Donoho와 Jin의 더 높은 비판 통계를 볼 수 있습니다. https://projecteuclid.org/euclid.aos/1085408492


1

이 질문에 답하고 더 많은 독자들을 위해 : 지금까지 사용 된 적이 있습니까?, arXiv에 대한 Cousins ​​(2008)의 논문 은 몇 가지 대안을 나열하고 검토했습니다. 제안 된 것이 나타나지 않는 것 같습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.