p.adjust는 BY에 대해 오해하지 않습니다. 논문의 정리 1.3 (p.1182의 섹션 5에서 증명)을 참조한다 :
Benjamini, Y. 및 Yekutieli, D. (2001). 종속성이있는 다중 테스트에서 잘못된 발견 비율 제어 통계 연표 29, 1165–1188.
이 백서에서는 여러 가지 다른 조정에 대해 설명하므로 p.adjust ()에 대한 도움말 페이지 (작성 당시)에 대한 참조가 다소 모호합니다. 이 방법은 가장 일반적인 의존 구조 하에서 명시된 속도로 FDR을 제어 할 수있다. Christopher Genovese의 슬라이드에는 다음과 같은 유익한 의견이 있습니다. www.stat.cmu.edu/~genovese/talks/hannover1-04.pdf BY 2001 논문의 정리 1.3 방법을 참조하여 슬라이드 37에 대한 의견에 주목하십시오. p.adjust ()를 사용한 'BY'] : "불행히도 이것은 일반적으로 Bonferroni보다 훨씬 보수적입니다."
수치 예 : method='BY'
vsmethod='BH'
다음은 Benjamini와 Hochberg (2000) 논문에서 표 2의 2 열에서 p- 값에 대해 R의 p.adjust () 함수를 사용하여 method = 'BY'를 method = 'BH'와 비교합니다.
> p <- c(0.85628,0.60282,0.44008,0.41998,0.3864,0.3689,0.31162,0.23522,0.20964,
0.19388,0.15872,0.14374,0.10026,0.08226,0.07912,0.0659,0.05802,0.05572,
0.0549,0.04678,0.0465,0.04104,0.02036,0.00964,0.00904,0.00748,0.00404,
0.00282,0.002,0.0018,2e-05,2e-05,2e-05,0)
> pmat <- rbind(p,p.adjust(p, method='BH'),p.adjust(p, method='BY'))
> rownames(pmat)<-c("pval","adj='BH","adj='BY'")
> round(pmat,4)
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
pval 0.8563 0.6028 0.4401 0.4200 0.3864 0.3689 0.3116 0.2352 0.2096
adj='BH 0.8563 0.6211 0.4676 0.4606 0.4379 0.4325 0.3784 0.2962 0.2741
adj='BY' 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
[,10] [,11] [,12] [,13] [,14] [,15] [,16] [,17] [,18]
pval 0.1939 0.1587 0.1437 0.1003 0.0823 0.0791 0.0659 0.0580 0.0557
adj='BH 0.2637 0.2249 0.2125 0.1549 0.1332 0.1332 0.1179 0.1096 0.1096
adj='BY' 1.0000 0.9260 0.8751 0.6381 0.5485 0.5485 0.4856 0.4513 0.4513
[,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26] [,27]
pval 0.0549 0.0468 0.0465 0.0410 0.0204 0.0096 0.0090 0.0075 0.0040
adj='BH 0.1096 0.1060 0.1060 0.1060 0.0577 0.0298 0.0298 0.0283 0.0172
adj='BY' 0.4513 0.4367 0.4367 0.4367 0.2376 0.1227 0.1227 0.1164 0.0707
[,28] [,29] [,30] [,31] [,32] [,33] [,34]
pval 0.0028 0.0020 0.0018 0e+00 0e+00 0e+00 0
adj='BH 0.0137 0.0113 0.0113 2e-04 2e-04 2e-04 0
adj='BY' 0.0564 0.0467 0.0467 7e-04 7e-04 7e-04 0
참고 : BY 값과 BH 값을 연결하는 승수는 . 여기서 은 p- 값의 수입니다. 승수는 예를 들어 m = 30, 34, 226, 1674, 12365 값입니다.m∑mi=1(1/i)m
> mult <- sapply(c(11, 30, 34, 226, 1674, 12365), function(i)sum(1/(1:i)))
setNames (mult, paste (c ( 'm =', rep ( '', 5)), c (11, 30, 34, 226, 1674, 12365)))
m = 11 30 34 226 1674 12365
3.020 3.995 4.118 6.000 8.000 10.000
위의 예에서 = 34, 승수가 4.118인지 확인하십시오.m