비공식 / 시각적“다중 비교”에 대해 다중 비교 수정이 필요합니까?


9

다중 비교 수정이 필요한 시점에 대한 일종의 철학적 질문이 있습니다.

연속적인 시변 신호 (불연속 시점)를 측정하고 있습니다. 때때로 별도의 이벤트가 발생하며 이러한 이벤트가 측정 된 신호에 중요한 영향을 미치는지 확인하고 싶습니다.

따라서 이벤트를 따르는 평균 신호를 사용할 수 있으며 일반적으로 특정 피크에서 어떤 영향을 볼 수 있습니다. 해당 피크 시간을 선택하고 이벤트가 발생하지 않을 때와 비교하여 중요한지 확인하기 위해 t- 검정을 말하면 다중 비교 수정을 수행해야합니까?

비록 한 번의 t- 테스트 (계산 된 1 값) 만 수행했지만, 최초의 육안 검사에서 나는 15 개의 다른 포스트 지연 시점에서 가장 큰 잠재적 효과를 가진 것을 선택했습니다. 내가 수행하지 않은 15 가지 테스트에 대해 다중 비교 수정을 수행해야합니까?

육안 검사를 사용하지 않았지만 각 이벤트에서 테스트가 지연되고 가장 높은 테스트를 선택한 경우 반드시 수정해야합니다. '최고의 지연'선택이 시험 자체 이외의 다른 기준에 의해 수행되는지 (예 : 시각적 선택, 최고 평균 등) 필요한지 여부에 대해 약간 혼란 스럽습니다.

답변:


11

기술적으로 테스트를 수행 할 위치를 시각적으로 사전 선택하는 경우 이미 수정해야합니다. 눈과 뇌는 이미 데이터의 일부 불확실성을 우회하여 해당 시점에서 단순히 테스트를 수행 할 경우 고려하지 않습니다. .

'피크'가 실제로 고원이라고 가정하고 '피크'차이를 손으로 선택한 다음 테스트를 실행하면 거의 의미가 없습니다. 테스트를 왼쪽이나 오른쪽으로 약간 더 실행하면 결과가 변경 될 수 있습니다. 이런 식으로 사전 선택 과정을 고려해야합니다. 당신은되어 사용 그래서 당신은 효과적으로 두 번 같은 정보를 사용하고, 선택을하기 위해 데이터를.

물론 실제로는 손으로 따는 과정과 같은 것을 설명하기가 매우 어렵지만 그렇다고해서는 안된다는 의미는 아닙니다.

결론 : 비교를 선택한 방법에 관계없이 여러 비교를 수행하는 경우 항상 여러 비교를 수정 해야합니다 . 데이터 보기 전에 선택하지 않은 경우 추가로 수정해야합니다.

참고 : 수동 사전 선택을 수정하는 대안 (예 : 실제로 불가능한 경우)에는 수동 선택에 대한 참조가 포함되도록 결과를 명시하는 것입니다. 그러나 그것은 '재생 가능한 연구'가 아닙니다.


1
그래도 항상 수정하면 II 형 오류율이 높아집니다. 수정하기 전에 중요한 결과가 모두 있다면, 모든 중요한 결과를 얻을 가능성이 낮다는 점을 고려하지 않고 수정 후 결과를 모두 잃을 수 있습니다. 상황에 따라 유형 I 또는 유형 II 오류의 비용에 따라 달라질 수 있습니다.
Etienne Low-Décarie

닉은 내가 먼저 대답했다면 내가하고 싶은 대답을 주었다. 그러나 초기 설정에서 실제로 (mkpitas)는 실제로 15 가지 테스트를 수행하면 다중성 수정을 수행 할 필요가 없다고 말했습니다. 왜 그런 말을하는지 모르겠습니다. 이 경우 다중도 보정의 필요성이 더욱 분명해집니다. @etienne 귀하의 요점은 FWER 보정에 적용되며 유형 I 오류를 제어하는 ​​데 매우 엄격합니다. FDR을 사용하면 많은 힘을 희생하지 않습니다.
Michael R. Chernick

8

오래 전에, 나의 첫 번째 통계 수업 중 하나에서 나는 이것에 대해 "합리적인 사람들이 다를 수있는 것에 대한 질문이다"라는 텍스트로 읽었습니다.

누구든지 여러 비교를 수정하거나 수정해야하는 기간이나 비교 세트에 대해 수정해야한다고 명확하지 않습니다. 각 기사? 각 회귀 또는 분산 분석? 그들이 주제에 관해 출판 한 모든 것? 다른 사람들이 출판 한 내용은 어떻습니까?

첫 줄에 글을 쓰면 철학적입니다.


4
당신은 얼마나 많은 비교가 수행되고 있는지에 대한 질문이 있다는 것이 맞습니다. 그러나 나는 그것이 당신의 결론을 암시한다고 생각하지 않습니다. 합리적 인 사람들은 가능한 결과에 대해 다른 목표와 다른 평가 (손실 기능)를 가지고 있기 때문에 다를 수 있습니다 . 다중 비교를 수정해야하는 경우 예상 손실이 향상되기 때문입니다. 따라서 이것은 단순한 "철학"이 아니라 매우 실용적인 문제이며 합리적인 사람들이 동의 할 수있는 합리적인 방법이 있습니다.
whuber

2
@ whuber 어떤 상황에서는 반드시 옳습니다. 때로는 명백한 손실 함수가 있지만 때로는 명시 적으로 언급하기가 어렵습니다. 그러나 다른 경우, 예를 들어 탐색 작업에서 손실 기능이 어떻게 가능한지 보는 데 어려움이 있습니다. 물론, 전체 손실 함수 아이디어는 p = .05의 성배와 같은 키에서 멀어지고 힘 = .8 또는 .9가 충분하고 일반적으로 (내 마음에) 더 합리적인 아이디어에 도달한다는 가정 우리는이를보다 실질적인 근거로 확립합니다.
Peter Flom

1
답장의 범위와 정신을 명확히 해주셔서 감사합니다, Peter.
whuber

4
사람들이 다중성 테스트가 중요하지 않다고 말할 때 분노합니다. 나는 이러한 태도가 의학 연구에서 너무 자주 표현되는 것을 본다. 다중성이 무시되어 잘못된 결론에 도달 한 많은 논문을 가리킬 수 있습니다. 의학이 잘못된 결론을 가진 논문을 출판하지 않는 것이 중요합니다. 왜냐하면 그것이 환자를 치료하고 생명을 위협하는 방식에 영향을주기 때문입니다. 다중성 (Multiplicity)은 메타 분석에서 심각한 이슈 인 출판 편향에 기여한다 (문제가 여러 번 연구 될 때 중요한 결과를 가진 연구 만 출판되기 때문에)
Michael R. Chernick

1
@MichaelChernick, 동의합니다. 사람들이 여러 테스트 수정을 무시할 때 매우 문제가됩니다. 그러나 Peter가 좋은 지적을했다고 생각합니다. 여러 테스트의 범위는 무엇입니까? 모든 시험은 한 종이로 이루어 졌습니까? 모든 테스트가 단일 데이터 세트로 수행 되었습니까? 처음부터 모든 테스트를 수행 했습니까? 명확한 답이없는 것 같습니다.
매크로

4

현실에 대한 일회성 결정을 시도하고 귀무 가설을 허위로 기각하는 비율을 제어하려는 경우 귀무 가설 유의성 테스트 (NHST)를 사용하고 다중 비교에 대한 정정을 사용하려고합니다. 그러나 Peter Flom이 그의 답변에서 언급 한 것처럼, 보정을 적용 할 비교 세트를 정의하는 방법은 확실하지 않습니다. 가장 쉬운 방법은 주어진 데이터 세트에 적용된 비교 세트이며 가장 일반적인 방법입니다.

그러나 과학은 일회성 결정이 필요하지 않고 실제로는 증거 축적의 효율성을 낮추는 데 도움이되는 누적 시스템으로 생각할 수있다. 따라서 통계적 분석에 대한 과학적인 접근 방식을 따르고 가능성 비율과 같은 도구 (예 : 베이지안 접근 방식)에 대한 NHST를 피하면 다중 비교의 "문제"가 사라집니다.


1

질문에 따라 수정의 가능한 대안은 p- 값의 합의 중요성을 테스트하는 것입니다. 그런 다음 높은 p- 값을 추가하여 수행되지 않은 테스트에 대해 스스로에게 불이익을 줄 수도 있습니다.

Fisher의 방법 (테스트 독립성이 필요함)의 확장 (독립성이 필요하지 않음)을 사용할 수 있습니다.

예 : 코스 스트의 방법


이는 개별 연구에서 p- 값만 제공하거나 데이터를 결합 할 수 없지만 각 연구에 p- 값이 계산 된 경우 메타 분석에 사용되는 절차의 예입니다. 또한 Fisher의 조합 방법과 역 법선은 적응 형 설계에서 정지 규칙을 구성하는 방법입니다.
Michael R. Chernick

1

기억해야 할 한 가지 중요한 점은 다중 테스트 수정은 독립적 인 테스트를 가정한다는 것입니다. 분석 데이터가 독립적이지 않은 경우, 수행 된 테스트 수를 단순히 수정하는 것보다 조금 더 복잡해집니다. 분석 할 데이터 간의 상관 관계를 고려해야합니다. 그렇지 않으면 수정이 너무 보수적 일 수 있습니다. II 형 오류율이 높습니다. 교차 유효성 검사, 순열 테스트 또는 부트 스트랩은 올바르게 사용하면 여러 비교를 처리하는 효과적인 방법이 될 수 있습니다. 다른 사람들은 FDR 사용에 대해 언급했지만 데이터에 null이없는 모든 테스트에서 p- 값이 균일하다고 가정하여 데이터에 독립적이지 않은 것이 많으면 잘못된 결과를 초래할 수 있습니다.


2
사이트에 오신 것을 환영합니다. Matt. 첫 문장과 관련하여 : 기억해야 할 가장 중요한 점은 여러 테스트 수정은 독립적 인 테스트를 가정한다는 것입니다. 이것은 일부 다중 테스트 수정 절차에 해당하지만 모두는 아닙니다. 예를 들어, 가장 간단한 것 (Bonferroni)은 독립 가정을하지 않으며 실제로 테스트가 독립적 인 경우에는 상당히 비효율적입니다! :-) 또한 연속 분포 설정에서 단일의 (마진) 분포p-값은 null 하에서 균일합니다. 설명을 명확하게하기 위해 편집을 고려할 수 있습니다.
추기경
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.