나는 FDR (False Discovery Rate)이 어떻게 개별 연구원의 결론을 알려야하는지에 대해 고심했습니다. 예를 들어 연구에 힘이 부족한 경우 에서 유의미한 결과라도 할인해야 합니까? 참고 : 여러 테스트 수정 방법이 아니라 여러 연구 결과를 종합적으로 검사하는 맥락에서 FDR에 대해 이야기하고 있습니다.
검정 된 가설의 가 실제로 참 이라고 관대하게 가정 하면 FDR은 다음과 같이 유형 I 및 유형 II 오류율의 함수입니다.
만약 연구가 충분히 힘이 부족 하다면 , 우리가 결과가 의미가 있더라도, 우리가 적절한 힘을 가진 연구의 결과만큼 신뢰하지 말아야한다는 이유가 있습니다. 따라서 일부 통계 학자들이 말하듯 이 "장기적으로"상황에 따라 전통적인 지침을 따르면 잘못된 결과를 많이 발표 할 수 있습니다. 연구의 시체가 지속적으로 파워 부족 연구 (예를 들어, 후보 유전자에 의해 특징되어있는 경우 환경의 상호 작용 이전 년대 문학 ), 심지어 복제 된 중요한 결과는 의심 할 수있다.
는 R 패키지를 적용 extrafont
, ggplot2
그리고 xkcd
, 나는이 유용 int로서 개념화 될 수 있다고 생각 관점의 문제 :
이 정보가 주어지면 개인 연구원은 다음에 무엇을해야 합니까? 내가 연구하고있는 효과의 크기가 무엇인지 짐작한다면 (따라서 샘플 크기가 주어진 경우 의 추정치 ) FDR = .05까지 수준을 조정해야 합니까? 연구 결과가 저조한 경우에도 수준으로 결과를 게시 하고 문헌 소비자에게 FDR을 고려해야합니까?α α = .05
나는 이것이이 사이트와 통계 문헌에서 자주 논의되는 주제라는 것을 알고 있지만,이 문제에 대한 의견에 대한 합의를 찾을 수없는 것 같습니다.
편집 : @amoeba의 의견에 대한 응답으로 FDR은 표준 유형 I / 유형 II 오류율 우발 상황 표 (추악한 사면)에서 파생 될 수 있습니다.
| |Finding is significant |Finding is insignificant |
|:---------------------------|:----------------------|:------------------------|
|Finding is false in reality |alpha |1 - alpha |
|Finding is true in reality |1 - beta |beta |
따라서 중요한 결과 (1 열)가 제시되면 실제로 거짓 일 가능성은 열 합계의 알파입니다.
그러나 예, 연구력 여전히 중요한 역할을 하지만 주어진 가설이 참 (사전) 확률을 반영하도록 FDR 정의를 수정할 수 있습니다 .