지난 몇 년간, 여러 학자들은 "연구자 자유도"라고 불리는 과학적 가설 테스트의 해로운 문제를 제기했습니다. 이는 과학자들이 분석 중에 p- 값 <5 %로 찾기를 향한 선택의 여지가 많다는 것을 의미합니다. 이러한 모호한 선택은 예를 들어 어떤 경우를 포함해야하는지, 어떤 경우는 이상으로 분류되어 어떤 것이 나타날 때까지 수많은 모델 사양을 실행하고 null 결과를 게시하지 않는 등입니다 (심리학에서이 논쟁을 일으킨 논문은 여기 , Andrew Gelman의 인기있는 슬레이트 기사 및 후속 토론을 여기 에서 확인 하십시오 . 또한 타임지 에서도이 주제를 다룹니다 .)
첫째 , 한 가지 명확한 질문 :
타임 잡지는 썼다
"0.8의 거듭 제곱은 테스트 된 10 개의 실제 가설을 의미하며, 데이터에서 영향을받지 않기 때문에 2 개만 제외됩니다."
이것이 교과서에서 찾은 power 함수의 정의에 어떻게 부합하는지 잘 모르겠습니다 . 이 매개 변수 의 함수로 null을 거부 할 가능성이 있습니다. 다른 우리는 다른 힘을 가지고 있으므로 위의 인용문을 잘 이해하지 못합니다.θ
둘째 , 일부 연구 결과 :
저의 정치 / 경제 분야에서 학자들은 이용 가능한 모든 국가 별 데이터를 사용합니다. 따라서 여기서 샘플을 다루는 것에 대해 걱정하지 않아야합니까?
여러 테스트를 실행하지만 하나의 모델 만보고하는 문제를 다른 분야의 누군가가 논문을 다시 테스트하고 강력한 결과를 얻지 못한 경우 즉시 파업한다는 사실만으로 해결할 수 있습니까? 이것을 예상하면 내 분야의 학자들은
robustness check
여러 모델 사양이 결과를 변경하지 않는다는 것을 보여주는 섹션 을 포함 할 가능성이 더 큽니다 . 이것으로 충분합니까?Andrew Gelman과 다른 사람들은 데이터에 관계없이 실제로 존재하지 않는 "패턴"을 찾아서 게시 할 수 있다는 점을 지적합니다. 그러나 이것은 경험적 "패턴"이 이론에 의해 뒷받침되어야한다는 사실과 학문 내 경쟁 이론이 어떤 캠프가 더 많은 "패턴"을 찾을 수 있는지를 찾기 위해 토론 / 레이스에 참여할 것이라는 점을 고려할 때 걱정할 필요는 없다. 다양한 장소에서. 패턴이 실제로 의심스러운 경우 다른 샘플 / 설정에 유사한 패턴이 없으면 배후 이론이 빠르게 사라집니다. 과학이 어떻게 진행되지 않습니까?
널 (null) 결과에 대한 저널의 현재 추세가 실제로 번성 할 것이라고 가정하면, 널 (null)과 긍정적 인 결과를 모두 집계하고 이들이 모두 테스트하려고한다는 이론에 대해 추론 할 수있는 방법이 있습니까?