필자는 Geoff Cumming의 2008 년 논문 복제 및 간격을 p p 읽었습니다 . 값은 미래를 모호하게 예측하지만 신뢰 간격은 훨씬 더 우수합니다 [Google Scholar에서 ~ 200 개의 인용] . 이것은 Cumming이 에 대해 논쟁 하고 신뢰 구간을 선호 하는 일련의 논문 중 하나입니다 . 그러나 내 질문 은이 논쟁에 관한 것이 아니며 대한 하나의 특정 주장에만 관련 됩니다.
초록에서 인용하겠습니다.
이 기사에서는 초기 실험 결과 양측 가 발생하면 복제의 단측 값이 구간 에 해당 하는 확률이 을 보여줍니다. 확률이 , 그리고 완전히 확률이 . 놀랍게도, 간격 이라고하는 간격은이 넓지 만 샘플 크기는 큽니다.
Cumming은이 " 간격"과 실제로 동일한 고정 표본 크기로 원래 실험을 복제 할 때 얻을 수있는 의 전체 분포 는 원래 값 에만 의존 실제 효과 크기, 검정력, 샘플 크기 또는 다른 것에 의존하지 않습니다.p p o b t
[...] 의 확률 분포는 (또는 power)에 대한 값을 모르거나 가정하지 않고 도출 될 수 있습니다 . [...] 우리는 에 대한 사전 지식을 가지고 있지 않으며 , [그룹 간 차이]는 주어진 에 대한 계산의 기초로 에 관한 정보 만 사용합니다. 와 구간 의 분포에 대한 .
의 분포는 힘에 크게 의존 하는 것처럼 보이지만 원래 자체는 그것에 대한 정보를 제공하지 않기 때문에 습니다. 실제 효과 크기는 이고 분포가 균일 할 수 있습니다. 또는 실제 효과 크기가 크면 대부분 매우 작은 기대해야합니다 . 물론 하나 이상의 가능한 효과 크기를 가정하고 그 위에 통합한다고 가정 할 수는 있지만 Cumming은 이것이 자신이하는 것이 아니라고 주장하는 것 같습니다.p o b t δ = 0 p
질문 : 정확히 무슨 일이 일어나고 있습니까?
이 주제는이 질문과 관련 이 있습니다. 첫 번째 실험의 95 % 신뢰 구간 내에서 반복 실험의 효과 크기는 어느 정도입니까? @ whuber의 훌륭한 답변. Cumming은이 주제에 관한 논문을 가지고 있습니다 : Cumming & Maillardet, 2006, Confidence Intervals and Replication : 다음은 어디로 떨어질까요? 하지만 그 중 하나는 명확하고 문제가 없습니다.
또한 Cumming의 주장은 2015 Nature Methods 논문에서 여러 번 반복된다는 점에 주목하십시오 . 변덕스러운 값 은 일부 사람들이 겪었을 수 있는 재현 할 수없는 결과 를 생성합니다 (Google Scholar에서 이미 100 건의 인용 횟수가 있음).
[...] 반복 실험 의 값에 상당한 변화가있을 것 입니다. 실제로 실험은 거의 반복되지 않습니다. 우리는 다음 가 얼마나 다른지 모릅니다. 그러나 매우 다를 수 있습니다. 예를 들어 실험의 통계적 검정력에 관계없이 단일 반복 실험에서 값이 반환하면 반복 실험이 에서 사이 의 값을 반환 할 확률 은 입니다 (그리고 변화). [sic] 는 더 클 것이다).P P 0.05 80 % P 0 0.44 20 % P
(그러나 Cumming의 진술이 정확한지 여부에 관계없이 Nature Methods 논문은 어떻게 부정확하게 인용하는지 : Cumming에 따르면 이상의 확률은 불과 합니다. 그렇습니다. g e ". Pfff.)0.44