기초 과학의 순차 가설 검정


16

나는 약리학 자이며, 내 경험상, 기본 생물 의학 연구의 거의 모든 논문은 Student 's t-test를 사용합니다 (추론을 뒷받침하거나 기대에 부응하기 위해 ...). 몇 년 전, 학생의 t- 검정은 가장 효율적인 시험이 아니라는 점에 주목했습니다. 순차 시험은 모든 표본 크기에 대해 더 많은 검정력을 제공하거나 동등한 검정력에 대해 평균적으로 훨씬 작은 표본 크기를 제공합니다.

다양한 복잡성의 순차적 인 절차는 임상 연구에서 사용되지만 기본적인 생의학 연구 간행물에서 사용 된 것을 본 적이 없습니다 . 나는 또한 대부분의 기본 과학자들이 볼 수있는 입문 수준의 통계 교과서도 없다고 언급했다.

내 질문은 세 가지입니다.

  1. 순차적 테스트의 효율성 측면에서 상당한 이점이 있다고해서 왜 더 널리 사용되지 않습니까?
  2. 통계학자가 아닌 사람들이 사용하지 않는 것을 의미하는 순차적 인 방법의 사용과 관련된 단점이 있습니까?
  3. 통계 학생들은 순차적 테스트 절차에 대해 배우고 있습니까?

3
확실하게, 당신은 임상 시험에서 발견 된 ST에 대해 이야기하고 있습니까? 예 : en.wikipedia.org/wiki/Sequential_analysis ?
chl

예. 순차 t- 검정을 포함하여 순차 테스트에는 몇 가지 변형이 있지만 기본 연구에는 사용되지 않습니다. 나는 그들의 사용에 어떤 장애도 보지 못했다.
Michael Lew

(+1) 순차 테스트를 우연히 발견하고 같은 질문을했습니다.
steffen

답변:


5

나는 중간 분석 (Jennison and Turnbull, 2000)과 컴퓨터 적응 테스트 (van der Linden and Glas, 2010) 이외의 순차적 테스트와 그 적용에 대해 잘 모른다. 한 가지 예외는 일부 fMRI 연구에서 비용이 많이 들고 과목을 등록하기가 어렵습니다. 기본적으로이 경우 순차적 테스트는 주로 실험을 더 일찍 중지하는 것을 목표로합니다. 따라서 이러한 매우 맞춤화 된 접근 방식이 일반적인 통계 클래스에서 학습되지 않는다는 사실에 놀라지 않습니다.

순차 테스트에는 함정이 없습니다. (유형 I 및 II 오류를 미리 지정하고, 중지 규칙을 선택하고 결과를 여러 번 살펴 봐야합니다. 샘플 디자인 등). 대부분의 설계에서 우리는 미리 정해진 실험 설정 또는 예비 전력 연구가 수행되어 어떤 종류의 비용 효율성 기준을 최적화하고,이 경우 표준 테스트 절차가 적용됩니다.

그러나 Maik Dierkes의 고정 오픈 샘플 디자인 에 대한 다음 논문이 매우 흥미로웠다 는 것을 발견했습니다 . 실험의 순차적 디자인에 대한 주장 .


기본 생체 의학 연구자들은 항상 중간 분석을 수행합니다. 중요한 것을 알지 못하기 때문에 선언하지 않습니다! 나는 전국 회의에서 연구원들을 조사한 결과 50 % 이상이 Student 's t-test의 오류율 제어가 미리 정해진 고정 표본 크기에 의존한다는 것을 알지 못했다는 것을 발견했습니다. 가끔씩 사용되는 샘플 크기가 매우 다양하다는 증거를 볼 수 있습니다.
Michael Lew

순차적 설계의 복잡성으로 인해 발생하는 몇 가지 단점은 특히 구현이 아닌 분석 설계에서 발생합니다. 아마도 우리는 작은 샘플 기본 실험을 위해 미리 준비된 디자인 모음을 가질 수 있습니다.
Michael Lew

@Michael "가짜"중간 분석 정보 (연구가 계속 발전하는 단계에서 p- 값을 보는 방법) : 더 이상 통계를 잘못 사용하는 것처럼 보입니다.
chl

@ 치 한 수준에서, 예, 선언되지 않고 수정되지 않은 중간 분석은 부적절합니다 (그러나 무지, 기본 무의식 연구자에게 통계를 가르치는 방법에 부적절하다고 지적하는 무지에서 수행됩니다 ...). 그러나 메타 수준에서 고려한다면 부분적인 정당성을 찾을 수 있습니다. 많은 실험에는 오 탐지율이 증가하면 더 많은 검정력에 대한 합리적인 트레이드 오프가 될 수있는 작은 표본이 포함됩니다. 협약에서는 선언 된 알파 수준이 0.05보다 높지 않습니다.
Michael Lew

이러한 맥락에서, 기본 생물 의학 연구자들은 "P <0.05가 중요한 것으로 간주 된 결과"라는 진술이 달리 제안 할 수 있더라도, 독점적으로 Neyman-Pearson 접근 방식으로는 효과가 없다고 지적합니다. 만약 우리가 피셔의 유의성 테스트의 범위 안에 머무르면 달성 된 P 값 이외의 고려 사항이 테스트 결과를 처리하는 방법의 결정에 통합 될 수 있다면, 중간 분석은 그리 나쁘지 않을 수 있습니다. 그러나 설계된 순차 테스트는 설계되지 않은 테스트보다 우수 할 것입니다.
Michael Lew
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.