누적 데이터 반복 테스트시 전체 유형 I 오류


12

그룹 순차적 방법 에 대한 질문이 있습니다 .

Wikipedia에 따르면 :

두 치료군을 대상으로 한 무작위 시험에서 고전적 그룹 순차 검사는 다음과 같은 방식으로 사용됩니다. 각 그룹에 n 명의 피험자가있는 경우 2n 피험자에 대한 중간 분석이 수행됩니다. 두 그룹을 비교하기 위해 통계 분석이 수행되며, 대체 가설이 수용되면 시행이 종료됩니다. 그렇지 않으면, 그룹당 n 명의 피험자가있는 다른 2n 명의 피험자에 대한 시험이 계속됩니다. 통계 분석은 4n 대상에 대해 다시 수행된다. 대안이 수락되면 재판이 종료됩니다. 그렇지 않으면, 2 세트의 N 세트의 N 세트가 이용 가능할 때까지 주기적 평가를 계속한다. 이 시점에서 마지막 통계 테스트가 수행되고 시험이 중단됩니다.

그러나 이런 방식으로 누적 데이터를 반복적으로 테스트하면 제 1 종 오류 수준이 부풀려집니다.

표본이 서로 독립적 인 경우 전체 유형 I 오류 는 다음과 같습니다.α

α=1(1α)k

여기서 는 각 테스트의 수준이며 는 중간 모양의 수입니다.αk

그러나 샘플은 겹치므로 독립적이지 않습니다. 중간 분석이 동일한 정보 단위로 수행된다고 가정하면 (슬라이드 6)

여기에 이미지 설명을 입력하십시오

이 테이블을 얻는 방법을 설명해 주시겠습니까?

답변:


12

다음 슬라이드는 14부터 아이디어를 설명합니다. 아시다시피, 요점은 통계 순서가 서로 관련되어 있다는 것입니다.

컨텍스트는 표준 편차가 알려진 z 테스트입니다. 적합하게 표준화 된 첫 번째 검정 통계량 은 cdf 와 함께 Normal (0,1) 분포를 갖습니다 . 두 번째 통계 . 그러나 첫 번째 통계는 두 번째 통계에 사용 된 데이터의 서브 세트를 사용하기 때문에 두 통계는 상관 계수 와 상관 됩니다. 따라서 에는 분포가 있습니다. 제 1 종 오류 확률 (널 가설 하에서)은 (a) 첫 번째 검정에서 제 1 종 오류가 발생하거나 (b) 제 1 검정에서 제 1 종 오류가 발생하지 않지만 두 번째 테스트. 하자z1Φz21/2(z1,z2)c=Φ1(10.05/2)임계 값이어야합니다 (공칭 크기 = 0.05 인 양면 테스트의 경우 ). 두 번의 분석 후 제 1 종 오류 확률은 또는 와 . 숫자 적분은이 확률에 대해 0.0831178 값을 제공하며 표에 동의합니다. 테이블의 후속 값은 유사한 추론 및 더 복잡한 통합으로 구합니다.α|z1|>c|z1|c|z2|>c

이 그래픽은 이중 정규 pdf 및 통합 영역 (고체 표면)을 보여줍니다. 비정규 PDF, 3D 표면 플롯


알겠습니다, 감사합니다! 상관 관계 cor (z1, z2)를 얻기가 어렵습니까?
ocram

@Marco, 검정 통계량은 매우 단순하기 때문에 상관 관계는 계산하기가 간단합니다. 정규 변수의 선형 조합입니다. (이는 분산이 알려져 있다고 가정하기 때문입니다.) 또는 두 번째 통계는 두 개의 독립적 인 랜덤 변수 : 첫 번째 변수 과 추가 데이터 의해 생성 된 변경 사항의 있습니다. 더 복잡한 경우에는 상관 관계를 계산하기가 매우 어려울 수 있습니다. 이것이 다소 이상적인 상황이 순차적 테스트에 동기를 부여하는 데 사용되는 한 가지 이유입니다! z1z1z2
whuber

대단히 감사합니다. 예, 상관 관계는 계산하기 매우 쉽습니다. 사실, 문맥이 두 정규 분포의 평균을 비교 한 것이 분명하지 않았습니다. 이제는 명확하고 다른 모든 것을 매우 명확하게 만듭니다! 감사합니다!
ocram

n = 400에 대해 이것을 계산하는 방법을 공식 (또는 R 코드)으로 제공 할 수 있습니까? 나는 이것을 혼자서 할 것이지만 불행히도 나는 방법을 모른다. 여러 비교 (예 : 4 비율 비교)가 있고 Bonferroni와 같은 수정을하지 않고 반복 테스트를 수행하는 경우 전체 오류율을 계산하려면 수식을 어떻게 조정해야합니까? 저 좀 도와 주실 래요?
Andreas
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.