작은 표본 크기로 인해 유형 1 오류가 발생할 수 있습니까?


21

표본 크기가 작 으면 검정력이 충분하지 않고 유형 2 오류가 발생할 수 있음을 알게되었습니다. 그러나 작은 샘플은 일반적으로 신뢰할 수 없으며 우연히 어떤 종류의 결과로 이어질 수 있다고 생각합니다. 그게 사실입니까?


불필요한 수학적 표기법에 대한 혐오가 있으므로 제목을 편집했습니다. 제목을 변경하여 의미가 변경되지 않았는지 확인할 수 있습니까?
mpiktas

1
유의성 테스트 (피셔 테스트)가 아니라 가설 테스트 (Neyman-Pearson 테스트)에 대해서도 이야기하십시오. 이러한 접근 방식은 두 번째 방법에서 오류에 대한 개념이 없더라도 일반적으로 혼합되며 적절한 사용 방법은 다른 종류의 결론으로 ​​이어지기 때문에 달라져야합니다.
Seb

당신이 점근 테스트를 사용한다면 가능합니다. 그렇지 않으면 no-테스트는 유형 1 오류율 (즉, ) 을 제어하기 위해 정의됩니다 . α
매크로

그러나 동전을 두 번 뒤집는 경우 100 번 뒤집을 때보 다 기울어 진 결과 (2 개의 동일한면 (100 %))가 발생할 가능성이 더 높습니다. 약 1 / 2, 1/2. 이것은 크기가 작을수록 유형 I 오류가 발생할 가능성이 높다는 것을 나타내지 않습니까?

답변:


27

일반적으로 표본 크기가 작 으면 테스트가 I 형 비율을 제어하도록 구성되어 있기 때문에 I 형 오류율이 증가하지 않습니다 . (불연속 결과와 관련된 사소한 기술적 예외가 있으므로, 특히 작은 표본 크기 에서 공칭 유형 I 비율이 정확하게 달성되지 않을 수 있습니다.)

여기에 중요한 원칙이 있습니다. 테스트에 적합한 크기 (= 공칭 유형 I 비율)와 원하는 효과에 대해 허용되는 힘이 있으면 샘플 크기가 작더라도 괜찮습니다.

위험은 우리가 그렇지 않은 상황에 대해 조금 알고있는 경우이다 - 우리가 "유형 III"오류에 대한 우려 될 수있다 - 어쩌면이 우리가 한 모든 데이터입니다이며, 모델 잘못된 사양입니다. 작은 샘플 세트로는 확인하기 어려울 수 있습니다.

아이디어의 상호 작용에 대한 실질적인 예 로서 , 나는 이야기를 나눌 것입니다. 오래 전에 환경 정화를 확인하기 위해 샘플 크기를 권장하라는 요청을 받았습니다. 이는 데이터를 확보하기 전에 정리 전 단계에있었습니다. 저의 계획 은 오염 물질 농도의 정화 후 평균과 분산을 평가하기 위해 정화하는 동안 얻을 있는 1000 개 정도의 샘플을 분석 할 것을 요구 했습니다 (각 위치에서 충분한 토양이 제거되었는지 확인하기 위해). 그런 다음 (매우 단순화하기 위해) 지정된 힘과 테스트 크기에 따라 교과서 수식을 사용하여 정리가 성공적으로 완료되었음을 증명하는 데 사용할 독립적 인 확인 샘플 수를 결정한다고 말했습니다.

이 기억에 남는 것은 정리가 완료된 후 공식이 단지 3 개의 샘플만을 사용한다는 것입니다. 갑자기 내 추천은 그리 믿을만 해 보이지 않았습니다!

샘플이 3 개만 필요한 이유는 정리가 공격적이고 잘 작동했기 때문입니다. 그것은 평균 오염 물질 농도를 약 100ppm으로 줄이거 나 또는 100ppm으로 목표 500ppm보다 일관되게 낮 춥니 다.

결국 이 방법 은 통계적 가정이 실제로이 사이트에 적합하다는 것을 입증하기 위해 1000 개의 이전 샘플 (분석 품질은 낮지 만 측정 오류가 더 높음)을 얻었 기 때문에 효과가있었습니다. 유형 III 오류의 가능성을 처리 한 방법입니다.

고려할 사항이 하나 더 있습니다. 규제 기관이 단 3 개의 샘플 만 사용하도록 승인하지 않는다는 것을 알기 때문에 5 개의 측정을 얻는 것이 좋습니다. 이것들은 전체 사이트에서 25 개의 무작위 샘플로 만들어졌으며, 5 개의 그룹으로 합성 되었습니다. 통계적으로 최종 가설 테스트에는 5 개의 숫자 만있을 것입니다. 시료. 이것은 시험에 사용 된 숫자의 수획득 방법 사이의 중요한 관계를 강조합니다 . 숫자가있는 알고리즘보다 통계적 의사 결정에 더 많은 것이 있습니다!

나의 영원한 구호에, 5 개의 복합 값은 정화 목표가 달성되었음을 확인했다.


1
(+1) 적극적인 정리유형 III 오류 에 대한 훌륭한 이야기는 경제 시계열과 관련이 있다면 좋을 것입니다. 잡음이 적은 작은 샘플 크기를 가진 결정 론적 모델 또는 모델의 경우 IMHO는 가장 큰 문제가되지 않을 것입니다.
Dmitrij Celov

1
+1, 첫 번째 단락에서 언급 한 "이산 결과와 관련된 기술적 예외"에 대해 더 이해하고 싶은 사람들을 위해 여기에서 논의합니다 : p- 값, 유의 수준 및 유형 I 오류 비교 및 ​​대조 .
gung-복직 모니카

1
+1, 주요 정보없이 유용한 샘플 크기로 와일드 찌르기를 할 수없는 좋은 예입니다.
Freya Harrison

0

작은 표본의 또 다른 결과는 유형 2 오류의 증가입니다.

1960 년 논문에서 "논리학의 통계의 장소"라는 논문에서 소량 표본은 일반적으로 점 귀무 가설을 기각하지 못한다는 것을 명백히 보여 주었다. 이 가설은 일부 매개 변수가 0 인 가설이며, 고려한 경험에서 거짓으로 알려져 있습니다.

반대로 p- 값은 표본의 크기에 따라 다르지만 알파 유의 수준은 고정되어 있기 때문에 표본이 너무 크면 유형 1 오류가 증가합니다. 이러한 표본에 대한 검정은 항상 귀무 가설을 기각합니다. 이 문제에 대한 개요를 보려면 Johnson and Douglas (1999)의 "통계적 유의성 검정의 중요성"을 읽으십시오.

이것은 질문에 대한 직접적인 대답은 아니지만 이러한 고려 사항은 보완 적입니다.


큰 표본 문제와 유형 I 오류를
불러 일으키기

6
-1, "너무 큰 표본이 ​​유형 1 오류를 증가시킨다"는 의견이 올바르지 않습니다. 실제 효과가 정확히 0은 아니지만 너무 작아서 결과가 중요하지 않은 상황이 존재할 수 있다는 점에서 통계적 중요성과 실제적 중요성을 혼동 할 수 있습니다 . 실제 목적으로 null 'true' 고려 합니다 . 이 경우, 널 (null)은 (예를 들어) 시간의 5 % 이상, 더 자주 N을 증가시키면서 거부 될 수있다. 그러나 엄밀히 말하면, 진정한 효과가 정확히 0이라는 귀무 가설은 규정 상 거짓이다. 따라서 이러한 거부는 실제로 유형 I 오류가 아닙니다.
gung-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.