샘플을 비교하고 샘플이 분리 된 개별 분포로 분포하는지 확인하고 있습니다. 그러나 Kolmogorov-Smirnov가 적용되는지 확실하지 않습니다. Wikipedia 는 그렇지 않은 것으로 보입니다. 그렇지 않은 경우 표본 분포를 어떻게 테스트 할 수 있습니까?
샘플을 비교하고 샘플이 분리 된 개별 분포로 분포하는지 확인하고 있습니다. 그러나 Kolmogorov-Smirnov가 적용되는지 확실하지 않습니다. Wikipedia 는 그렇지 않은 것으로 보입니다. 그렇지 않은 경우 표본 분포를 어떻게 테스트 할 수 있습니까?
답변:
불연속 배포에는 적용되지 않습니다. 참조 http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htm을 예를 들어.
카이-제곱 적합도 검정을 사용할 수없는 이유가 있습니까? 자세한 정보 는 http://www.itl.nist.gov/div898/handbook/eda/section3/eda35f.htm 을 참조 하십시오 .
통계에서 종종 그렇듯이, 그것은 당신의 의미에 달려 있습니다 .
"이산 분포에서 추출한 표본에 대해 검정 통계량을 계산 한 다음 표준 테이블을 검색합니다"를 선택한 경우 선택한 유형보다 실제 유형 I 오류율이 낮을 수 있습니다 (아마도 훨씬 낮음).
분포가 얼마나 이산 적인가에 달려 있습니다. 한 결과의 확률이 상당히 낮 으면 (따라서 데이터의 묶인 값 비율이 낮을 것으로 예상 됨) 크게 문제가되지 않습니다. 많은 사람들이 5를 실행하는 데 문제가 없을 것입니다 4.5 %에서 % 테스트를합니다. 예를 들어 [1,1000]에서 이산 유니폼을 테스트하는 경우 걱정할 필요가 없습니다.
그러나 값이 묶일 확률이 높으면 유형 I 오류율에 대한 영향을 표시 할 수 있습니다. 0.05를 원할 때 0.005의 유의 수준을 얻는다면 이는 그에 따라 힘에 영향을 미치기 때문에 문제가 될 수 있습니다.
대신 "이산 분포에서 추출한 표본에 대해 검정 통계량을 계산 한 다음 적절한 임계 값을 사용하거나 내 상황에 적합한 p- 값을 계산합니다"(예 : 순열 검정을 통해)를 의미하는 경우 물론 테스트 통계 자체의 이산 성까지 올바른 유형 I 오류율을 얻을 수 있다는 점에서 확실히 유효합니다 . (일반적인 경우와 마찬가지로 특정 목적에 맞는 더 나은 테스트가있을 수 있지만)
검정 통계량 자체의 분포는 더 이상 분포가 없지만 순열 검정은이 문제를 피합니다.
따라서 때로는 불연속 분포에서도 표준 테이블을 사용하는 것이 좋으며, 좋지 않은 경우에도 문제와 함께 사용하는 임계 값 / p- 값만큼 테스트 통계가 그리 크지 않습니다.