답변:
더 나은 방법은 시뮬레이션으로 p- 값의 임계 값을 계산하는 것입니다. 문제는 가정 된 값을 사용하지 않고 데이터에서 모수를 추정 할 때 KS 통계량 분포가 널 분포를 따르지 않는다는 것입니다.
대신 KS 테스트의 p- 값을 무시하고 대신 실제 데이터와 동일한 크기의 후보 분포 (의미있는 매개 변수 세트)에서 여러 데이터 세트를 시뮬레이션 할 수 있습니다. 그런 다음 각 세트에 대해 매개 변수를 추정하고 추정 된 매개 변수를 사용하여 KS 테스트를 수행하십시오. p- 값은 원래 데이터보다 더 철저한 시뮬레이션 된 집합의 테스트 통계 비율입니다.
표본 분할은 통계 분포 문제를 줄일 수 있지만 제거하지는 않습니다.
귀하의 아이디어는 추정치가 동일한 표본을 기반으로하기 때문에 모집단 값에 비해 '너무 가깝습니다'라는 문제를 피합니다.
당신은 그들이 여전히 추정하는 문제를 피하지 않습니다. 검정 통계량의 분포는 표로 작성된 것이 아닙니다.
이 경우 획기적으로 줄이지 않고 널 아래에서 거부율을 증가시킵니다.
Shapiro Wilk와 같은 매개 변수가 알려져 있지 않은 테스트를 사용하는 것이 더 좋습니다.
Kolmogorov-Smirnov 유형의 테스트에 참여한 경우 Lilliefors의 테스트 방법을 사용할 수 있습니다.
즉, KS 통계량을 사용하지만 검정 통계량 분포가 모수 추정의 영향을 반영하도록하려면 모수 추정치 하에서 검정 통계량의 분포를 시뮬레이션하십시오. (더 이상 배포 할 필요가 없으므로 각 배포마다 새 테이블이 필요합니다.)
http://en.wikipedia.org/wiki/Lilliefors_test
Liliefors는 정규 및 지수 경우에 시뮬레이션을 사용했지만 특정 분포에 대해 쉽게 시뮬레이션을 수행 할 수 있습니다. R과 같은 경우 10,000 또는 100,000 개의 샘플을 시뮬레이션하고 널 아래에서 테스트 통계량의 분포를 얻는 것은 순간 문제입니다.
[대안은 같은 문제가 있지만 D' Agostino와 Stephens의 책에서 판단한 적합도 기술 (the Goodness-of-fit-techniques )) 의 Anderson-Darling을 고려하는 것이 덜 민감 할 수 있습니다. Lilliefors 아이디어를 적용 할 수는 있지만 비교적 간단하게 조정되는 것이 좋습니다.]
그러나 여전히 다른 접근법이 있습니다. 여러 특정 사례에서 모수 추정을 처리 할 수있는 (예를 들어 Rayner and Best의 책 참조) 적합 적합성에 대한 부드러운 테스트 패밀리가 있습니다.
* 그 효과는 여전히 상당히 클 수있다-아마도 일반적으로 허용되는 것으로 간주되는 것보다 더 클 수있다. 모모는 이에 대한 우려를 표명 할 권리가 있습니다. 더 높은 유형 I 오류율 (및 더 평평한 전력 곡선)이 문제인 경우 이는 개선되지 않을 수 있습니다!
문제가 해결되지 않을까 걱정됩니다. 문제는 매개 변수가 동일한 샘플에서 추출 된 것이 아니라 모든 샘플에서 추정된다는 것입니다. KS 검정의 일반적인 널 분포의 도출은 기준 분포의 모수에서 추정 오차를 설명하지 않고 주어진 오차로 간주합니다. 이 문제에 대해 오랫동안 논의하고 솔루션을 제공하는 Durbin 1973 을 참조하십시오 .