적합도 테스트는 다음 사용 통계 : 것을 허가 테스트에서, 조건이 하나의 사용, 충족 - 분배 지정된 것을 P 값 계산하기 동일한 크기의 대표적인 샘플에서 이러한 값을 관찰하는 것이 사실 일 것이다. χ2
그러나 통계량 가 ( 자유도를 갖는) 를 따르 려면 독립 표준 표준 ( Wikipedia )). 테스트 조건은 다음과 같습니다 (다시 Wikipedia에서 ). χ 2 n − 1 n ∑ i = 1 ( O i − E i ) 2 Zi
- 인구 대표 표본
- 큰 샘플 크기
- 예상 세포 수가 충분히 크다
- 각 카테고리의 독립성
조건 (1,2)에서 우리는 표본에서 모집단으로의 추론 조건을 만족한다는 것이 분명합니다. (3) 분모에 있는 이산 카운트 가 각 에 대해 연속 분포를 않고 충분히 크지 않으면 Yates 로 정정 할 수있는 오류가 있기 때문에 필요한 가정 인 것 같습니다. 수정 -이것은 불연속 분포가 기본적으로 "바닥"연속 분포라는 사실에서 비롯된 것이므로 각각에 대해 씩 이동 하면이 문제가 해결됩니다.Z i
(4)의 필요성은 나중에 편리해 보일 것 같습니다만, 어떻게 볼 수 없습니다.
처음 에는 통계가 분포와 일치하려면 이 필요하다고 생각했습니다. 이로 인해 이 의심스러운 가정으로 . 실제로, 에서 로의 등변의 두 측면에 대한 차원의 축소에서 이것이 가능하지 않다는 것이 분명합니다. Oi−Ei∼N(nn
whuber의 설명 덕분에 Z_i는 이므로 각 용어와 같을 필요는 없다는 것이 표준 정규 확률 변수의 (합계 변수의 개수의 감소 주) 있는 기능적 독립적.O i − E i
그렇다면 제 질문 은 어떻게 가 분포를 따를 수 있습니까? 각 항의 어떤 조합이 제곱 표준 법선 입니까? 이를 위해서는 분명히 CLT를 사용해야합니다. 다시 말해 , 각각의 는 무엇 입니까?