chisq.test()
R 의 함수에서 Monte Carlo 시뮬레이션의 사용을 이해하고 싶습니다 .
128 레벨 / 클래스를 가진 질적 변수가 있습니다. 샘플 크기는 26입니다 (더 많은 "개체"를 샘플링 할 수 없었습니다). 분명히, 나는 "개인"이 0 인 레벨을 가질 것입니다. 그러나 사실 나는 가능한 127 개 중에서 매우 적은 수의 클래스 만 가지고 있다는 것입니다. 카이 제곱 테스트를 적용하려면 각 레벨에 최소 5 명의 개인이 있어야한다는 것을 들었습니다 (그 이유를 완전히 이해하지 못함). 나는 simulate.p.value
분포를 추정하기 위해 Monte Carlo 시뮬레이션을 사용하는 옵션을 사용해야 한다고 생각했습니다. p- 값을 계산합니다. Monte Carlo 시뮬레이션이 없으면 R은 p- 값을 제공합니다 < 1e-16
. Monte Carlo 시뮬레이션을 사용하면의 p- 값을 얻을 수 4e-5
있습니다.
26 1과 101 0의 벡터로 p- 값을 계산하려고 시도했으며 Monte-Carlo 시뮬레이션을 사용하면 1에서 p- 값을 얻습니다.
내 표본 크기가 가능한 클래스 수에 비해 적더라도 관측 된 분포는 가능한 모든 클래스가 실제 모집단에서 동일한 확률 (1/127)로 존재할 가능성이 거의 없다는 것을 언급해도 괜찮습니까? ?