참조 페이지에 대한 설명은
홍보 ( P≤ k / n심)k / n심
이것을 이해하기 위해 우리는 코드를 살펴 봐야합니다.
fred <- function(x) {ks.test(...)$statistic} # Apply a statistical test to an array
d.hat <- fred(x) # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
2, fred) # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value
두드러진 문제는 코드가 견적과 일치하지 않는다는 것입니다. 우리는 그것들을 어떻게 조화시킬 수 있습니까? 한 번의 시도는 인용의 마지막 절반으로 시작합니다. 절차를 다음 단계로 구성하는 것으로 해석 할 수 있습니다.
확률 법칙 에 따라 독립적으로 동일하게 분포 된 데이터 수집 합니다. 숫자 을 생성하기 위해 테스트 절차 (코드로 구현 됨 )를 적용하십시오 . G t T 0 = t ( X 1 , … , X n )엑스1, X2, … , X엔지tfred
T0=t(X1,…,Xn)
확률 법칙 가있는 귀무 가설에 따라 각각 크기가 인 컴퓨터 비교 가능한 데이터 세트 를 통해 생성 합니다 . 이러한 각 데이터 세트에 를 적용 하여 숫자 . n F t N T 1 , T 2 , … , T NN=nsimnFtNT1,T2,…,TN
계산
P=(∑i=1NI(Ti>T0)+1)/(N+1).
( " "벡터 값 비교에 의해 구현되는 지시 함수 인 코드한다.)가 오른쪽이 덕분 랜덤 인 것으로 이해된다 동시 의 임의성 (실제 통계량) 과 의 랜덤 ( 시뮬레이션 된 테스트 통계). T 0 T iId.star > d.hat
T0Ti
데이터가 귀무 가설에 부합한다고 말하는 것은 를 주장하는 것 입니다. 테스트 크기 , . 양변을 곱 감산 가능성이 있다고 보여 임의 번호 더 이상있는 기회 의 초과하지 . 이것은 단지 이 모든 테스트 통계 의 정렬 된 세트의 상위 내에 있다는 것입니다 . (건설)F=Gα0<α<1N+11P≤αα(N+1)α−1TiT0T0(N+1)αN+1T0모든 무관 경우, 연속 분포이 기회 정수 부분으로 표시되는 총 분율 것이다 ; 즉, 제공 한 것과 정확히 동일합니다 는 정수 . 즉, .TiF⌊(N+1)α⌋(N+1)αkα=k/(N+1)
Pr(P≤α)=⌊(N+1)α⌋N+1≈α
(N+1)αkα=k/(N+1)
이것은 확실히 "p- 값"이라고 할 가치가있는 모든 수량에 대해 진실되고 싶은 것 중 하나입니다 . 에 균일 한 분포를 가져야합니다 . 제공자 그래서 어떤 것이 상당히 크다 가까운 형태의 일부 분율이다 이 확대 균일 할 것 분포. (p- 값에 필요한 추가 조건에 대해 알아 보려면 p- 값 주제에 게시 한 대화 상자 를 읽으 십시오. )N + 1 α k / ( N + 1 ) = k / ( n sim + 1 ) P[0,1]N+1αk/(N+1)=k/(nsim+1)P
분명히 인용이 "를 사용한다 대신"의 " "이 나타납니다 곳.N SIMnsim+1nsim