Kolmogorov–Smirnov 검정의 간단한 동등성 검정 버전이 있습니까?


13

콜 모고 로프-스 미르 노프 (Kolmogorov–Smirnov) 검정에 대해 두 개의 일 방성 검정 (TOST)이 두 개의 분포 적어도 일부 연구원이 지정한 수준에 따라 다른 부정적 귀무 가설을 검정하도록 구성 되었습니까?

TOST가 아닌 경우 다른 형태의 동등성 검정?

Nick Stauner는 현명하게도 확률 론적 동등성에 대한 귀무 가설에 대한 다른 비모수 적 TOST 동등성 검정과 중간 정도 동등성에 대한보다 제한적인 가정이 있음을 지적합니다.


답변:


9

자, 여기 첫 번째 시도가 있습니다. 면밀한 조사와 의견에 감사드립니다!

2- 표본 가설
우리가 다음과 같이 귀무 가설과 대립 가설을 사용하여 2- 표본 단측 Kolmogorov-Smirnov 가설 검정 을 구성 할 수있는 경우 :

H 0F Y ( t )F X ( t )0FY(t)FX(t)

H F Y ( t ) < F X ( t ) , 적어도 하나 t , 여기서,AFY(t)<FX(t)t

  • 0F Y ( t )F X ( t )D=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • 검정 통계량 H 해당합니다 ; 과0F Y ( t )F X ( t )D+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • F X ( t ) Y XFY(t) & 는 샘플 와 의 경험적 CDF 입니다 .FX(t)YX

그런 다음 등가 구간이 모멘트에 대해 대칭이라고 가정 할 때 이러한 선을 따라 등가 테스트에 대한 일반적인 구간 가설을 작성하는 것이 합리적이어야합니다.

H 및0|FY(t)FX(t)|Δ

H적어도 하나의 대해 .tA|FY(t)FX(t)|<Δt

이것은 (이 두 가지 가설이 있기 때문에, 같은 형태를 취할 두 동등성에 대한 테스트에 "소극"널 가설을 일방적 특정로 번역하는 것 모두 및 엄격하게 비 음) D -D+D

H 또는01D+Δ

H 입니다.02DΔ

H H 모두 거부 하면 . 물론 등가 간격은 대칭 일 필요가 없으며 , 각 단측 귀무 가설에 대해 및 를 (아래) 및 (위)로 있습니다.02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ101 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

테스트 통계 (업데이트 됨 : 델타 절대 값 부호를 벗어남)
테스트 통계 및 ( 및 암시 적) H 및 H 에 각각 해당하며 다음과 같습니다. D 2 n Y n X 01 02D1+D2nYnX0102

D1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|,

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

동등성 / 관련성 임계 값
간격 비대칭 동등성 간격을 사용하는 경우 간격 또는 간격은 및 단위로 표시됩니다. 또는 차이 확률의 크기. 마찬가지로 과 접근 무한대 의 CDF 또는 위한 접근 대해 , 및에 대한 :[ Δ 2 , Δ 1 ] D + D n Y n X D + D n Y , n X 0 t < 0 t 0[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0t<0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

$ D ^ {+} $ (또는 $ D ^ {-} $)의 CDF

이 날 것으로 보인다 그래서 샘플 크기 조정에 대한 PDF 것을 (또는 샘플 크기 조정 )이어야 에 대해 , 및 대한 : D 0 t < 0 t 0D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

$ D ^ {+} $ (또는 $ D ^ {-} $)의 PDF

Glen_b이는 것을 지적 레일리 분포 와 . 따라서 샘플 크기 스케일 및 대한 큰 샘플 Quantile 함수 는 다음과 같습니다. D+Dσ=12D+D

CDF1=Q(p)=ln(1p)2

의 자유로운 선택은 임계 값 일 수 있으며,보다 엄격한 선택은 임계 값 .Q α + σ / 2 = Q α + 1Δ Qα+σ/4=Qα+1Qα+σ/2=Qα+14Qα+σ/4=Qα+18


1
cdf에서 pdf로 전달하는 줄에, 당신이 잘못했다고 생각합니다. 하자 이므로 (남용을 표기법), 한계 에서 그런 다음 ( 뒤에있는 참고 ). (미분을 취한 위의 행에있는 지수에서 누락 된 부호에 주목하십시오. 또한 당신이 왜 완전한 상징을 가지고 있는지 잘 모르겠지만, 아마도 내가 잘못 이해했을 수도 있습니다.)P(K,t)=1e2t2fK(t)=dKnY,nX=nYnXnY+nXD+P(K,t)=1e2t2fK(t)=ddt1e2t2=4te2t24t4
Glen_b -Reinstate Monica

2
@stochazesthai 및 는 두 가지 단측 테스트 통계입니다. TOST 당 이러한 테스트 통계가 적용되는 귀무 가설을 모두 거부해야합니다. 는 위의 라인 에서 CDF 의 중요한 값 이며 대해 를 입력 하려는 경우 (예 : ). 의 선택은 (일반적 오래된 양성자 의 임계 거부 값)를 지나서 관련 차이 를 결정하기 전에 가야 하는 정도에 따라 달라집니다 (예 : 자유주의 '등가'는 D 2 Q α 1 1 α p Q α = D1D2Qα11αpQα=ln(1(1α))2ΔQαH014 σ 넘어 ). Qα
Alexis

2
@stochazesthai (계속) 그렇다면 모두 와 , 당신은 거부 . D1ΔD2ΔH0
Alexis

2
트윗 담아 가기 나는 단어 주위에 따옴표를 했어야 자유 보다는 동등성 이 개 댓글 다시. :)
Alexis

2
@stochazesthai 인 경우 을 거부 하고 인 경우 를 거부하지 . 경우 후 거부 , 경우 후 거부하지 . 모두 거절하면 및 다음 거부 달리 거부하지 . D1ΔH01D1<ΔH01D2ΔH02D2<ΔH02H01H02H0H0
Alexis

6

동등성 테스트에서 TOST의 대안은 신뢰 구간 접근 방식을 기반으로합니다.

하자 미리 지정된 동등성 마진을 표시 알려지지 않은 기본 분포 함수 사이의 Kolmogorov-Smirnov 거리.Δ

θ:=supt|FX(t)FY(t)|

이제 대한 90 % 신뢰 구간 이 완전히 내에 있으면 가 "상당성"이라고 말하기에 0에 충분히 가깝다고 95 % 확신 할 수 있습니다 .θ[Δ,Δ]θ

기본 분포를 알지 못하면 대략적인 분석 신뢰 구간을 도출하는 것이 바람직하지 않은 것 같습니다. 따라서 및 쌍의 리샘플링을 기반으로 (바이어스 수정 된) 부트 스트랩 신뢰 구간에 의존해야 할 수도 있습니다 . (하지만이 특정 응용 프로그램에서 그 유효성에 대한 조건을 찾고 싶지 않습니다 ...)YXY


우수한. (부트 스트랩 또는 기타) 의 CI를 수행하는 사람에 대한 인용이 있습니까? Dn1,n2
Alexis

1
좋은 점 ... 짧은 논문 tomswebpage.net/images/K-S_test.doc는 "David J.Sheskin (2011 년 4 월 27 일)의 매개 변수 및 비모수 통계 절차 핸드북, 5 판"을 언급합니다. D에 대해 두 가지 샘플 사례 구성을 제공합니다. 그러나 현재이 책에 액세스 할 수 없습니다.
Michael M
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.