Wilcoxon 검정


13

윌 콕슨이 순위 테스트는 서명의 그것은 점근 상대 효율 (ARE) 것으로 잘 알려져있다 학생에 비해 t -test, 데이터는 정규 분포를 인구에서 도출되는 경우. 이것은 기본 1 샘플 테스트와 2 개의 독립적 인 샘플 (Wilcoxon-Mann-Whitney U)의 변형 모두에 해당됩니다. 또한 정상 데이터의 경우 ANOVA F 테스트와 비교 한 Kruskal-Wallis 테스트의 ARE입니다 .3π0.955

이 "놀랍게도 ( 의 가장 예상치 못한 외관π "중 하나 ) 놀랍도록 간단한 결과는 통찰력, 놀랍거나 간단한 증거를 가지고 있습니까?


의 모양을 감안할 때 일반 CDF에서을의 모양 에 정말 안 내용입니다 모두 놀랄 것이다. 답변을 드릴 수는 있지만 좋은 답변을 얻으려면 시간이 걸립니다. πππ
Glen_b-복지 주 모니카

1
@Glen_b 참으로-나는 왜 통계가 " 가 통계에 너무 많이 나타나는지"(CV에 있었는지 여부는 기억할 수 없지만) 토론하고 "정규 분포 때문에"많이 자라는 것을 알았습니다. 그러나 는 처음 볼 때 여전히 놀랍습니다. 비교를 위해 Mane-Whitney의 ARE 대 2- 표본 t- 검정은 지수 데이터에서 3, 이중 지수에서 1.5, 균일에서 1-훨씬 더 둥글다! 3 / ππ3/π
Silverfish

1
@Silverfish 나는 van der Vaart "Asymptotic Statistics"의 197 페이지를 링크했다. 1- 표본의 부호 테스트는 t- 테스트에 비해 입니다. 2/π
Khashaa

1
@Silverfish ... 그리고 물류에서는 입니다. 포함하는 잘 알려진 ARE (하나 또는 두 개의 샘플 경우) 가 있고 정수의 단순한 비율 인 꽤 있습니다. π(π/3)2π
Glen_b-복지 모니카

1
1 표본 부호있는 순위 테스트의 경우 것 같습니다 . 1 표본 부호 검정의 경우 입니다. 그래서 우리는 우리의 입장을 분명히했습니다. 나는 그것이 좋은 징조라고 생각합니다. 2 / π3/π2/π
Khashaa

답변:


10

1- 표본 검정, 서명 된 테스트 및 서명 된 순위 테스트에 대한 ARE의 간략한 스케치t

@Glen_b의 긴 답변에는 2 샘플 부호있는 순위 테스트에 대한 자세한 분석과 ARE의 직관적 인 설명이 포함되어 있다고 생각합니다. 그래서 나는 대부분의 파생을 건너 뛸 것입니다. (1 샘플 사례의 경우 Lehmann TSH에서 누락 된 세부 사항을 찾을 수 있습니다).

테스트 문제 : 을 위치 모델 f ( x θ ) 에서 임의의 샘플로 대칭 대칭으로합니다. 우리는 t- 검정에 대한 가설 H 0 : θ = 0에 대한 부호있는 검정, 부호있는 순위 검정의 ARE를 계산 해야합니다.X1,,Xnf(xθ)H0:θ=0

테스트의 상대적인 효율성을 평가하기 위해 일관된 테스트가 고정 된 대안에 비해 1의 힘을 갖는 경향이 있기 때문에 로컬 대안 만 고려됩니다. 사소한 점 근력을 유발하는 국소 대안은 종종 일부 문헌에서는 고정 된h의경우 n ,Pitman drift라고합니다.θn=h/nh

우리의 임무는

  • null 아래에서 각 검정 통계량의 한계 분포를 찾습니다.
  • 대안 아래에서 각 검정 통계량의 한계 분포를 찾으십시오.
  • 각 테스트의 국소 점 근력 계산

통계 및 무증상 테스트

  1. t- 검정 ( 가 존재 함 ) t n = σt N =
    tn=nX¯σ^dN(0,1)under the null
    tn=nX¯σ^dN(h/σ,1)under the alternative θ=h/n
    • 따라서 가 점근 검정력 함수 1 - Φ ( z α - h 1) 인지 여부를 기각하는 검정tn>zα
      1Φ(zαh1σ)
  2. 서명 된 테스트 Sn=1ni=1n1{Xi>0}
    n(Sn12)dN(0,14)under the null 
    국소 점 근력 1 - Φ ( z α - 2 h f ( 0 )을 가짐 )
    n(Sn12)dN(hf(0),14)under the alternative 
    1Φ(zα2hf(0))
  3. 부호있는 순위 검정 W n d N ( 2 h f 2 , 1
    Wn=n2/3i=1nRi1{Xi>0}dN(0,13)under the null 
    국소 점 근력 1 - Φ ( z α -
    WndN(2hf2,13)under the alternative 
    1Φ(zα12hf2)

ARE(Sn)=(2f(0)σ)2
ARE(Wn)=(12f2σ)2
fARE(Sn)=2/πARE(Wn)=3/π

fARE(Sn)=1/3ARE(Wn)=1/3

대안에 따른 배포 유도에 대한 언급

물론 대안 하에서 제한 분포를 도출하는 방법에는 여러 가지가 있습니다. 일반적인 접근 방법 중 하나는 Le Cam의 세 번째 음모를 사용하는 것입니다. 그것의 단순화 된 버전 상태

ΔnWn

(Wn,Δn)dN[(μσ2/2),(σW2ττσ2/2)]
WndN(μ+τ,σW2)under the alternative

cov(Wn,Δn)Δn

Δnhni=1nl(Xi)12h2I0
lI0Sn
cov(n(Sn1/2),Δn)=hcov(1{Xi>0},ff(Xi))=h0f=hf(0)

+1 나는 아주 많은 세부 사항에 들어 가지 않을 것입니다 (실제로 당신의 대답이 이미 아주 잘 다루고 있습니다. 아마도 지금 가지고있는 것에 아무것도 추가하지 않을 것입니다). 더 자세하게 설명하고 싶다면, 내 계정을 보류하지 마십시오. 나는 며칠이
지났지

이것은 특히 Le Cam의 정리 (+1)를 추가 할 때 좋은 대답입니다. 1, 2, 3의 무증상 설정과 ARE를 작성하는 "따라서"비트 사이에 상당히 큰 점프가있는 것 같습니다. 필자가이 글을 쓰고 있다면이 시점에서 점근 효율을 정의 할 것입니다. 미래 독자들이 따라하기가 훨씬 쉬워 질 것입니다.
Silverfish

H1

답변을 수정하거나 OP에 추가하십시오.
Khashaa

1

6

πtYtnπ3

n <- 1000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549402
[1] 0.9549297
n <- 100000000; x <- qnorm((1:n)/(n+1)); cor(1:n, x)^2; 3/pi
[1] 0.9549298
[1] 0.9549297

이것은 실제로 매우 유용한 의견입니다. 약간 개념적으로 수행하기에 더 n <- 1e6; x <- rnorm(n); cor(x, rank(x))^2가까운가?
Silverfish

(Frank의 의견에 흥미를 느끼는 사람들 은 Wilcoxon-Mann-Whitney U의 동등성과 순위에 대한 t- 테스트에 관한이 질문 을보고 싶을 수도 있습니다 .)
Silverfish

nnn

내 기억으로는 Wilcoxon 부호가있는 순위 테스트와 WMW의 작은 샘플 효율은 정규 분포에서 시프트 대안에 대한 점근 값보다 약간 낮습니다.
Glen_b-복지 주 모니카

5

12σ2[f2(x)dx]2fσ

f2f1ππ

부호가있는 순위 테스트의 ARE에 동일한 정수 (통합 포함)가 포함되므로 동일한 값을 갖습니다.

4σ2f(0)2f(0)2π

π

참고:

JL Hodges와 EL Lehmann (1956),
"t- 테스트의 일부 비모수 적 경쟁 업체의 효율성",
Ann. 수학. 통계 학자. , 27 : 2, 324-335.


π

f2dx

α=2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.