어떤 상황에서 Wilcoxon의 Signed-Rank Test가 t-Test 또는 Sign Test보다 선호됩니까?


10

약간의 토론 (아래) 후에, 나는 집중된 질문에 대한 명확한 그림을 얻었습니다. 따라서 수정 된 질문이 있습니다. 그러나 일부 의견은 원래 질문과 관련이없는 것처럼 보일 수 있습니다.

것으로 보인다 t-테스트가 대칭 분포를 신속하게 수렴 것으로, 서명 순위 테스트가 대칭을 가정 하고, 즉, 대칭 배포 수단 / pseudomedians / 중간 값 사이에는 차이가 없다. 그렇다면, 어떤 상황에서 상대적으로 경험이없는 통계학자가 t- 검정과 부호 검정을 모두 사용할 수있는 경우 부호있는 순위 검정이 유용하다고 생각합니까? 저의 (예 : 사회 과학) 학생들 중 한 사람이 다른 치료법보다 더 나은 치료법을 시험하려고하는 경우 (예 : "평균"차이의 개념과 같이 비교적 쉽게 해석되는 척도), 나는 서명 된 자리를 찾기 위해 고심하고 있습니다 대학에서 일반적으로 가르치는 것으로 보이지만 사인 테스트는 무시되었지만 등급 테스트.


1
정당성 : 물론, 나는 그것에 대해 생각하지 않았다.
JonB

1
그것은 당신이보고 있는 기존의 지혜 에 달려 있습니다. 그것에 대한 나의 경험은 당신과는 매우 다릅니다. 확실히 차이 점수의 대칭이 널 (null) 하에서 가정된다는 것을 분명히 나타내는 자료를 쉽게 찾을 수 있습니다. 그러나 이것은 null에 해당 합니다. 결과적으로 표본의 차이 점수에서 대칭성이 부족하다는 사실은 반드시 관련이있는 것은 아닙니다. 대안에서 대칭성을 가질 필요는 없습니다. 만약 널이 참이라면 대칭이 유지 될 것이라고 확신한다면, 그리고 많은 경우에 그것은 매우 그럴듯한 가정 일 것입니다. ... ctd
Glen_b -Reinstate Monica

1
ctd ... 그러면 문제가 없습니다. 문제는 사전에 가정 할 준비가되지 않은 경우 가정 실패로 인한 거부인지 알 수 없다는 것입니다. 그때해야 할 분명한 일은 단순히 가정 하지 않는 것입니다.
Glen_b-복지 주 모니카

2
두 번째 의견을 먼저 살펴보십시오 (이미 언급 한 내용의 상단에 있음). 1. 일반적인 가정은 모수 테스트를 소진하지 않습니다. 2. 부호있는 순위 검정은 실제로 중앙값을 테스트하는 것이 아니라 단일 표본 Hodges-Lehmann 통계 / 의사 중앙을 테스트하는 것입니다 (대체에 대칭 가정을 추가하면 중간 값도 테스트되며 평균이 존재하는 경우) 또한 다른 많은 것들 중에서도 수단을 위해). 마찬가지로 순위 합계 테스트는 중앙값 테스트가 아니라 평균 쌍별 차이에 대한 테스트입니다. 서명 된 순위 테스트 수준은 비대칭에 매우 민감 할 수 있습니다.
Glen_b-복지 주 모니카

2
이전 주석에서 : 1 대칭은 일반적으로 null의 일부로 표시되지 않지만 null 아래에서 순열을 교환하기 위해 필요한 가정의 일부로 표시됩니다. 2. 앞에서 언급했듯이 실제로는 중앙값 테스트가 아니라 의사 중앙 테스트이므로 비대칭적인 대안에서도 마찬가지입니다. 제한적인 가정을한다면 해석이 더 쉬울 수도 있지만, 중간 값에 대한 합리적인 검정을 만들기 위해 필요한 제한이 대안에서 대칭을 가정하는 것만 큼 엄격 할 필요는 없습니다.
Glen_b-복지 주 모니카

답변:


3

정상보다 다소 무겁지만 특히 "피피"가 아닌 쌍 차이의 분포를 고려하십시오. 서명 된 순위 테스트는 종종 t- 테스트보다 강력하지만 부호 테스트보다 강력합니다.

예를 들어, 로지스틱 분포에서 t- 검정에 대한 부호있는 순위 테스트의 점근 적 상대 효율은 1.097이므로 부호있는 순위 테스트는 t (적어도 더 큰 샘플에서는)보다 강력해야하지만 점근 적 상대 효율 t- 검정에 대한 부호 테스트의 0.82는 0.822이므로, 부호 테스트는 t보다 강력하지 않습니다 (적어도 더 큰 샘플에서).

지나치게 꼬리가 큰 분포로 이동하면 (여전히 지나치게 많은 분포를 피하면서) t는 상대적으로 성능이 저하되는 반면 부호 테스트는 다소 개선되고 부호와 부호가있는 순위는 작은 감지에서 t를 능가합니다. 상당한 마진에 의한 영향 (즉, 효과를 탐지하기 위해 훨씬 더 작은 샘플 크기가 필요함). 부호있는 순위 검정이 세 가지 중에서 가장 큰 분포가있을 것입니다.

δ

t에 대한 전력 곡선의 플롯, Wilcoxon은 t3에 대해 n = 100 및 5 % 유의 수준으로 순위 및 부호 테스트를 서명했습니다.

그림에서 볼 수 있듯이 부호있는 순위 테스트는 부호 테스트보다 더 많은 검정력을 가지며, t 테스트보다 더 큰 검정력을가집니다.


이 @Glen_b 주셔서 감사합니다! 나는 심지어 권력의 개념조차도 연구의 범위를 벗어난 학생들을 가지고 있고 왜 우리가 Wilcoxon을 짝을 이루는 t의 주요 대안으로 가르치는 지 강의 계획서에 맞는 위치로 해결하기 위해 고심하고 있습니다. 그러나 이것은 유용한 동기 부여를 제공합니다. 감사합니다!
justme

우연히 어떤 분포 특징이 중앙값의 점근 적 분산에 영향을 미치는지 (따라서 부호 테스트의 검정력)를 고려한 후, t와 부호 테스트의 상대 위치가 반전되는 예가 나에게 생겼다. 결과적으로 서명 된 순위 테스트가 다른 두 테스트 중 하나보다 훨씬 더 나은 경우를 구성 할 가능성이 있다고 생각합니다. 내가 할 수있을 때 좀 더 연주하고 무언가를 쓸 수있을 것입니다.
Glen_b-복지 주 모니카

강의 계획서가 진행되는 한, 서명 된 순위가 다른 두 가지 테스트보다 우수한 경우가 분명히 있습니다 (내 답변에 요약 된 것처럼-정상보다 약간 무겁지만 특별히 정점은 아닌 분포). t는 정상 또는 가벼울수록 더 좋으며 분포가 강한 피크를 가질 때 부호 테스트가 더 좋습니다 (종종 매우 두꺼운 꼬리를 따라가는 경향이 있지만 꼭 그럴 필요는 없습니다). [단, 스프레드의 변화만으로 이러한 아이디어를 혼동한다는 점을 명심하십시오. 이는 상대적인 속성을 변경하지 않습니다.] ... 그런 문장을 몇 개 짜낼 수 있다고 확신합니다.
Glen_b -Reinstate 모니카

많은 감사합니다 @Glen_b! 문제는 강의 계획서를 가르치지 않고 단지 그것을 지원하는 것입니다! 대부분의 부서의 강의 계획서는 다음과 같습니다 : (i) 정규성에 대한 가설 검정을 사용하고 (지금은 저를 죽여주십시오) 그리고 (ii) Wilcoxon 또는 t-Test를 사용합니다. 따라서 분포 등의 어깨에 대한 세밀한 세부 사항은 가정이 충족되는지 여부 (약간 졸작)인지조차도 결코 건드리지 않으며 권력도 아닙니다. 그러나 당신의 생각은 적어도 개인적으로 저에게 매우 도움이됩니다!
justme

멋진 글 @Glen_b! 두 테스트 중 하나를 선택할 때 항상 전력을 먼저 계산해야한다는 결론을 내릴 수 있습니까? 차이 분포가 정상이 아닌 경우 항상 부호 테스트를 사용한다는 가정을 따르지 않습니까? 감사!
Lumos
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.