Wilcoxon 서명 등급 테스트의 적절성


11

Cross Validated 아카이브에서 약간 찌르고 내 질문에 대한 답변을 찾지 못하는 것 같습니다. 내 질문은 다음과 같습니다. Wikipedia는 Wilcoxon 부호있는 순위 테스트 (내 질문에 약간 수정 됨)에 대해 세 가지 가정을 제공합니다.

i = 1, ..., n에 대해 Zi = Xi-Yi라고하자.

  1. 차이 Zi는 독립적 인 것으로 가정된다.

  2. (a.) 각 Zi는 동일한 연속 모집단에서 나 왔으며, (b) 각 Zi는 공통 중앙값에 대해 대칭입니다.

  3. Xi와 Yi가 나타내는 값은 순서가 정해져 있으므로 '보다 큼', '보다 작음'및 '같음'비교가 유용합니다.

그러나 R의? wilcox.test에 대한 문서는 (2.b)가 실제로 절차에 의해 테스트 된 것으로 나타납니다.

"... x와 y가 모두 주어지고 쌍을 이루는 것이 참이면 x-y (쌍으로 된 두 표본 경우)의 분포가 mu에 대해 대칭이라는 null에 대한 Wilcoxon 부호 순위 테스트입니다."

날이 소리는 시험 "Z는 symetrically 주위 중앙값 MU = SomeMu 분산된다"는 귀무 가설 행한다 것처럼 - 예컨대 널 FO 거부 할 수 있음을 어느 대칭의 제거 또는 거부하는 주변 MU Z는 대칭이며 SomeMu입니다.

이것이 wilcox.test에 대한 R 문서를 올바르게 이해하고 있습니까? 물론 이것이 중요한 이유는 일부 전후 데이터 (위의 "X"및 "Y")에 대해 여러 쌍의 차이 테스트를 수행하고 있기 때문입니다. "이전"및 "이후"데이터는 개별적으로 치우 치지 만 차이는 거의 치우 치지 않습니다 (아직 약간 치우침). 즉, "이전"또는 "이후"데이터만으로 볼 때 ~ 7에서 21까지의 차이 (현재보고있는 샘플에 따라 다름)를 갖는 반면 "차이"데이터의 차이는 ~ = 0.5에서 5까지입니다. 그러나 거의하지 않습니다.

내 "차이"데이터에 왜곡이 발생하여 Wilcoxon 테스트에서 Wikipedia 기사에 표시된 것처럼 잘못된 / 편견 결과가 나올 경우 왜곡이 큰 문제가 될 수 있습니다. 그러나 Wilcoxon 테스트에서 실제로 차이 분포가 "mu = SomeMu 주위에 대칭"인지 여부를 테스트하는 경우 (? wilcox.test가 나타내는 것처럼) 이것이 문제가되지 않습니다.

따라서 내 질문은 다음과 같습니다

  1. 위의 어떤 해석이 맞습니까? "차이"분포의 왜도가 Wilcoxon 테스트에 치우치게됩니까?

  2. 왜도 문제인 경우 : "얼마나 왜도가 문제입니까?"

  3. Wilcoxon의 서명 된 순위 테스트가 여기에 심각하게 부적절 해 보이는 경우 사용해야하는 것에 대한 제안이 있습니까?

정말 고마워. 이 분석을 수행하는 방법에 대한 추가 제안 사항이 있으면 기꺼이들을 수 있습니다 (그 목적으로 다른 스레드를 열 수도 있음). 또한 이것은 Cross Validated에 대한 첫 번째 질문입니다. 이 질문을 어떻게했는지 제안 / 의견이 있으시면 저에게도 열려 있습니다!


약간의 배경 지식 : "확실한 생산의 오류"라고 부르는 것에 대한 관찰이 포함 된 데이터 세트를 분석하고 있습니다. 놀랍게도 검사 전후에 생산 공정에서 발생하는 오류에 대한 관찰 결과를 얻었으며, 분석의 목표 중 하나는 "검사에서 오류가 발생한 오류 수에 차이가 있습니까?"라는 질문에 대답하는 것입니다.

데이터 세트는 다음과 같습니다.

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

대략 4000 개의 관측치가 있습니다. 다른 변수는 회사의 특성을 설명하는 catagorical 관찰입니다. 크기는 작거나 중간이거나 클 수 있으며 각 회사는 그 중 하나 일뿐입니다. 회사는 "유형"중 일부 또는 전부일 수 있습니다.

모든 회사와 다양한 하위 그룹 (크기 및 유형에 따라)의 검사 전후에 관찰 된 오류율에 통계적으로 유의 한 차이가 있는지 알아보기 위해 간단한 테스트를 수행하라는 요청을 받았습니다. 예를 들어 R에서 데이터가 다음과 같이 보일 정도로 전후에 데이터가 심각하게 왜곡 되었기 때문에 T- 테스트가 종료되었습니다.

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(이것은 구성되어 있습니다-독점 / 개인 정보 문제로 인해 실제 데이터 또는 실제 조작을 게시 할 수 없습니다. 죄송합니다!)

쌍을 이루는 차이는보다 중앙 집중화되었지만 정규 분포에 너무 잘 맞지 않았습니다. 차이점 데이터는 다음과 같습니다.

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

나는 Wilcoxon 부호있는 순위 테스트를 사용하고? wilcox.test 및 Wikipedia에 대한 간단한 persusal 후 여기에서 사용하는 테스트처럼 보입니다. 위의 가정을 고려할 때 (1) 데이터 생성 프로세스가 적절하다고 생각합니다. 가정 (2.a)은 내 데이터에 대해 엄격하지는 않지만 여기서 논의 : 분포가 연속적이지 않을 때 Wilcoxon 테스트의 대안? 이것이 그다지 걱정하지 않았 음을 나타내는 것 같았습니다. 가정 (3)은 좋습니다. 나의 유일한 관심사는 (가정) 가정 (2.b)입니다.

몇 년 후 한 가지 추가 참고 사항 : 결국 우수한 비 모수 통계 과정을 수강하고 순위 합계 테스트에 많은 시간을 보냈습니다. "각 각은 동일한 연속 모집단에서 나옵니다"라는 가정 (2.a)에 포함되어 있으며, 두 표본이 모두 같은 분산을 가진 모집단에서 나왔다는 아이디어입니다 . 이는 실제로 매우 중요하고 실제로 드러납니다 . 모집단의 차이 (샘플을 추출하는)에 대한 우려가있는 경우 WMW 사용에 대해 걱정해야합니다.


두 답변 감사합니다! 그들은 둘 다 나에게 똑같이 도움이되었습니다. 가능하다면 "둘 다 선택"했을 것입니다. Mike는 이론적 이해에 대해 지적했습니다. 이는 Aniko가 내 원래의 질문에 조금 더 직접 대답했지만 개념적으로 매우 도움이되었습니다. 둘 다 감사합니다!
CompEcon

답변:


8

Wikipedia는 "... x와 y가 모두 주어지고 짝을 이루는 것이 참인 경우 Wilcoxon 부호있는 순위 테스트에서 x-y의 분포 ... "mu가 수행됩니다."

테스트는 의 RANK-TRANSFORMED 값이 귀무 가설에서 지정한 중앙값 주위에 대칭 인지 여부를 결정합니다 (제로를 사용한다고 가정). 대부분의 비모수 적 테스트와 마찬가지로 부호가있는 테스트는 "배포가 필요하지 않으므로"왜도는 문제가되지 않습니다. 이러한 테스트에 대해 지불하는 가격은 종종 전력을 낮추지 만이를 극복하기에 충분히 큰 샘플이있는 것 같습니다.zi=xiyi

순위 합계 테스트에 대한 "지옥 한 것"대안 은 이러한 측정이 대수 정규 분포를 따라갈 가능성이있을 때 및 와 같은 간단한 변환을 시도하는 것일 수 있습니다. 값은 "bell curvish"로 표시되어야합니다. 그런 다음 테스트에서 사용하고 자신과 비즈니스 통계 만 취한 상사에게 순위 합계 테스트가 작동하고 있음을 확신시킬 수 있습니다. 이것이 효과가 있다면 보너스가 있습니다. 대수 정규 데이터에 대한 t 검정은 변환되지 않은 원래 측정치의 중앙값을 비교하는 것입니다.ln(xi)ln(yi)

나를? 나는 둘 다하고 내가 할 수있는 다른 일을 할 것입니다 (기업 크기에 따라 Poisson 수에 대한 우도 비율 테스트?). 가설 테스트는 증거가 설득력이 있는지 여부를 결정하는 것이며, 일부 사람들은 설득력이 없습니다.


아, 그건 말이됩니다. 특히 집으로 돌아와서 이전의 DeGroot & Schervish 교과서를 꺼내서 사인 테스트가 실제로 무엇을하고 있는지에 대한 훌륭한 설명을 얻었습니다. 환상적인. 가설 검정에 대한 일반적인 생각에 감사합니다. :) 나는 관점을 좋아합니다. 하나의 사소한 참고 사항 : 오해의 소지가있는 부분은 실제로 wilcox.test 설명서의 R에서 나온 것입니다. 이것은 나에게 조금 혼란이다 ...
CompEcon

9

Wikipedia와 R 도움말 페이지는 모두 정확하며 동일한 내용을 나타내려고합니다. 단지 다르게 표현합니다.

Wikipedia 기사는 가설을 (median = 0) vs (median! = 0)으로 나타내며, 차이가 대칭 분포 (+ 다른 가정)를 갖는 경우 검정에서 결론을 내릴 수 있다고 말합니다.

R 도움말 페이지는보다 구체적이며 가설은 (중간 값 = 0이고 차이는 대칭 분포를 가짐) 대 (적어도 하나 이상은 거짓 임)로 표시됩니다. 따라서 가정을 귀무 가설로 옮겼습니다. 나는 그들이 대칭의 필요성을 강조하기 위해 이것을했다고 생각한다. 차이가 치우치면 부호있는 순위 검정은 중앙값이 죽은 경우에도 귀무 가설을 기각 할 것이다. 교과서를 읽으면 귀무 가설이 P (X> Y) = 0.5라는 사실을 알 수 있습니다. 나머지는 실제로 이것에서 따릅니다.

적용 측면에서, 질문은 물론 중앙값에 대해 특별히 관심이 있는지 (그리고 왜 왜곡이 문제이며, 중앙값 테스트가 가능한 대안인지) 또는 전체 분포에 관심이 있는지 여부와 P (X> y)! = 0.5는 변화의 증거입니다.


1
좋습니다. 입력 주셔서 감사합니다! 중간 테스트에 대한 Wikipedia 페이지에 짝이없는 Mann-Whitney-U 테스트가 선호된다고 표시되어 있습니다. 이것은 즉시 내가 시작한 곳으로 돌아 갔다고 생각합니다. Wilcoxon 쌍 테스트는 어떻게 든 더 많은 정보를 사용한다고 생각합니다. 아마도 내가 실제로 생각하고있는 것은 "중앙값 또는 전체 분포에 대해 특히주의하십시오"라고 말할 때의 의미 일 것입니다. 나는 전체 배포판에 관심이 있지만 중앙값을 통해 특성화하고있다.
CompEcon
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.