Cross Validated 아카이브에서 약간 찌르고 내 질문에 대한 답변을 찾지 못하는 것 같습니다. 내 질문은 다음과 같습니다. Wikipedia는 Wilcoxon 부호있는 순위 테스트 (내 질문에 약간 수정 됨)에 대해 세 가지 가정을 제공합니다.
i = 1, ..., n에 대해 Zi = Xi-Yi라고하자.
차이 Zi는 독립적 인 것으로 가정된다.
(a.) 각 Zi는 동일한 연속 모집단에서 나 왔으며, (b) 각 Zi는 공통 중앙값에 대해 대칭입니다.
Xi와 Yi가 나타내는 값은 순서가 정해져 있으므로 '보다 큼', '보다 작음'및 '같음'비교가 유용합니다.
그러나 R의? wilcox.test에 대한 문서는 (2.b)가 실제로 절차에 의해 테스트 된 것으로 나타납니다.
"... x와 y가 모두 주어지고 쌍을 이루는 것이 참이면 x-y (쌍으로 된 두 표본 경우)의 분포가 mu에 대해 대칭이라는 null에 대한 Wilcoxon 부호 순위 테스트입니다."
날이 소리는 시험 "Z는 symetrically 주위 중앙값 MU = SomeMu 분산된다"는 귀무 가설 행한다 것처럼 - 예컨대 널 FO 거부 할 수 있음을 어느 대칭의 제거 또는 거부하는 주변 MU Z는 대칭이며 SomeMu입니다.
이것이 wilcox.test에 대한 R 문서를 올바르게 이해하고 있습니까? 물론 이것이 중요한 이유는 일부 전후 데이터 (위의 "X"및 "Y")에 대해 여러 쌍의 차이 테스트를 수행하고 있기 때문입니다. "이전"및 "이후"데이터는 개별적으로 치우 치지 만 차이는 거의 치우 치지 않습니다 (아직 약간 치우침). 즉, "이전"또는 "이후"데이터만으로 볼 때 ~ 7에서 21까지의 차이 (현재보고있는 샘플에 따라 다름)를 갖는 반면 "차이"데이터의 차이는 ~ = 0.5에서 5까지입니다. 그러나 거의하지 않습니다.
내 "차이"데이터에 왜곡이 발생하여 Wilcoxon 테스트에서 Wikipedia 기사에 표시된 것처럼 잘못된 / 편견 결과가 나올 경우 왜곡이 큰 문제가 될 수 있습니다. 그러나 Wilcoxon 테스트에서 실제로 차이 분포가 "mu = SomeMu 주위에 대칭"인지 여부를 테스트하는 경우 (? wilcox.test가 나타내는 것처럼) 이것이 문제가되지 않습니다.
따라서 내 질문은 다음과 같습니다
위의 어떤 해석이 맞습니까? "차이"분포의 왜도가 Wilcoxon 테스트에 치우치게됩니까?
왜도 가 문제인 경우 : "얼마나 왜도가 문제입니까?"
Wilcoxon의 서명 된 순위 테스트가 여기에 심각하게 부적절 해 보이는 경우 사용해야하는 것에 대한 제안이 있습니까?
정말 고마워. 이 분석을 수행하는 방법에 대한 추가 제안 사항이 있으면 기꺼이들을 수 있습니다 (그 목적으로 다른 스레드를 열 수도 있음). 또한 이것은 Cross Validated에 대한 첫 번째 질문입니다. 이 질문을 어떻게했는지 제안 / 의견이 있으시면 저에게도 열려 있습니다!
약간의 배경 지식 : "확실한 생산의 오류"라고 부르는 것에 대한 관찰이 포함 된 데이터 세트를 분석하고 있습니다. 놀랍게도 검사 전후에 생산 공정에서 발생하는 오류에 대한 관찰 결과를 얻었으며, 분석의 목표 중 하나는 "검사에서 오류가 발생한 오류 수에 차이가 있습니까?"라는 질문에 대답하는 것입니다.
데이터 세트는 다음과 같습니다.
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
대략 4000 개의 관측치가 있습니다. 다른 변수는 회사의 특성을 설명하는 catagorical 관찰입니다. 크기는 작거나 중간이거나 클 수 있으며 각 회사는 그 중 하나 일뿐입니다. 회사는 "유형"중 일부 또는 전부일 수 있습니다.
모든 회사와 다양한 하위 그룹 (크기 및 유형에 따라)의 검사 전후에 관찰 된 오류율에 통계적으로 유의 한 차이가 있는지 알아보기 위해 간단한 테스트를 수행하라는 요청을 받았습니다. 예를 들어 R에서 데이터가 다음과 같이 보일 정도로 전후에 데이터가 심각하게 왜곡 되었기 때문에 T- 테스트가 종료되었습니다.
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(이것은 구성되어 있습니다-독점 / 개인 정보 문제로 인해 실제 데이터 또는 실제 조작을 게시 할 수 없습니다. 죄송합니다!)
쌍을 이루는 차이는보다 중앙 집중화되었지만 정규 분포에 너무 잘 맞지 않았습니다. 차이점 데이터는 다음과 같습니다.
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
나는 Wilcoxon 부호있는 순위 테스트를 사용하고? wilcox.test 및 Wikipedia에 대한 간단한 persusal 후 여기에서 사용하는 테스트처럼 보입니다. 위의 가정을 고려할 때 (1) 데이터 생성 프로세스가 적절하다고 생각합니다. 가정 (2.a)은 내 데이터에 대해 엄격하지는 않지만 여기서 논의 : 분포가 연속적이지 않을 때 Wilcoxon 테스트의 대안? 이것이 그다지 걱정하지 않았 음을 나타내는 것 같았습니다. 가정 (3)은 좋습니다. 나의 유일한 관심사는 (가정) 가정 (2.b)입니다.
몇 년 후 한 가지 추가 참고 사항 : 결국 우수한 비 모수 통계 과정을 수강하고 순위 합계 테스트에 많은 시간을 보냈습니다. "각 각은 동일한 연속 모집단에서 나옵니다"라는 가정 (2.a)에 포함되어 있으며, 두 표본이 모두 같은 분산을 가진 모집단에서 나왔다는 아이디어입니다 . 이는 실제로 매우 중요하고 실제로 드러납니다 . 모집단의 차이 (샘플을 추출하는)에 대한 우려가있는 경우 WMW 사용에 대해 걱정해야합니다.