R에서 wilcox.test와 coin :: wilcox_test의 차이점은 무엇입니까?


14

이 두 함수는 R에 존재하지만 차이점을 모르겠습니다. 호출 할 때 그들은 단지 같은 P-값을 반환 것으로 보인다 wilcox.testcorrect=FALSE,와 wilcox_test와 (동전 패키지) distribution="aymptotic". 다른 값의 경우 다른 p- 값을 반환합니다. 또한 wilcox.test매개 변수 설정과 관계없이 항상 내 데이터 세트에 대해 W = 0을 반환합니다.

x = c(1, 1, 1, 3, 3, 3, 3)y = c(4, 4, 6, 7, 7, 8, 10)

또한 R 이외의 다른 도구 (일부는 온라인, 다른 일부는 Excel 추가 기능)를 사용하려고 할 때 때로는 다른 p- 값을보고하기도합니다.

그렇다면 어떤 툴이 "올바른"p- 값을 제공하는지 어떻게 알 수 있습니까?

"정확한"p- 값이 있습니까, 아니면 몇 가지 도구가 p- 값 <0.05를 제공하는 경우 행복해야합니까? (이러한 툴은 R과 같은 많은 매개 변수화 가능성을 제공하지 않는 경우가 있습니다.)

내가 여기서 무엇을 놓치고 있습니까?

답변:


18

질문의 핵심은 Notes 섹션의? wilcox.test에 있습니다.

문헌은 Wilcoxon 순위 합계 및 Mann-Whitney 테스트의 정의에 대해서는 만장일치가 아닙니다.

이것이 의미하는 바는 두 샘플 사이의 위치 변화에 대한 비모수 적 테스트를 수행하는 방법이 두 가지 이상 있다는 것입니다. 또한 각 정의에 따라 ap 값을 얻는 방법은 여러 가지가 있습니다. "정확한"은 그것이 정확하다는 것을 의미하는 반면, "대략적인"또는 "점근 적"은 모두 진실의 근사치입니다. 그렇기 때문에 wilcox.test()및에 여러 옵션 wilcox_test()이 있으며 두 기능이 모두 정확히 동일한 작업을 수행하는 경우 일부 옵션 만 정확하게 일치합니다. 그것은과 같은 wilcox_test()값이 연결되어 때 동안, 심지어 정확한 P-값을 얻을 수있는 wilcox.test()값이 연결되어 때 점근 근사로 다시 떨어진다. Excel 추가 기능이 수행하는 통계 및 p- 값 계산 조합이 무엇인지 모르겠습니다.

다음 질문은 wilcox.test()항상 0을 반환하는 이유 입니다. 생성 한 데이터 세트의 경우 wilcox.test (x, y)를 수행 할 때 검정 통계량의 값은 0이지만 p- 값은 같은. 이유 는 wikipedia 페이지 를 참조하십시오 . wilcox_test()는에서 반환 한 통계의 Z 변환을 반환 wilcox.test()하므로 테스트 통계의 값이 다른 이유입니다.

올바른 p- 값이 있습니까? 예, 그러나 때로는 계산하기가 너무 어려우므로 대략적인 방법을 사용해야합니다 (메모리 부족으로 정확한 계산이 실패하는 방법에 대한 설명은? wilcox_test 참조). 근사치와 정확한 값의 차이는 두 그룹의 위치에서 실제 차이가 매우 작은 경우가 아니면 대부분 중요하지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.