비모수 통계에서 동점이 왜 그렇게 어려운가요?


14

필자의 비모수 적 텍스트 인 Practical Nonparametric Statistics 는 종종 기대, 분산, 테스트 통계 등에 대한 명확한 공식을 제공하지만 관계를 무시할 경우에만 작동한다는 경고를 포함합니다. Mann-Whitney U 통계량을 계산할 때, 더 큰 것을 비교할 때 묶인 쌍을 버리는 것이 좋습니다.

나는 어떤 그룹이 다른 그룹보다 크지 않기 때문에 어떤 인구가 더 큰지 (그가 우리가 관심있는 경우)에 대해 실제로 많은 정보를 제공하지는 않지만 점근선 분포를 개발할 때 중요하지 않은 것처럼 보입니다.

그렇다면 일부 비모수 적 절차에서 관계를 다루는 것이 왜 그런가? 유용한 정보를 단순히 버리지 않고 추출하는 방법이 있습니까?

편집 : @ whuber의 의견과 관련하여 소스를 다시 확인했으며 일부 절차에서는 묶인 값을 완전히 삭제하는 대신 평균 순위를 사용합니다. 이것은 정보를 유지하는 것과 관련하여 더 합리적 인 것처럼 보이지만 엄밀한 정보가 부족한 것으로 보입니다. 그러나이 질문의 정신은 여전히 ​​유효합니다.


당신은 건가요 실용 비모수 통계 "에 당신을 알려줍니다 밖으로 던져 그들이 연결시 데이터를?" 조언을 잘못 해석 할 수 있습니까? 정확히 인용 해 주시겠습니까?
whuber

예, 조언을 잘못 해석하고있을 가능성이 있습니다. 같은 저자로부터 : jstor.org/stable/2284536 "Wilcoxon은 처음에 데이터에서 0을 삭제하고 축소 된 데이터 세트에 대해 테스트를 수행 할 것을 제안했습니다. 0이 아닌 관계가 없으면이 절차는 조건부 (숫자 수)가됩니다. 비 분포 통계에 관한 대부분의 책은 테스트에 대한 설명에 Wilcoxon의 방법을 통합합니다 "
Christopher Aden

물론 이것은 Wilcoxon Signed Rank 테스트와 관련이 있지만 다른 NP 절차에서 사용되는 비슷한 조언을 들었습니다. Mann-Whitney의 예와 관련하여 나는 책을 다시 살펴 보았고, 내가 틀렸다는 것이 맞습니다. Mann-Whitney의 경우이 책은 묶은 값의 순위를 평균화하는 것이 좋습니다. 즉, 순위 6과 7이 묶인 경우 각 값에 6.5를 부여합니다.
Christopher Aden

2
감사합니다. 묶인 그룹을 설명하는 엄격한 방법이 있습니다. 종종 검열 된 값이 큰 묶인 그룹을 구성하기 때문에 검열 된 (그러나 연속적인) 데이터로 작업 할 때 중요합니다. Kruskal-Wallis 및 Wilcoxon Rank Sum 테스트에 대해서는 RO Gilbert의 18 장, * 환경 오염 모니터링을위한 통계적 방법을 참조하십시오. "묶인 데이터가 포함 된 공식은 복잡 할 수 있지만 경우에 따라 KW 테스트와 같은 모든 작업을 수행해야합니다. 계급에 대한 ANOVA 테이블을 계산한다.
whuber

답변:


14

비모수에 대한 대부분의 작업은 원래 관계가 불가능할 수있는 기본 연속 분포가 있다고 가정하여 수행되었습니다 (정확히 충분히 측정 된 경우). 이론은 주문 통계 (관계없이 훨씬 간단 함) 또는 다른 공식의 분포를 기반으로 할 수 있습니다. 어떤 경우에는 통계가 대략적으로 정상이되어 일이 정말 쉬워집니다. 데이터가 반올림되었거나 자연스럽게 이산되어 관계가 도입되면 표준 가정이 유지되지 않습니다. 근사값은 일부 경우에는 여전히 충분하지만 다른 경우에는 충분하지 않을 수 있으므로 가장 쉬운 방법은 이러한 수식이 타이와 함께 작동하지 않는다는 경고를 제공하는 것입니다.

관계가있을 때 정확한 분포를 구한 일부 표준 비모수 적 테스트를위한 도구가 있습니다. R의 exactRankTests 패키지가 한 예입니다.

동점을 처리하는 간단한 방법 중 하나는 순열 테스트 또는 부트 스트랩과 같은 무작위 테스트를 사용하는 것입니다. 이것들은 점근 분포에 대해 걱정하지 않지만 데이터를 그대로 관계와 함께 사용하십시오 (많은 관계로 이러한 기술조차 저전력을 가질 수 있음에 유의하십시오).

몇 년 전 (미국 통계 학자에게서 생각했지만 찾지 못했습니다) 기사에서 관계의 아이디어와 함께 할 수있는 몇 가지 사항에 대해 논의했습니다. 한 가지 요점은 어떤 질문을 하느냐에 달려 있다는 것입니다. 우월성 테스트와 비열 등성 테스트는 관계로 무엇을해야하는지가 매우 다를 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.