답변:
순위 데이터 기반의 비모수 통계 테스트와 관련하여 "계단 데이터"가 나타납니다.
비모수 적 테스트 : 특정 확률 분포를 가정하지 않는 테스트, 예를 들어 종 모양의 곡선을 가정하지 않습니다.
순위 기반 : 많은 비모수 적 테스트는 숫자 (예 : "3 일", "5 일"및 "4 일")를 순위 (예 : "가장 짧은 기간 (3 일)", "가장 긴 기간)로 변환하여 시작합니다. (1 번째) ","두 번째로 긴 기간 (2 번째) "). 그런 다음 전통적인 파라 메트릭 테스트 방법이이 순위에 적용됩니다.
동일한 데이터 를 순위로 변환해야하므로 연결 데이터 는 문제가됩니다. 때때로 순위가 무작위로 할당되고 때로는 평균 순위가 사용됩니다. 가장 중요한 것은 결과의 재현성을 위해 묶인 순위를 깨는 프로토콜을 설명해야합니다.
동일한 데이터 세트에서 7을 두 번 관찰하는 것과 같이 단순히 두 개의 동일한 데이터 값입니다.
이는 데이터가 연속적이고 동일한 측정이 불가능하다고 가정하는 통계적 방법과 관련하여 발생합니다 (또는 기술적으로 동일한 값이 0 일 가능성이 있음). 이러한 방법을 반올림 또는 클리핑 된 데이터에 적용하면 동일한 측정이 가능할뿐만 아니라 상당히 일반적 일 수 있으므로 실제적인 문제가 발생합니다.
문제는 근본적으로 중요합니다.
공동 관찰 / 데이터 / 쌍이 란 무엇입니까?
(따라서 비모수 테스트를 먼저 도입하여 @ Ming-Chih Kao의 답변이 적절하다고 생각하지 않습니다. 그러나 제목은 '순위 상관 계수의 맥락에서 데이터가 무엇입니까?'라는 제목이므로 구입하겠습니다.)
이 작업을 수행하는 가장 쉬운 방법을 시도해 봅시다. 왼쪽에서 오른쪽으로 순위를 매기고
첫 번째 그룹의 각 관측치에 순위 할당합니다.
이렇게하면 순위가 수정되고 각 관측치가 순위 통계 계산에 동일한 영향을 미치므로 순위 테스트에 영향을 미칩니다.
공동 관측 / 데이터 / 쌍에 대한 솔루션은 무엇입니까?
(1) 평균 순위를 지정하십시오. 이것은 우리가 위에서 한 것입니다. 동일한 그룹의 묶인 데이터에 동일한 순위를 지정함으로써 순위 테스트에서 영향을 동일하게 적용하므로 묶인 관측으로 인한 가능한 부정확성을 제거합니다.
그런 다음 묶인 두 그룹을 하나로 병합해야합니다.