순위 상관 계수와 관련하여 묶인 데이터 란 무엇입니까?


16

통계 필드에 없습니다.

Rank Correlation Coefficients에 대해 읽는 동안 "tied data"라는 단어를 보았습니다.

  • 묶인 데이터 란 무엇입니까?
  • 묶인 데이터의 예는 무엇입니까?

답변:


5

값이 같은 데이터를 의미합니다. 예를 들어 데이터 집합으로 1,2,3,3,4가 있으면 두 3은 묶인 데이터입니다. 데이터 세트로 1,2,3,4,5,5,5,6,7,7이 있으면 5와 7이 묶여있는 데이터입니다.


14

순위 데이터 기반의 비모수 통계 테스트와 관련하여 "계단 데이터"가 나타납니다.

비모수 적 테스트 : 특정 확률 분포를 가정하지 않는 테스트, 예를 들어 종 모양의 곡선을 가정하지 않습니다.

순위 기반 : 많은 비모수 적 테스트는 숫자 (예 : "3 일", "5 일"및 "4 일")를 순위 (예 : "가장 짧은 기간 (3 일)", "가장 긴 기간)로 변환하여 시작합니다. (1 번째) ","두 번째로 긴 기간 (2 번째) "). 그런 다음 전통적인 파라 메트릭 테스트 방법이이 순위에 적용됩니다.

동일한 데이터 를 순위로 변환해야하므로 연결 데이터 는 문제가됩니다. 때때로 순위가 무작위로 할당되고 때로는 평균 순위가 사용됩니다. 가장 중요한 것은 결과의 재현성을 위해 묶인 순위를 깨는 프로토콜을 설명해야합니다.


5

동일한 데이터 세트에서 7을 두 번 관찰하는 것과 같이 단순히 두 개의 동일한 데이터 값입니다.

이는 데이터가 연속적이고 동일한 측정이 불가능하다고 가정하는 통계적 방법과 관련하여 발생합니다 (또는 기술적으로 동일한 값이 0 일 가능성이 있음). 이러한 방법을 반올림 또는 클리핑 된 데이터에 적용하면 동일한 측정이 가능할뿐만 아니라 상당히 일반적 일 수 있으므로 실제적인 문제가 발생합니다.


1
이 사건이 결코 일어나지 않을 확률이 0이기 때문에 말할 수 없기 때문에이 주장에 동의하지 않습니다. 이것은 좋은 추론이 아닙니다.
Henry.L

2

문제는 근본적으로 중요합니다.

공동 관찰 / 데이터 / 쌍이 란 무엇입니까?

T+

(따라서 비모수 테스트를 먼저 도입하여 @ Ming-Chih Kao의 답변이 적절하다고 생각하지 않습니다. 그러나 제목은 '순위 상관 계수의 맥락에서 데이터가 무엇입니까?'라는 제목이므로 구입하겠습니다.)

Zi=XiYi

(Xi,Yi)

Zi

Zi

|Zi|

{(1,1)(1,1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

이 작업을 수행하는 가장 쉬운 방법을 시도해 봅시다. 왼쪽에서 오른쪽으로 순위를 매기고

Ri

|Zi|

Ri

|Zi|

Ri

|Zi|=1|Zi|=2

첫 번째 그룹의 각 관측치에 순위 할당합니다.1++77=48+92=8.5

Ri

이렇게하면 순위가 수정되고 각 관측치가 순위 통계 계산에 동일한 영향을 미치므로 순위 테스트에 영향을 미칩니다.

공동 관측 / 데이터 / 쌍에 대한 솔루션은 무엇입니까?

(1) 평균 순위를 지정하십시오. 이것은 우리가 위에서 한 것입니다. 동일한 그룹의 묶인 데이터에 동일한 순위를 지정함으로써 순위 테스트에서 영향을 동일하게 적용하므로 묶인 관측으로 인한 가능한 부정확성을 제거합니다.

MaxRankfirstgroup<MinRanksecondgroupMaxRankfirstgroup>MinRanksecondgroupMaxRankfirstgroup=MinRanksecondgroup그런 다음 묶인 두 그룹을 하나로 병합해야합니다.

ϵ

PX=x=0

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.