순위 상관 계수와 관련하여 묶인 데이터 란 무엇입니까?

16

통계 필드에 없습니다.

Rank Correlation Coefficients에 대해 읽는 동안 "tied data"라는 단어를 보았습니다.

묶인 데이터 란 무엇입니까?
묶인 데이터의 예는 무엇입니까?

correlation nonparametric ranks

— BB01
소스

5

값이 같은 데이터를 의미합니다. 예를 들어 데이터 집합으로 1,2,3,3,4가 있으면 두 3은 묶인 데이터입니다. 데이터 세트로 1,2,3,4,5,5,5,6,7,7이 있으면 5와 7이 묶여있는 데이터입니다.

— 쿼크 다운 27
소스

14

순위 데이터 기반의 비모수 통계 테스트와 관련하여 "계단 데이터"가 나타납니다.

비모수 적 테스트 : 특정 확률 분포를 가정하지 않는 테스트, 예를 들어 종 모양의 곡선을 가정하지 않습니다.

순위 기반 : 많은 비모수 적 테스트는 숫자 (예 : "3 일", "5 일"및 "4 일")를 순위 (예 : "가장 짧은 기간 (3 일)", "가장 긴 기간)로 변환하여 시작합니다. (1 번째) ","두 번째로 긴 기간 (2 번째) "). 그런 다음 전통적인 파라 메트릭 테스트 방법이이 순위에 적용됩니다.

동일한 데이터 를 순위로 변환해야하므로 연결 데이터 는 문제가됩니다. 때때로 순위가 무작위로 할당되고 때로는 평균 순위가 사용됩니다. 가장 중요한 것은 결과의 재현성을 위해 묶인 순위를 깨는 프로토콜을 설명해야합니다.

— 명나라 K
소스

5

동일한 데이터 세트에서 7을 두 번 관찰하는 것과 같이 단순히 두 개의 동일한 데이터 값입니다.

이는 데이터가 연속적이고 동일한 측정이 불가능하다고 가정하는 통계적 방법과 관련하여 발생합니다 (또는 기술적으로 동일한 값이 0 일 가능성이 있음). 이러한 방법을 반올림 또는 클리핑 된 데이터에 적용하면 동일한 측정이 가능할뿐만 아니라 상당히 일반적 일 수 있으므로 실제적인 문제가 발생합니다.

— 존 디 쿡
소스

1

이 사건이 결코 일어나지 않을 확률이 0이기 때문에 말할 수 없기 때문에이 주장에 동의하지 않습니다. 이것은 좋은 추론이 아닙니다.

— Henry.L

2

문제는 근본적으로 중요합니다.

공동 관찰 / 데이터 / 쌍이 란 무엇입니까?

$T^+$

(따라서 비모수 테스트를 먼저 도입하여 @ Ming-Chih Kao의 답변이 적절하다고 생각하지 않습니다. 그러나 제목은 '순위 상관 계수의 맥락에서 데이터가 무엇입니까?'라는 제목이므로 구입하겠습니다.)

$Z_{i}=X_{i}-Y_{i}$

$(X_{i},Y_{i})$

$Z_{i}$

$|Z_{i}|$

$\{(1,-1) (1,-1)\},\{ (1,2) (1,2) (2,1) (2,1) (2,3) (2,3) (3,2) \},\{(3,0)\}$

이 작업을 수행하는 가장 쉬운 방법을 시도해 봅시다. 왼쪽에서 오른쪽으로 순위를 매기고

$R_{i}$

$|Z_{i}|$

$R_{i}$

$|Z_{i}|$

$R_{i}$

$|Z_{i}|=1$ $|Z_{i}|=2$

첫 번째 그룹의 각 관측치에 순위 할당합니다. $\frac{1+\cdots+7}{7}=4$ $\frac{8+9}{2}=8.5$

$R_{i}$

이렇게하면 순위가 수정되고 각 관측치가 순위 통계 계산에 동일한 영향을 미치므로 순위 테스트에 영향을 미칩니다.

공동 관측 / 데이터 / 쌍에 대한 솔루션은 무엇입니까?

(1) 평균 순위를 지정하십시오. 이것은 우리가 위에서 한 것입니다. 동일한 그룹의 묶인 데이터에 동일한 순위를 지정함으로써 순위 테스트에서 영향을 동일하게 적용하므로 묶인 관측으로 인한 가능한 부정확성을 제거합니다.

$MaxRank_{first group}<MinRank_{second group}$ $MaxRank_{first group}>MinRank_{second group}$ $MaxRank_{first group}=MinRank_{second group}$ 그런 다음 묶인 두 그룹을 하나로 병합해야합니다.

$\epsilon$

$P{X=x}=0$

— Henry.L
소스