에서 통계 과학 백과 I가 주어진 이해 이분법을 (이진수 1 = 본 0 = 부재)은 우리가 임의의 두 개체 비상 테이블 형성 할 수있다 (변수) 특성을 I 및 J 시료를 :
j
1 0
-------
1 | a | b |
i -------
0 | c | d |
-------
a = number of variables on which both objects i and j are 1
b = number of variables where object i is 1 and j is 0
c = number of variables where object i is 0 and j is 1
d = number of variables where both i and j are 0
a+b+c+d = p, the nubmer of variables.
이러한 값으로부터 모든 객체 쌍 사이의 유사성 계수, 특히 Jaccard 계수 와 Russell 및 Rao 계수 사이의 유사성 계수를 계산할 수 있습니다
이 계수를 계산하면 다른 값을 얻을 수 있지만 다른 것을 선택 해야하는 이유 를 설명하는 리소스를 찾을 수 없습니다 . 일부 데이터 세트의 경우 두 속성 ( ) 의 동시 부재가 정보를 전달하지 않기 때문입니까?