Gower 거리는 이진 변수의 차이를 어떻게 계산합니까?


13

내 데이터 세트에 73 개의 샘플이있는 17 개의 숫자 및 5 개의 이진수 (0-1) 변수가 있습니다. 클러스터 분석을 실행해야합니다. Gower 거리는 변수가 혼합 된 데이터 세트에 대한 좋은 지표라는 것을 알고 있습니다. 그러나 Gower 거리가 이진 변수 간의 차이를 계산하는 방법을 이해할 수 없었습니다 . 유클리드 거리와 다르지 않은 것 같습니다.


귀하의 질문은 명확하지 않습니다. '고 우어 거리는 이진 변수의 차이를 어떻게 계산합니까?' "유클리드와 차이가 없다"는 것은 무엇을 의미합니까?
gung-모니 티 복원

1
감사합니다. 죄송합니다. Gower가 이진 변수의 차이를 어떻게 계산하는지 묻습니다. 나는 btw의 차이점을 이해할 수 없었습니다. 이진 변수에 대한 유클리드와 고어.
Emrah Bilgiç

이 사이트를 검색 했습니까 Gower? stats.stackexchange.com/a/15313/3277
ttnphns

그래, 내가 했어. 두 샘플의 값이 모두 같으면 유클리드 거리는 0이고, 그렇지 않으면 1입니다. Gower는 어떻습니까?
Emrah Bilgiç

4
EmrahBilgiç @ Gower의 유사성 메트릭이다 하지 거리. 1에서 빼면 "거리"가됩니다. 위의 링크 아래에서 이진 데이터를 처리하는 방법을 읽습니다.
ttnphns

답변:


5

"male"과 "female"의 값이 "m"과 "f"인 이진 속성은 어떻습니까?

당신은 당신이 얻을 수있는 모든 이성 변수에 대해 "동일"또는 "다른"이라는 것을 알고 있습니까? 값이 1 또는 0 인 경우 거리 간의 요점 차이는 없습니다. 그러나 여러 변수가 어떻게 결합되는지.


3

Gower distance는 Manhattan을 사용하여 연속 데이터 포인트 간 거리를 계산하고 Dice는 범주 형 데이터 포인트 간 거리를 계산합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.