내 데이터 세트에 73 개의 샘플이있는 17 개의 숫자 및 5 개의 이진수 (0-1) 변수가 있습니다. 클러스터 분석을 실행해야합니다. Gower 거리는 변수가 혼합 된 데이터 세트에 대한 좋은 지표라는 것을 알고 있습니다. 그러나 Gower 거리가 이진 변수 간의 차이를 계산하는 방법을 이해할 수 없었습니다 . 유클리드 거리와 다르지 않은 것 같습니다.
귀하의 질문은 명확하지 않습니다. '고 우어 거리는 이진 변수의 차이를 어떻게 계산합니까?' "유클리드와 차이가 없다"는 것은 무엇을 의미합니까?
—
gung-모니 티 복원
감사합니다. 죄송합니다. Gower가 이진 변수의 차이를 어떻게 계산하는지 묻습니다. 나는 btw의 차이점을 이해할 수 없었습니다. 이진 변수에 대한 유클리드와 고어.
—
Emrah Bilgiç
이 사이트를 검색 했습니까
—
ttnphns
Gower
? stats.stackexchange.com/a/15313/3277
그래, 내가 했어. 두 샘플의 값이 모두 같으면 유클리드 거리는 0이고, 그렇지 않으면 1입니다. Gower는 어떻습니까?
—
Emrah Bilgiç
EmrahBilgiç @ Gower의 유사성 메트릭이다 하지 거리. 1에서 빼면 "거리"가됩니다. 위의 링크 아래에서 이진 데이터를 처리하는 방법을 읽습니다.
—
ttnphns