덴드로 그램 클러스터링에 대한 공동 현상 상관 관계


10

덴드로 그램 클러스터링의 컨텍스트를 고려하십시오. 우리가 부르 자 원래의 비 유사성에게 개인 사이의 거리를. 덴드로 그램을 구성한 후, 우리는 이 개인들이 속한 클러스터들 사이의 거리로서 두 개인들 사이 의 공 재적 비 유사성 을 정의합니다 .

일부 사람들은 원래의 비 유사성과 코페 네틱 비 유사성 ( 코페 네틱 상관 )이 상관 관계 가 분류의 "적합성 지수"라고 생각합니다. 이것은 나에게 완전히 수수께끼처럼 들린다. 본인의 이의 제기는 Pearson 상관 관계의 특정 선택에 의존하지 않지만, 원래의 비 유사성과 cophenetic의 비 유사성 사이의 관계가 분류의 적합성과 관련 될 수 있다는 일반적인 생각에 의존합니다.

당신은 저에게 동의합니까, 또는 덴드로 그램 분류에 대한 적합성 지수로서의 cophenetic 상관 관계 사용을지지하는 몇 가지 주장을 제시 할 수 있습니까?


(이해하기 쉬운)에 대한 이의 제기를 설명하지 않습니다 general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification. 분류는 원래의 비 유사성을 반영해야합니다. 이를 수행하는 덴드로 그램 분류의 기본 기능은 cophenetic 비 유사성입니다. 무엇이 있습니까? 잘못된?
ttnphns

1
그건 그렇고, 계층 적 (집단적) 클러스터링의 개념을 계층 적 (dendrogramic) 분류 와 혼합해서는 안됩니다 . 클러스터링은 프로세스 보고서 로 덴드로 그램을 생성합니다 . 계층 적 분류 결과 라고 주장하지 않습니다 .
ttnphns

1
Cophenetic 상관 관계는 "dogmatic"분류에 대해서만 제안되었습니다-분류 쌍별 비 유사성을 반영 해야하는 경우 , (Cophenetic) 상관 관계의 유용성 개념은 즉시 따릅니다.
ttnphns

2
당신은 cophenetic 상관 관계에 대한 이 논문 을 읽을 수 있습니다
ttnphns

3
@ StéphaneLaurent 귀하의 질문에 대한 답변으로 기여할 것이 없지만 대화를 읽고 있습니다. 당신이 말한 것은 나에게 불쾌하게 들리지 않았다. 또한 분류와 클러스터링의 차이점을 모른다고 말했지만 간단한 질문에 답하지 못했습니다. 사람들이 기계 학습과 비지도 학습이라고 부르는 것의 차이점입니다. 분류에서는 데이터의 모든 클래스 레이블을 알고 있으며 해당 정보를 사용하여 레이블이없는 향후 사례에 대한 분류 규칙을 구성합니다. 클러스터에는 라벨이 없습니다.
Michael R. Chernick

답변:


2

... 분류의 "적합성 지수"

나에게 그 의미가 옳지 않다. 내가 얻은 방식은

원래의 비 유사성과 코페 네틱 비 유사성 사이의 상관 관계 (코페 네틱 상관)

는 관측치 간의 계층 구조 , 즉 거리 의 측정 값입니다 . 즉, 다른 군집에서의 관측치와의 유사성은 바람직하게는 유사하다. 유클리드 거리와 완전한 연계를 사용하여 클러스터링 된 데이터 세트 A와 B를 고려할 때 ... 여기에 이미지 설명을 입력하십시오 ... cophenetic 거리 맵을 보거나 cophenetic 상관 관계를 계산하지 않아도 A의 cophenetic 상관 관계가 B의 관계보다 높다는 것을 알 수 있습니다 계층 구조에는 레벨이 있습니다. 따라서 CC는 동일한 수준 (클러스터)에서 관측까지의 거리가 비슷한 지 여부를 알려줍니다.

완전성을 위해 : cophenetic 상관 관계는 CC (A) = 0.936이고 CC (B) = 0.691입니다.


1
나는 이것에 대해 더 전문적이기를 바랍니다. 히트 맵이있는 예제를 따르지 않습니다. CC (A)> CC (B)를 분명히하는 것은 무엇입니까? 예를 들어, 상단 삼각형이 cophenetic 거리이고 하단 삼각형이 원래 거리 였고 둘 다 비슷한 패턴을 표시했다면 CC가 높을 것임을 인식 할 것입니다. . A가 자연스럽게 더 나은 클러스터링을 제공하고 결과적으로 CC가 일치하게되는 것입니까?
gung-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.