시계열 데이터를 분석하기 위해 계층 적 클러스터링을 사용하고 있습니다. 내 코드는 Mathematica 함수를 사용하여 구현 DirectAgglomerate[...]
되며 다음 입력이 주어지면 계층 적 클러스터를 생성합니다.
거리 행렬 D
클러스터 간 연결을 결정하는 데 사용되는 방법의 이름
맨해튼 거리를 사용하여 거리 행렬 D를 계산했습니다.
여기서 및 n ≈ 150 은 내 시계열의 데이터 포인트 수입니다.
제 질문은 Ward의 클러스터 간 연결을 Manhattan 거리 매트릭스와 함께 사용할 수 있습니까? 일부 자료에 따르면 Ward의 연계는 유클리드 거리에서만 사용해야합니다.
참고 DirectAgglomerate[...]
만 거리 행렬이 아닌 원래의 관측을 사용하여 워드의 연결을 계산합니다. 불행히도 Mathematica가 Ward의 원래 알고리즘을 어떻게 수정 했는지 는 확실하지 않습니다. 예를 들어, 단 변량 관측 값으로 구성된 벡터로 구성된 군집 의 경우, Ward는 제곱의 오차 합을 다음과 같이 공식화했습니다.
(예 : MATLAB과 R과 같은 다른 소프트웨어 툴은 또한 질문 티카 특정하지 않습니다 그래서 그냥 거리 행렬을 사용하여 워드의 클러스터링을 구현합니다.)