비대칭 거리 측정으로 클러스터링


9

비대칭 거리 측정으로 피쳐를 어떻게 클러스터링합니까?

예를 들어 요일이있는 데이터 집합을 기능으로 클러스터링한다고 가정합니다. 월요일부터 금요일까지의 거리는 금요일부터 월요일까지의 거리와 다릅니다.

이것을 클러스터링 알고리즘의 거리 측정에 어떻게 통합합니까?

답변:


3

미래가 과거와 다르기 때문에 MF 거리가 비대칭이면 진정한 비대칭 클러스터링이 필요합니다. 먼저 비대칭 거리 기능을 정의해야합니다.

거리 함수가 주어지면 비대칭 클러스터링을 수행하는 한 가지 방법은 원래 데이터를 새로운 좌표 공간에 포함시키는 것입니다. Naohito Chino와 Kenichi Shiraiwa, Behaviormetrika, 1992의 "비대칭 MDS에 대한 일부 비거리 모델의 기하학적 구조"( pdf )를 참조하십시오. 이것을 HCM (Hermitian Canonical Model)이라고합니다.

허미 시안 행렬 를 . 여기서 고유 값과 고유 벡터를 찾은 다음 해당 고유 값의 제곱근으로 각 고유 벡터의 크기를 조정합니다.H

Hij=12[d(xi,xj)+d(xj,xi)]+i12[d(xi,xj)d(xj,xi)]

이것은 데이터를 복잡한 숫자의 공간으로 변환합니다. 데이터가 삽입되면 객체 x와 y 사이의 거리는 단지 x * y입니다. 여기서 *는 켤레 전치입니다. 이 시점에서 복소수 벡터에서 k- 평균을 실행할 수 있습니다.

스펙트럼 비대칭 클러스터링도 수행되었습니다. Stefan Emilov Atev의 논문, 2011 년 미네소타 대학교의 궤적 스펙트럼 클러스터링에 비대칭 사용 (Asymmetry 사용), 특수 알고리즘에 대한 MATLAB 코드를 제공합니다.


1

산술 평균 또는 확률 분포의 경우 Jensen–Shannon 분기의 제곱근과 같은 일종의 평균을 사용할 수 있습니다.


1

순환 통계를 살펴 봐야합니다 (일주일 내내 "작업"하려는 경우)


1

거리 함수가 유효한 Mercer 커널이 아닌 경우 . 여기서 는 그램 행렬입니다. 이 경우 이중 클러스터링이라고도하는 공동 클러스터링을 원합니다. 이 클래스의 알고리즘은 행과 열에 대해 동시에 클러스터 표시기를 생성합니다.XXTX

제시 한 예는 거리 측정법을 잘못 선택한 결과입니다. 더 나은 거리 측정 항목은|days apart|

일반적으로 거리 기능은 유효한 Mercer 커널이어야합니다. 유효한 Mercer 커널은 연속적이고 대칭이며 양의 공분산 행렬 갖는 두 개의 관측 값을 취하는 함수 입니다.xD

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.