답변:
내가 아는 한 군집의 "평균"과 단일 군집의 중심은 같은 것이지만, 다변량 데이터를 처리 할 때 "중심"이라는 용어는 "평균"보다 약간 더 정확할 수 있습니다.
중심을 찾기 위해 각 차원에 대해 개별적으로 점 위치의 (산술) 평균을 계산합니다. 예를 들어 다음에 포인트가있는 경우
중심은 ((-1 + 0 + 1) / 3, (10 + 5 + 20) / 3, (3 + 2 + 10) / 3)에 위치하여 (0, 11 2/3, 5). (NB : 중심은 원래 데이터 포인트 중 하나 일 필요는 없으며 거의 없습니다)
중심은 물리적 해석 (점으로 정의 된 물체의 질량 중심)을 기준으로 질량 중심 또는 무게 중심이라고도합니다. 평균과 마찬가지로 중심 위치는 다른 점과의 거리 제곱을 최소화합니다.
관련 아이디어는 메도 이드 (medoid)인데 , 이는 다른 모든 데이터 포인트와 "가장 적은"데이터 포인트입니다. 중심과 달리, 메도 이드는 원래 점 중 하나 여야합니다. 또한 중앙값과 유사하지만 다변량 데이터 의 기하 중앙값에 관심이있을 수 있습니다 . 이것들은 모두 중심과 다릅니다.
위의 답변이 잘못되었을 수 있습니다.이 비디오를 참조하십시오 https://www.youtube.com/watch?v=VMyXc3SiEqs 평균은 군집 1과 군집 2의 요소 사이의 거리 조합을 합산합니다. 2 개의 거리를 더한 다음 n ^ 2로 평균으로 나눕니다.
Centroid 방법은 먼저 자체 클러스터 내 각 클러스터의 평균을 계산합니다. 그런 다음 평균점 사이의 거리를 계산합니다.