k-medoid 알고리즘의 출력이 k-means 알고리즘의 출력과 다른 예


11

k 메도 이드와 k 평균의 차이점을 이해합니다. 그러나 k 메 조이드 출력이 k 평균 출력과 다른 작은 데이터 세트를 예로 들어 보겠습니다.

답변:


14

k- 메도 이드는 제곱 거리를 최소화하는 대신 점과 선택한 중심 사이의 절대 거리를 최소화하여 계산하는 메도 이드 (데이터 세트에 속하는 점)를 기반으로합니다. 결과적으로 k- 평균보다 노이즈 및 이상치에 더 강합니다.

여기에 2 개의 군집이있는 단순하고 고안된 예가 있습니다 (반전 된 색상은 무시). Kmeans vs. Kmedoids

보시다시피, k- 평균의 메도 이드와 중심은 각 그룹에서 약간 다릅니다. 또한 임의의 시작점과 최소화 알고리즘의 특성으로 인해 이러한 알고리즘을 실행할 때마다 약간 다른 결과가 나타납니다. 또 다른 실행은 다음과 같습니다.

여기에 이미지 설명을 입력하십시오

그리고 여기 코드가 있습니다 :

library(cluster)
x <- rbind(matrix(rnorm(100, mean = 0.5, sd = 4.5), ncol = 2),
           matrix(rnorm(100, mean = 0.5, sd = 0.1), ncol = 2))
colnames(x) <- c("x", "y")

# using 2 clusters because we know the data comes from two groups cl <- kmeans(x, 2) kclus <- pam(x,2)
par(mfrow=c(1,2)) plot(x, col = kclus$clustering, main="Kmedoids Cluster") points(kclus$medoids, col = 1:3, pch = 10, cex = 4) plot(x, col = cl$cluster, main="Kmeans Cluster") points(cl$centers, col = 1:3, pch = 10, cex = 4)


1
@frc, 누군가의 대답이 잘못되었다고 생각되면 수정하지 마십시오. 의견을 남길 수 있습니다 (답장이> 50 인 경우) 및 / 또는 downvote. 최선의 선택은 올바른 정보라고 생각하는 것에 대한 답변을 게시하는 것입니다 (참조, 여기 )
gung-모니 티 복원

2
K- 메도 이드는 군집 요소와 메도 이드 사이에서 임의로 선택한 거리 (절대 절대 거리는 아님)를 최소화합니다. 실제로 pam위에서 사용 된 방법 (R에서 K-medoids의 구현 예)은 기본적으로 유클리드 거리를 메트릭으로 사용합니다. K- 평균은 항상 제곱 유클리드를 사용합니다. K- 메도 이드의 메도 이드는 전체 포인트 공간이 아닌 K-means의 중심으로 클러스터 요소에서 선택됩니다.
hannafrc

1
나는 언급할만한 평판이 충분하지 않지만 Ilanman의 답변 플롯에 실수가 있다고 언급하고 싶었습니다. 그는 데이터가 수정되도록 전체 코드를 실행했습니다. 코드의 클러스터링 부분 만 실행하면 클러스터는 상당히 안정적이며 k- 평균보다 PAM에 더 안정적입니다.
Julien Colomb

6

메도 이드는 세트의 구성원이어야하며 중심은 그렇지 않습니다.

중심은 일반적으로 단단하고 연속적인 물체와 관련하여 논의되지만, 이산 형 샘플로 확장하기 위해 중심이 원래 세트의 구성원이어야한다고 믿을 이유는 없습니다.


1

k- 평균 및 k- 메도 이드 알고리즘 모두 데이터 세트를 k 그룹으로 나눕니다. 또한 그들은 동일한 클러스터의 포인트와 해당 클러스터의 중심 인 특정 포인트 사이의 거리를 최소화하려고합니다. k-means 알고리즘과 달리 k-medoids 알고리즘은 점을 dastaset에 속하는 중심으로 선택합니다. k-medoids 클러스터링 알고리즘의 가장 일반적인 구현은 PAM (Partitioning Around Medoids) 알고리즘입니다. PAM 알고리즘은 탐욕스러운 검색을 사용하여 글로벌 최적 솔루션을 찾지 못할 수 있습니다. 메도 이드는 중심보다 특이 치에 더 강하지 만 높은 차원의 데이터에 대해서는 더 많은 계산이 필요합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.