지리적 위치 클러스터링에 대한 올바른 접근 방법 및 클러스터링 알고리즘은 무엇입니까?
다음 코드를 사용하여 지리적 위치 좌표를 클러스터링합니다.
import numpy as np
import matplotlib.pyplot as plt
from scipy.cluster.vq import kmeans2, whiten
coordinates= np.array([
[lat, long],
[lat, long],
...
[lat, long]
])
x, y = kmeans2(whiten(coordinates), 3, iter = 20)
plt.scatter(coordinates[:,0], coordinates[:,1], c=y);
plt.show()
Haversine 공식이 아닌 유클리드 거리를 사용하므로 지리적 위치 클러스터링에 K- 평균을 사용하는 것이 옳 습니까?