답변:
이러한 매개 변수를 선택하는 방법을 제안하는 많은 출판물이 있습니다.
가장 주목할만한 것은 OPTICS이며, epsilon 매개 변수를 없애는 DBSCAN 변형입니다. 그것은 대략 "모든 가능한 엡실론으로 DBSCAN을 실행하는"것으로 볼 수있는 계층 적 결과를 생성합니다.
minPts, 나는 할 제안 하지 자동 방법에 의존하지만에 도메인 지식 .
좋은 클러스터링 알고리즘 에는 필요에 따라 사용자 정의 할 수있는 매개 변수가 있습니다.
간과 한 파라미터는 거리 기능입니다. DBSCAN을 위해 가장 먼저해야 할 일은 어플리케이션에 적합한 거리 기능을 찾는 것 입니다. 유클리드 거리가 모든 응용 분야에서 최고가되는 것에 의존하지 마십시오!
k
를 들어 가장 가까운 이웃 분류 와 동일하다고 생각할 때 minPts 매개 변수에 대해 동일하게 말할 수 있습니다. 주된 차이점은 거리에 대해 "종종"합리적인 수준이 있다는 것입니다. 유클리드 거리; minPts의 경우 값은 데이터에 따라 다릅니다.