클러스터링 성능을 평가하려고합니다. 메트릭스 에 대한 skiscit-learn 문서를 읽고있었습니다 . ARI와 AMI의 차이점을 이해하지 못합니다. 그들은 두 가지 다른 방식으로 동일한 일을하는 것 같습니다.
문서에서 인용 :
기본 진리 클래스 할당 labels_true 및 동일한 샘플 labels_pred에 대한 클러스터링 알고리즘 할당에 대한 지식을 감안할 때 조정 된 랜드 인덱스 는 순열을 무시하고 확률 정규화를 사용하여 두 할당 의 유사성 을 측정 하는 함수입니다 .
vs
기본 정보 클래스 할당 labels_true 및 동일한 샘플 labels_pred의 클러스터링 알고리즘 할당에 대한 지식을 감안할 때 상호 정보 는 순열을 무시하고 두 할당 의 합의 를 측정 하는 함수입니다 ... AMI가 더 최근에 제안되어 정규화되었습니다. 기회.
클러스터링 평가에 두 가지를 모두 사용해야합니까, 아니면 중복입니까?
랜드 씨는 무작위가 아닙니다.
—
종료-익명-무스