팬더와 scikit learn을 사용하여 파이썬으로 kmeans 클러스터링을 코딩하고 싶습니다. 좋은 k를 선택하기 위해 Tibshirani와 al 2001 ( pdf ) 의 Gap Statistic을 코딩하고 싶습니다 .
scikit의 inertia_ 결과 를 사용 하고 모든 거리 계산을 다시 코딩하지 않고도 갭 통계 공식을 조정할 수 있는지 알고 싶습니다 .
scikit에 사용 된 관성 공식을 알고 있거나 높은 수준의 거리 함수를 사용하여 간격 통계를 쉽게 코딩하는 방법을 알고 있습니까?
나는이 질문에 CV에 대한 주제가되기에 충분한 통계적 내용이 있다고 생각하지만 상당히 정교한 프로그래밍 및 Python 지식도 필요하다는 점에 유의하십시오. 좋은 답변을 얻기가 어려울 수 있습니다. 의사 코드 도 요청하거나 기꺼이 해결하고 싶거 나이 질문을 두 부분으로 나눠야 할 수도 있습니다. 여기서는 통계 측면에 대해 1 개 , 파이썬 프로그래밍 측면에 대해 스택 오버플로 에 1 개를 나누어야합니다 . (아마도, 확실하지 않지만, 나는 단지 당신에게 공정한 경고를주고 싶습니다; 우리는 어떻게 진행되는지 볼 것입니다.)
—
gung-Reinstate Monica
이 질문은 "관성"이라는 용어를 정의해야합니다. 안에 동전 모양으로 보입니다
—
ttnphns
python
.