각 데이터가 다른 측정 값 으로 구성된 일련의 데이터가 있습니다. 각 측정에 대해 벤치 마크 값이 있습니다. 각 데이터가 벤치 마크 값에 얼마나 가까운 지 알고 싶습니다.
가중 유클리드 거리를 다음과 같이 사용하려고 생각했습니다.
어디
는 특정 데이터에 대한 i 번째 측정 값입니다.
는 해당 측정 값에 해당하는 벤치 마크 값입니다.
는 다음에 따라 i 번째 측정 값에 첨부 할 가중치 사이의 값입니다.
및
그러나에 기본 이 문서, 내가 사용에 무게가 i 번째 측정의 분산의 역수 것을 알아 냈다. 이런 종류의 가중치가 각 측정에 첨부 할 중요성을 설명하지는 않습니다.
따라서:
관찰자의 측정 값의 상대적 중요성을 반영하는 일련의 가중치를 제시하는 방법이 있습니까? 아니면 관찰자가 가중치에 대한 임의의 값을 할당 할 수 있습니까?
이 문제를 해결하기 위해 가중 유클리드 거리를 사용하는 것이 적절합니까?