리소스를보다 쉽게 찾을 수 있도록 내가하려는 일을 설명 할 수있는 좋은 용어를 찾고 있습니다.
따라서 두 개의 점 A와 B의 클러스터가 있는데, 각각 두 개의 값 X와 Y와 연관되어 있고 A와 B 사이의 "거리"를 측정하려고합니다. 즉, 동일한 분포에서 표본이 추출 될 가능성은 얼마나됩니까? (분포가 정상이라고 가정 할 수 있습니다). 예를 들어, X와 Y가 A에서는 상관되어 있지만 B에서는 상관되지 않으면 분포가 다릅니다.
직관적으로 A의 공분산 행렬을 구한 다음 B의 각 점이 거기에 적합 할 가능성을보고 그 반대도 가능합니다 (마할 라 노비스 거리와 같은 일부를 사용하는 경우).
그러나 이것은 약간 "임시"이며 아마도 이것을 설명하는 더 엄격한 방법이있을 것입니다 (물론 실제로 두 개 이상의 변수가있는 두 개 이상의 데이터 세트가 있습니다-내 데이터 세트를 식별하려고합니다 이상치입니다).
감사!
Dunno 왜,하지만 당신의 게시물을 읽을 때 Mantel 테스트가 내 눈앞에서 번쩍였다.
—
Roman Luštrik