«distance» 태그된 질문

n 공간의 점 사이의 유클리드 거리와 같은 분포 또는 변수 간 거리 측정


3
두 주파수 분포 사이의 통계적 "거리"를 측정하는 방법은 무엇입니까?
연중 웹 사이트 사용 시간을 조사하는 데이터 분석 프로젝트를 수행하고 있습니다. 내가하고 싶은 것은 사용 패턴이 얼마나 "일관성"인지, 즉 일주일에 한 번 1 시간 동안 사용하는 패턴과 얼마나 가까운 지 비교하고, 한 번에 10 분 동안 사용하는 패턴과 얼마나 유사한 지 비교하는 것입니다. 주당 시간. 계산할 수있는 몇 가지 사항을 …

1
거리 상관의 직관적 특성이 있습니까?
나는 거리 계산에 의해 특징 지워지는 거리 상관 관계 에 대해 wikipedia 페이지를 쳐다보고 있다. 계산을 할 수는 있지만 거리 상관 측정 이 무엇인지, 계산이 왜 그렇게 보이는지 이해하기 어려워합니다. 측정 거리를 이해하는 데 도움이되는 거리 상관 관계에 대한 직관적 인 특징이 있습니까? 나는 직관 을 요구하는 것이 다소 모호하다는 …

5
거리 (유클리드)를 유사성 점수로 변환하는 방법
사용하여 스피커 음성을 클러스터링한다는 의미입니다. 발화를 클러스터 된 스피커 데이터와 비교하면 (유클리드 거리 기반) 평균 왜곡이 발생합니다. 이 거리는 범위에있을 수 있습니다 . 이 거리를 유사성 점수 로 변환하고 싶습니다 . 내가 어떻게 이것을 달성 할 수 있는지 안내해주세요.kkk[0,∞][0,∞][0,\infty][ 0 , 1 ][0,1][0,1]


4
이러한 상관 기반 거리에 대해 삼각형 부등식이 충족됩니까?
계층 적 클러스터링의 경우 두 개의 임의 변수 XXX 와 사이의 거리를 측정하기위한 다음 두 가지 "메트릭"(정확히 말하지는 않음)을 종종 볼 수 있습니다 YYY. 중 하나를 수행합니다. 하나는 삼각형 불평등을 충족 시키는가? 그렇다면 브 루트 포스 계산 이외의 다른 방법으로 어떻게 증명해야합니까? 측정 항목이 아닌 경우 간단한 카운터 예는 무엇입니까?\newcommand{\Cor}{\mathrm{Cor}} …

4
행 정규화의 목적은 무엇입니까
열 정규화의 이유는 동일한 척도로 측정되지 않더라도 피쳐에 동일한 가중치를 부여하기 때문에 이해하지만, 가장 가까운 이웃 문헌에서는 종종 열과 행이 정규화됩니다. 행 정규화 란 무엇입니까? 왜 행을 정규화합니까? 구체적으로, 행 정규화의 결과는 행 벡터 간의 유사성 / 거리에 어떻게 영향을 줍니까?

2
Gower 거리는 이진 변수의 차이를 어떻게 계산합니까?
내 데이터 세트에 73 개의 샘플이있는 17 개의 숫자 및 5 개의 이진수 (0-1) 변수가 있습니다. 클러스터 분석을 실행해야합니다. Gower 거리는 변수가 혼합 된 데이터 세트에 대한 좋은 지표라는 것을 알고 있습니다. 그러나 Gower 거리가 이진 변수 간의 차이를 계산하는 방법을 이해할 수 없었습니다 . 유클리드 거리와 다르지 않은 것 …

1
거리 차이의 통계적 유의성
2 차원 그리드에 3000 개가 넘는 벡터가 있고 대략 균일 한 이산 분포가 있습니다. 일부 벡터 쌍은 특정 조건을 충족합니다. 참고 : 조건은 개별 벡터가 아닌 벡터 쌍 에만 적용됩니다 . 약 1500 개 쌍의 목록이 있습니다. 그룹 1이라고합시다. 그룹 2는 다른 모든 벡터 쌍을 포함합니다. 그룹 1에서 한 쌍의 …

2
유한 가우시안 혼합물과 가우시안 사이의 거리는 얼마입니까?
알려진 가중치, 평균 및 표준 편차를 가진 유한하게 많은 가우시안이 혼합되어 있다고 가정합니다. 평균이 같지 않습니다. 물론 모멘트는 성분 모멘트의 가중 평균이므로 혼합물의 평균 및 표준 편차를 계산할 수 있습니다. 혼합물은 정규 분포가 아니지만 정상으로부터 얼마나 멀리 떨어져 있습니까? 위의 이미지는 표준 편차 (구성 요소)와 동일한 평균 및 분산을 가진 …

1
속성이 공칭 일 때 개인을위한 최적의 거리 기능은 무엇입니까?
명목 형 (정렬되지 않은 범주 형) 속성의 경우 개인간에 어떤 거리 기능을 사용해야하는지 모르겠습니다. 나는 교과서를 읽고 있었고 Simple Matching 기능 을 제안 했지만 일부 책은 공칭을 이진 속성으로 변경하고 Jaccard Coefficient 를 사용해야한다고 제안합니다 . 그러나 명목 속성의 값이 2가 아닌 경우 어떻게해야합니까? 해당 속성에 3-4 개의 값이 있으면 …

2
머서의 정리는 반대로 작동합니까?
동료는 기능이 우리의 목적은 블랙 박스입니다. 이 함수 는 두 객체 의 유사성 를 측정 합니다.s ( a , b )ssss(a,b)s(a,b)s(a,b) 우리는 에 다음과 같은 속성이 있음을 알고 있습니다.sss 유사성 점수는 0과 1 사이의 실수입니다. 자체적으로 동일한 객체의 점수는 1입니다. 따라서 의미 하며 그 반대도 마찬가지입니다.a = bs(a,b)=1s(a,b)=1s(a,b)=1a=ba=ba=b 우리는 보장되는 …

2
공분산 행렬을 만드는 변수 사이의 거리는 얼마입니까?
I는이 공분산 행렬와으로 분할 할 변수 사용하여 클러스터 계층 클러스터링 (공분산 행렬을 정렬하도록).n×nn×nn \times nkkk 변수 간 ​​(즉, 제곱 공분산 행렬의 열 / 행 사이) 일반적인 거리 함수가 있습니까? 또는 더 많은 것이 있으면 주제에 대한 좋은 참고 자료가 있습니까?

3
어느 거리를 사용해야합니까? 예 : 맨해튼, 유클리드, 브레이 커티스 등
저는 지역 사회 생태학자가 아니지만 요즘에는 지역 사회 생태 데이터를 연구하고 있습니다. 이 거리의 수학을 제외하고 내가 이해할 수 없었던 것은 사용할 각 거리의 기준과 적용 가능한 상황입니다. 예를 들어, 카운트 데이터와 함께 무엇을 사용해야합니까? 두 위치 사이의 경사각을 거리로 변환하는 방법은 무엇입니까? 아니면 두 곳의 기온이나 강우? 각 거리에 …

4
불규칙한 시계열에 대한 동적 시간 왜곡
최근에 DTW (Dynamic Time Warping)에 대해 많이 읽었습니다. DTW를 불규칙한 시계열에 적용하는 데 전혀 문헌이 없거나 적어도 그것을 찾을 수 없다는 것이 매우 놀랍습니다. 아무도 나에게 그 문제와 관련된 무언가에 대한 참조를 줄 수 있습니까? 아니면 심지어 그 구현 일 수도 있습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.