통계 및 빅 데이터 distance-functions

5

3 개의 prob 분포에 대한 Jensen-Shannon 분기 계산 : 괜찮습니까?

3 가지 분포를 따르는 젠슨-섀넌 분산을 계산하고 싶습니다. 아래 계산이 정확합니까? ( 위키피디아의 JSD 공식을 따랐 습니다 ) : P1 a:1/2 b:1/2 c:0 P2 a:0 b:1/10 c:9/10 P3 a:1/3 b:1/3 c:1/3 All distributions have equal weights, ie 1/3. JSD(P1, P2, P3) = H[(1/6, 1/6, 0) + (0, 1/30, 9/30) + …

12 distance-functions information-theory

5

최고의 거리 측정

문맥 비교할 두 데이터 세트가 있습니다. 두 세트의 각 데이터 요소는 22 개의 각도를 포함하는 벡터입니다 (모두 와 사이 ). 각도는 주어진 휴먼 포즈 구성과 관련이 있으므로 포즈는 22 개의 관절 각도로 정의됩니다.π−π−π-\piππ\pi 내가 궁극적으로하려는 것은 두 데이터 세트의 "친밀 성"을 결정하는 것입니다. 따라서 한 세트의 각 포즈 (22D 벡터)에 …

12 measurement distance-functions circular-statistics

1

속성이 공칭 일 때 개인을위한 최적의 거리 기능은 무엇입니까?

명목 형 (정렬되지 않은 범주 형) 속성의 경우 개인간에 어떤 거리 기능을 사용해야하는지 모르겠습니다. 나는 교과서를 읽고 있었고 Simple Matching 기능 을 제안 했지만 일부 책은 공칭을 이진 속성으로 변경하고 Jaccard Coefficient 를 사용해야한다고 제안합니다 . 그러나 명목 속성의 값이 2가 아닌 경우 어떻게해야합니까? 해당 속성에 3-4 개의 값이 있으면 …

12 distance-functions distance similarities association-measure categorical-data

2

공분산 행렬을 만드는 변수 사이의 거리는 얼마입니까?

I는이 공분산 행렬와으로 분할 할 변수 사용하여 클러스터 계층 클러스터링 (공분산 행렬을 정렬하도록).n×nn×nn \times nkkk 변수 간 (즉, 제곱 공분산 행렬의 열 / 행 사이) 일반적인 거리 함수가 있습니까? 또는 더 많은 것이 있으면 주제에 대한 좋은 참고 자료가 있습니까?

11 clustering covariance distance-functions distance

2

Mahalanobis 거리는 무엇이며 패턴 인식에 어떻게 사용됩니까?

누군가 Mahalanobis 거리의 개념을 설명해 줄 수 있습니까? 예를 들어, 두 점 x와 y 사이의 마할 라 노비스 거리는 무엇이며, 특히 패턴 인식을 위해 어떻게 해석됩니까?

11 machine-learning mathematical-statistics distance-functions

1

Beyer et al.의 상대 대비 정리입니까? 논문 :“고차원 공간에서 거리 측정법의 놀라운 행동”에 오해의 소지가 있습니까?

이것은 차원의 저주를 언급 할 때 자주 인용되며 (상대 대비라고하는 오른쪽 공식) 임디→ ∞var ( | | X디| |케이이자형[ | | 엑스디| |케이]) =0,다음:Dmaxk디−Dmin케이디디min케이디→ 0limd→∞var(||엑스디||케이이자형[||엑스디||케이])=0,그때:디최대디케이−디분디케이디분디케이→0 \lim_{d\rightarrow \infty} \text{var} \left(\frac{||X_d||_k}{E[||X_d||_k]} \right) = 0, \text{then}: \frac{D_{\max^{k}_{d}} - D_{\min^{k}_{d}}}{D_{\min^{k}_{d}}} \rightarrow 0 정리 결과는 주어진 쿼리 지점까지의 최대 거리와 최소 거리의 차이가 고차원 공간에서 …

10 machine-learning distance-functions high-dimensional

3

PCA를 통한 마할 라 노비스 거리

나는 행렬을 가지고 있는데, 여기서 는 유전자의 수이고 은 환자의 수입니다. 그러한 데이터로 작업 한 사람은 가 항상 보다 크다는 것을 알고 있습니다. 기능 선택을 사용하여 를 더 합리적인 수로 줄 였지만 는 여전히 보다 큽니다 .n × pn×pn\times p피pp엔nn피pp엔nn피pp피pp엔nn 나는 그들의 유전자 프로필을 기반으로 환자의 유사성을 계산하고 싶습니다; 유클리드 …

10 correlation pca genetics covariance distance-functions

1

관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?

4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

«distance-functions» 태그된 질문