«distance-functions» 태그된 질문

거리 함수는 집합 멤버 간 또는 객체 간 거리 개념을 수량화하는 데 사용되는 함수를 말합니다.


5
최고의 거리 측정
문맥 비교할 두 데이터 세트가 있습니다. 두 세트의 각 데이터 요소는 22 개의 각도를 포함하는 벡터입니다 (모두 와 사이 ). 각도는 주어진 휴먼 포즈 구성과 관련이 있으므로 포즈는 22 개의 관절 각도로 정의됩니다.π−π−π-\piππ\pi 내가 궁극적으로하려는 것은 두 데이터 세트의 "친밀 성"을 결정하는 것입니다. 따라서 한 세트의 각 포즈 (22D 벡터)에 …

1
속성이 공칭 일 때 개인을위한 최적의 거리 기능은 무엇입니까?
명목 형 (정렬되지 않은 범주 형) 속성의 경우 개인간에 어떤 거리 기능을 사용해야하는지 모르겠습니다. 나는 교과서를 읽고 있었고 Simple Matching 기능 을 제안 했지만 일부 책은 공칭을 이진 속성으로 변경하고 Jaccard Coefficient 를 사용해야한다고 제안합니다 . 그러나 명목 속성의 값이 2가 아닌 경우 어떻게해야합니까? 해당 속성에 3-4 개의 값이 있으면 …

2
공분산 행렬을 만드는 변수 사이의 거리는 얼마입니까?
I는이 공분산 행렬와으로 분할 할 변수 사용하여 클러스터 계층 클러스터링 (공분산 행렬을 정렬하도록).n×nn×nn \times nkkk 변수 간 ​​(즉, 제곱 공분산 행렬의 열 / 행 사이) 일반적인 거리 함수가 있습니까? 또는 더 많은 것이 있으면 주제에 대한 좋은 참고 자료가 있습니까?


1
Beyer et al.의 상대 대비 정리입니까? 논문 :“고차원 공간에서 거리 측정법의 놀라운 행동”에 오해의 소지가 있습니까?
이것은 차원의 저주를 언급 할 때 자주 인용되며 (상대 대비라고하는 오른쪽 공식) 임디→ ∞var ( | | X디| |케이이자형[ | | 엑스디| |케이]) =0,다음:Dmaxk디−Dmin케이디디min케이디→ 0limd→∞var(||엑스디||케이이자형[||엑스디||케이])=0,그때:디최대디케이−디분디케이디분디케이→0 \lim_{d\rightarrow \infty} \text{var} \left(\frac{||X_d||_k}{E[||X_d||_k]} \right) = 0, \text{then}: \frac{D_{\max^{k}_{d}} - D_{\min^{k}_{d}}}{D_{\min^{k}_{d}}} \rightarrow 0 정리 결과는 주어진 쿼리 지점까지의 최대 거리와 최소 거리의 차이가 고차원 공간에서 …

3
PCA를 통한 마할 라 노비스 거리
나는 행렬을 가지고 있는데, 여기서 는 유전자의 수이고 은 환자의 수입니다. 그러한 데이터로 작업 한 사람은 가 항상 보다 크다는 것을 알고 있습니다. 기능 선택을 사용하여 를 더 합리적인 수로 줄 였지만 는 여전히 보다 큽니다 .n × pn×pn\times p피pp엔nn피pp엔nn피pp피pp엔nn 나는 그들의 유전자 프로필을 기반으로 환자의 유사성을 계산하고 싶습니다; 유클리드 …

1
관찰 된 이벤트와 예상 된 이벤트를 비교하는 방법은 무엇입니까?
4 가지 가능한 이벤트의 주파수 샘플이 하나 있다고 가정합니다. Event1 - 5 E2 - 1 E3 - 0 E4 - 12 내 이벤트의 예상 확률이 있습니다. p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 내 네 가지 사건의 관측 빈도의 합으로 (18) 사건의 예상 빈도를 올바르게 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.