«metric» 태그된 질문

메트릭은 세트의 두 요소 사이의 거리를 출력하고 특정 엄격한 기준을 충족하는 함수입니다 (일부 '거리'함수는 메트릭이 아님).

8
유클리드 거리가 높은 차원에서 좋은 지표가 아닌 이유는 무엇입니까?
나는 '유클리드 거리는 높은 차원에서 좋은 거리가 아닙니다'라고 읽었습니다. 이 진술은 차원의 저주와 관련이 있다고 생각하지만 정확히 무엇입니까? 게다가 '높은 차원'이란 무엇입니까? 100 가지 기능을 갖춘 유클리드 거리를 사용하여 계층 적 클러스터링을 적용했습니다. 이 측정 항목을 사용하는 것이 '안전'한 기능은 몇 개입니까?

6
두 정규 분포의 겹치는 영역 백분율
및 정규 분포가 두 개인 경우 궁금합니다.σ1, μ1σ1, μ1\sigma_1,\ \mu_1σ2, μ2σ2, μ2\sigma_2, \ \mu_2 두 분포의 중첩 영역 백분율을 어떻게 계산할 수 있습니까? 이 문제에 특정 이름이 있다고 가정합니다.이 문제를 설명하는 특정 이름을 알고 있습니까? 이 구현 (예 : Java 코드)을 알고 있습니까?

4
분류의 리콜 및 정밀도
정보 검색의 맥락에서 볼 때마다 리콜과 정밀도에 대한 정의를 읽었습니다. 누군가가 분류 맥락에서 이것을 조금 더 설명하고 몇 가지 예를 설명 할 수 있는지 궁금합니다. 예를 들어 60 %의 정밀도와 95 %의 리콜을 제공하는 이진 분류 기가 있는데, 이것이 좋은 분류기입니까? 어쩌면 내 목표를 좀 더 돕기 위해 가장 좋은 …

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
Kullback-Leibler 분기와 비교하여 Wasserstein 지표의 장점은 무엇입니까?
Wasserstein 메트릭 과 Kullback-Leibler 발산 의 실제 차이점은 무엇입니까 ? Wasserstein 미터법은 Earth mover 's distance 라고도합니다 . Wikipedia에서 : Wasserstein (또는 Vaserstein) 메트릭은 주어진 메트릭 공간 M의 확률 분포 사이에 정의 된 거리 함수입니다. 과 Kullback–Leibler 분기는 하나의 확률 분포가 두 번째 예상 확률 분포와 어떻게 다른지 측정합니다. KL이 …

5
랜덤 포레스트에서 오 분류 비용을 제어하는 ​​방법은 무엇입니까?
R 패키지 randomForest 에서 오 분류 비용을 제어 할 수 있습니까? 내 자신의 연구에서 허위 부정 (예를 들어, 사람이 질병을 앓고있을 수있는 오류가 없음)은 허위 양성보다 훨씬 비쌉니다. 패키지 부품 은 사용자가 잘못 분류 된 가중치를 다르게하는 손실 매트릭스를 지정함으로써 잘못된 분류 비용을 제어 할 수 있도록합니다. 비슷한 것이 randomForest있습니까? …

2
클러스터링 비교 : 랜드 인덱스와 정보의 변형
클러스터링을 비교하기 위해 정보 의 변화 와 랜드 인덱스 의 차이에 대한 통찰력이나 직관이있는 사람이 있는지 궁금 합니다. Marina Melia (Journal of Multivariate Analysis, 2007)의 " 클러스터링 비교-정보 기반 거리 " 라는 논문을 읽었 지만 정의의 차이를 알아 차리는 것 외에는 정보의 변화가 무엇인지 이해하지 못합니다. 랜드 인덱스가 캡처하지 않음을 …




4
이러한 상관 기반 거리에 대해 삼각형 부등식이 충족됩니까?
계층 적 클러스터링의 경우 두 개의 임의 변수 XXX 와 사이의 거리를 측정하기위한 다음 두 가지 "메트릭"(정확히 말하지는 않음)을 종종 볼 수 있습니다 YYY. 중 하나를 수행합니다. 하나는 삼각형 불평등을 충족 시키는가? 그렇다면 브 루트 포스 계산 이외의 다른 방법으로 어떻게 증명해야합니까? 측정 항목이 아닌 경우 간단한 카운터 예는 무엇입니까?\newcommand{\Cor}{\mathrm{Cor}} …

2
공분산 행렬에 대한 메트릭 : 단점 및 장점
공분산 행렬에 대한 "최상의"메트릭은 무엇이며 그 이유는 무엇입니까? Frobenius & c가 적절하지 않으며 각도 매개 변수화에도 문제가 있음이 분명합니다. 직관적 으로이 두 가지 사이의 타협을 원할 수도 있지만 명심해야 할 다른 측면과 잘 확립 된 표준이 있는지 알고 싶습니다. 공통 메트릭에는 공분산 행렬이 자연스럽지 않기 때문에 여러 가지 단점이 있습니다. …

1
Scikit Learn의 군집 관성 수식
팬더와 scikit learn을 사용하여 파이썬으로 kmeans 클러스터링을 코딩하고 싶습니다. 좋은 k를 선택하기 위해 Tibshirani와 al 2001 ( pdf ) 의 Gap Statistic을 코딩하고 싶습니다 . scikit의 inertia_ 결과 를 사용 하고 모든 거리 계산을 다시 코딩하지 않고도 갭 통계 공식을 조정할 수 있는지 알고 싶습니다 . scikit에 사용 된 관성 …

2
계층 적 군집이 유효하기 위해서는 거리가 "메트릭"이어야합니까?
N 개의 항목 사이 의 거리 ( 메트릭 이 아님)를 정의한다고 가정하겠습니다 . 이 거리를 바탕으로 우리는 집단 계층 적 군집 을 사용 합니다 . 의미있는 결과를 얻기 위해 알려진 각 알고리즘 (단일 / 최대 / 평균 연결 등)을 사용할 수 있습니까? 다르게 말하면, 거리가 미터가 아닌 경우이를 사용하는 데 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.