«distance-functions» 태그된 질문

거리 함수는 집합 멤버 간 또는 객체 간 거리 개념을 수량화하는 데 사용되는 함수를 말합니다.

8
유클리드 거리가 높은 차원에서 좋은 지표가 아닌 이유는 무엇입니까?
나는 '유클리드 거리는 높은 차원에서 좋은 거리가 아닙니다'라고 읽었습니다. 이 진술은 차원의 저주와 관련이 있다고 생각하지만 정확히 무엇입니까? 게다가 '높은 차원'이란 무엇입니까? 100 가지 기능을 갖춘 유클리드 거리를 사용하여 계층 적 클러스터링을 적용했습니다. 이 측정 항목을 사용하는 것이 '안전'한 기능은 몇 개입니까?

6
클러스터링 방법 선택
유사한 사례를 그룹화하기 위해 데이터 세트에서 군집 분석을 사용하는 경우 다수의 군집 방법과 거리 측정 중에서 선택해야합니다. 때로는 하나의 선택이 다른 선택에 영향을 줄 수 있지만 여러 가지 가능한 방법 조합이 있습니다. 누구나 다양한 클러스터링 알고리즘 / 방법 및 거리 측정 방법 중에서 선택하는 방법에 대한 권장 사항이 있습니까? 변수의 …

6
k- 평균 군집 알고리즘이 유클리드 거리 측정법 만 사용하는 이유는 무엇입니까?
k- 평균 알고리즘이 거리 메트릭으로 코사인 (비 유사) 유사성을 사용하지 않고 유클리드 표준 만 사용할 수있는 효율성 또는 기능성 측면에서 특정 목적이 있습니까? 일반적으로 유클리드 이외의 다른 거리를 고려하거나 사용하는 경우 K- 평균 방법이 준수되고 정확합니까? [@ttnphns 추가. 문제는 두 가지입니다. "(비) 유클리드 거리"는 두 데이터 포인트 사이의 거리 또는 …

3
두 정규 분포의 랜덤 변수 사이의 유클리드 거리 분포는 무엇입니까?
정확한 위치를 알 수 없지만 알려진 모수를 갖는 정규 분포 (예 : 및 에 따라 분포 된 두 개의 객체가 있다고 가정합니다 . 위치가 좌표 에 대한 분포 (즉, 및 는 각각 및 대해 예상되는 좌표를 포함하는 벡터 의해 설명되도록 양쪽이 변량 법선이라고 가정 할 수 있습니다 . 또한 객체가 …



1
다른 거리와 방법으로 얻은 계층 적 군집 덴드로 그램 비교
[초기 제목 "계층 적 클러스터링 트리의 유사성 측정"은 나중에 주제를 더 잘 반영하기 위해 @ttnphns에 의해 변경됨] 환자 기록의 데이터 프레임에서 여러 계층 적 클러스터 분석 을 수행하고 있습니다 (예 : http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y 와 유사 ) 나무의 최종 군집 / 구조 /보기 (dendrogram)에 미치는 영향을 이해하기 위해 다른 거리 측정, 다른 …

5
두 개의 다변량 분포 사이의 "거리"측정
리소스를보다 쉽게 ​​찾을 수 있도록 내가하려는 일을 설명 할 수있는 좋은 용어를 찾고 있습니다. 따라서 두 개의 점 A와 B의 클러스터가 있는데, 각각 두 개의 값 X와 Y와 연관되어 있고 A와 B 사이의 "거리"를 측정하려고합니다. 즉, 동일한 분포에서 표본이 추출 될 가능성은 얼마나됩니까? (분포가 정상이라고 가정 할 수 있습니다). 예를 …


1
가중 유클리드 거리를 사용하는시기와 사용할 무게를 결정하는 방법
각 데이터가 nnn 다른 측정 값 으로 구성된 일련의 데이터가 있습니다. 각 측정에 대해 벤치 마크 값이 있습니다. 각 데이터가 벤치 마크 값에 얼마나 가까운 지 알고 싶습니다. 가중 유클리드 거리를 다음과 같이 사용하려고 생각했습니다. dx,b=(∑ni=1wi(xi−bi)2))1/2dx,b=(∑i=1nwi(xi−bi)2))1/2\hspace{0.5in} d_{x,b}=\left( \sum_{i=1}^{n}w_i(x_i-b_i)^2)\right)^{1/2} 어디 xixi\hspace{0.5in}x_i 는 특정 데이터에 대한 i 번째 측정 값입니다. bibi\hspace{0.5in}b_i 는 …

3
계층 적 군집화에서 Ward의 클러스터 간 연결과 함께 Manhattan 거리를 사용하는 것이 좋습니까?
시계열 데이터를 분석하기 위해 계층 적 클러스터링을 사용하고 있습니다. 내 코드는 Mathematica 함수를 사용하여 구현 DirectAgglomerate[...]되며 다음 입력이 주어지면 계층 적 클러스터를 생성합니다. 거리 행렬 D 클러스터 간 연결을 결정하는 데 사용되는 방법의 이름 맨해튼 거리를 사용하여 거리 행렬 D를 계산했습니다. d(x,y)=∑i|xi−yi|d(x,y)=∑i|xi−yi|d(x,y) = \sum_i|x_i - y_i| 여기서 및 n ≈ …


3
클러스터링에 대한
누구나 L 2 대신 L1L1L_1 또는 L.5L.5L_.5 메트릭을 클러스터링에 사용 합니까? Aggarwal et al., 고차원 공간에서의 거리 측정법의 놀라운 행동에 대해 (2001 년)L2L2L_2 높은 차원의 데이터 마이닝 응용 프로그램에 대해L1L1L_1유클리드 거리 측정법 보다 L 1 이 지속적으로 더 바람직 L2L2L_2합니다. 또는 이 아직 더 수 있다고 주장했습니다 .L.5L.5L_.5L.1L.1L_.1 또는 를 …

3
유클리드 거리 점수 및 유사성
나는 Toby Segaran의 Collective Intelligence 책을 사용하여 유클리드 거리 점수를 발견했습니다. 이 책에서 저자는 두 개의 추천 배열 사이의 유사성을 계산하는 방법 (예 : 줍니다.사람 × 영화 ↦ 점수 )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) 그는 의해 두 사람 및 의 유클리드 거리를 계산합니다.p 2 d ( p 1 , p …

1
R-자유도에서 PROC Mixed과 lme / lmer의 차이점
참고 :이 질문은 법적 이유로 인해 이전 질문을 삭제해야했기 때문에 다시 게시되었습니다. SAS의 PROC MIXED를 R lme의 nlme패키지 기능과 비교하는 동안 다소 혼란스러운 차이점을 발견했습니다. 구체적으로는, 다른 시험에서 자유도간에 상이 PROC MIXED하고 lme, 그리고 왜 생각해. 다음 데이터 세트에서 시작하십시오 (아래 제공된 R 코드). ind : 측정 대상을 나타내는 계수 …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.