«similarities» 태그된 질문

분포, 클러스터링, 데이터 세트 또는 기타 개체 간의 근접성 측정.

6
두 정규 분포의 겹치는 영역 백분율
및 정규 분포가 두 개인 경우 궁금합니다.σ1, μ1σ1, μ1\sigma_1,\ \mu_1σ2, μ2σ2, μ2\sigma_2, \ \mu_2 두 분포의 중첩 영역 백분율을 어떻게 계산할 수 있습니까? 이 문제에 특정 이름이 있다고 가정합니다.이 문제를 설명하는 특정 이름을 알고 있습니까? 이 구현 (예 : Java 코드)을 알고 있습니까?


1
다른 거리와 방법으로 얻은 계층 적 군집 덴드로 그램 비교
[초기 제목 "계층 적 클러스터링 트리의 유사성 측정"은 나중에 주제를 더 잘 반영하기 위해 @ttnphns에 의해 변경됨] 환자 기록의 데이터 프레임에서 여러 계층 적 클러스터 분석 을 수행하고 있습니다 (예 : http://www.biomedcentral.com/1471-2105/5/126/figure/F1?highres=y 와 유사 ) 나무의 최종 군집 / 구조 /보기 (dendrogram)에 미치는 영향을 이해하기 위해 다른 거리 측정, 다른 …

1
유사도 행렬을 (유클리드) 거리 행렬로 변환
랜덤 포레스트 알고리즘에서 Breiman (저자)은 다음과 같이 유사성 매트릭스를 구성합니다. 모든 학습 예제를 숲의 각 나무 아래로 보냅니다. 두 개의 예제가 동일한 리프에 도달하면 유사성 매트릭스의 해당 요소가 1 씩 증가합니다. 나무 수로 행렬 정규화 그는 말한다 : 케이스 n과 k 사이의 근접성은 행렬 {prox (n, k)}를 형성합니다. 그들의 정의에 …


5
코사인 상이 행렬을 계산하는 R 함수가 있습니까? [닫은]
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 작년에 문을 닫았 습니다 . 코사인 거리를 기반으로 행 클러스터링으로 히트 맵을 만들고 싶습니다. 나는 R을 사용 heatmap.2()하고 그림을 만들기 위해 사용하고 있습니다. 나는이 있다고 볼 수 dist있는 …


3
유클리드 거리 점수 및 유사성
나는 Toby Segaran의 Collective Intelligence 책을 사용하여 유클리드 거리 점수를 발견했습니다. 이 책에서 저자는 두 개의 추천 배열 사이의 유사성을 계산하는 방법 (예 : 줍니다.사람 × 영화 ↦ 점수 )person×movie↦score)\textrm{person} \times \textrm{movie} \mapsto \textrm{score}) 그는 의해 두 사람 및 의 유클리드 거리를 계산합니다.p 2 d ( p 1 , p …

4
행 정규화의 목적은 무엇입니까
열 정규화의 이유는 동일한 척도로 측정되지 않더라도 피쳐에 동일한 가중치를 부여하기 때문에 이해하지만, 가장 가까운 이웃 문헌에서는 종종 열과 행이 정규화됩니다. 행 정규화 란 무엇입니까? 왜 행을 정규화합니까? 구체적으로, 행 정규화의 결과는 행 벡터 간의 유사성 / 거리에 어떻게 영향을 줍니까?

3
두 데이터 세트 간의 유사성 정량화
요약 : 가장 좋은 방법을 찾으려고 시도하면 단일 값을 사용하여 정렬 된 두 데이터 집합 간의 유사성을 요약합니다. 세부 사항 : 내 질문은 다이어그램으로 가장 잘 설명됩니다. 아래 그래프는 값이 각각 nf및로 표시된 두 개의 서로 다른 데이터 세트를 보여줍니다 nr. x 축의 점은 측정이 수행 된 위치를 나타내며 y …

1
속성이 공칭 일 때 개인을위한 최적의 거리 기능은 무엇입니까?
명목 형 (정렬되지 않은 범주 형) 속성의 경우 개인간에 어떤 거리 기능을 사용해야하는지 모르겠습니다. 나는 교과서를 읽고 있었고 Simple Matching 기능 을 제안 했지만 일부 책은 공칭을 이진 속성으로 변경하고 Jaccard Coefficient 를 사용해야한다고 제안합니다 . 그러나 명목 속성의 값이 2가 아닌 경우 어떻게해야합니까? 해당 속성에 3-4 개의 값이 있으면 …

2
머서의 정리는 반대로 작동합니까?
동료는 기능이 우리의 목적은 블랙 박스입니다. 이 함수 는 두 객체 의 유사성 를 측정 합니다.s ( a , b )ssss(a,b)s(a,b)s(a,b) 우리는 에 다음과 같은 속성이 있음을 알고 있습니다.sss 유사성 점수는 0과 1 사이의 실수입니다. 자체적으로 동일한 객체의 점수는 1입니다. 따라서 의미 하며 그 반대도 마찬가지입니다.a = bs(a,b)=1s(a,b)=1s(a,b)=1a=ba=ba=b 우리는 보장되는 …

2
문자열 패턴 학습을위한 기계 학습 기술
다른 자체 정의 범주에 속하는 단어 목록이 있습니다. 각 범주에는 고유 한 패턴이 있습니다 (예를 들어, 하나는 특수 문자로 고정 길이를 가지며 다른 하나는이 범주에서 "단어"등으로 나타나는 문자가 존재 함). 예를 들면 다음과 같습니다. "ABC" -> type1 "ACC" -> type1 "a8 219" -> type2 "c 827" -> type2 "ASDF 123" …

1
ARIMA 모델의 관측치 48에서 혁신적인 특이 치를 어떻게 통합합니까?
데이터 세트를 작업 중입니다. 일부 모델 식별 기술을 사용한 후 ARIMA (0,2,1) 모델을 만들었습니다. R detectIO의 패키지 TSA에 있는 함수를 사용하여 48 번째 원본 데이터 세트에서 혁신적인 이상치 (IO) 를 감지했습니다 . 이 특이 치를 내 모델에 어떻게 통합하여 예측 목적으로 사용할 수 있습니까? R에서 예측할 수 없기 때문에 ARIMAX …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

3
시계열 간의 유사점을 찾는 방법은 무엇입니까?
다음 예제에서 나는 각 값 Temp이 날짜 DateTime와 깊이에 해당하는 바다의 5 깊이에서 기록 된 일련의 수온 측정으로 구성된 데이터 프레임을 가지고 있습니다 Depth. set.seed(1) Temp <- rnorm(43800,sd=20) AirT <- rnorm(8760,sd=20) Depth <- c(1:5) DateTime = seq(from=as.POSIXct("2010-01-01 00:00"), to=as.POSIXct("2010-12-31 23:00"), length=8760) Time <- as.POSIXct(DateTime, format = "%Y-%m-%d %H:%M") DatT <- …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.