«k-nearest-neighbour» 태그된 질문

k- 최근 접 이웃 분류기이 분류기는 메모리 기반이며 모델을 맞출 필요가 없습니다. 쿼리 포인트 x0이 주어지면 x0에 가장 가까운 k 개의 트레이닝 포인트 x (r), r = 1, ..., k를 찾은 다음 k 개의 이웃 사이에 다 수표를 사용하여 분류합니다.


2
통계 학습의 요소에서 k- 최근 접 이웃 분류기의 결정 경계를 그리는 방법은 무엇입니까?
Trevor Hastie & Robert Tibshirani와 Jerome Friedman의 ElemStatLearn 책 "통계학 학습의 요소 : 데이터 마이닝, 추론 및 예측 2 판"에 설명 된 줄거리를 만들고 싶습니다. 줄거리는 다음과 같습니다 에서 정확한 그래프를 생성하는 방법이 궁금합니다 R. 특히 그리드 그래픽과 계산을 참고하여 경계를 표시하십시오.

1
lmer 모델의 효과 반복 계산
방금 혼합 효과 모델링을 통해 측정의 반복성 (일명 신뢰성, 일명 클래스 내 상관 관계)을 계산하는 방법을 설명하는 이 문서를 보았습니다. R 코드는 다음과 같습니다. #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

4
왜 누군가 회귀에 KNN을 사용합니까?
내가 이해 한 바에 따르면 훈련 데이터 간격 내에있는 회귀 함수 만 작성할 수 있습니다. 예를 들어 (패널 중 하나만 필요합니다) : KNN 회귀자를 사용하여 미래를 어떻게 예측할 수 있습니까? 다시 말하지만, 훈련 데이터의 간격 내에있는 함수에 근사한 것으로 보입니다. 내 질문 : KNN 회귀자를 사용하면 어떤 이점이 있습니까? 분류를위한 …

3
기계 학습 모델 결합
나는 데이터 마이닝 / 기계 학습 등을 처음 사용합니다. 예측을 개선하기 위해 여러 모델과 동일한 모델의 런을 결합하는 몇 가지 방법에 대해 읽었습니다. 몇 가지 논문 (이론과 그리스 문자는 흥미롭고 훌륭하지만 코드와 실제 예제는 짧음)을 읽은 것에 대한 나의 인상은 다음과 같이 가야한다는 것입니다. 모델 ( knn, RF등)을 가져 와서 …

2
"가장 가까운 이웃"은 오늘 언제 의미가 있습니까?
1999 년 Beyer et al. 물었다 가 "가장 가까운 이웃"의미가? 1999 년 이후 NN 검색에서 거리 편평의 영향을 분석하고 시각화하는 더 좋은 방법이 있습니까? [주어진] 데이터 세트가 1-NN 문제에 대한 의미있는 답변을 제공합니까? 10-NN 문제? 100-NN 문제? 오늘날 전문가들이이 질문에 어떻게 접근 하시겠습니까? 월요일 1 월 24 일 수정 : …

1
k-NN 계산 복잡성
순진한 검색 방법 (kd 트리 또는 이와 유사한 것 없음) 을 사용하는 k -NN 알고리즘 의 시간 복잡성은 무엇입니까 ? 하이퍼 파라미터 k 도 고려하여 시간 복잡성에 관심이 있습니다 . 나는 모순 된 답변을 찾았습니다. O (nd + kn), 여기서 n 은 학습 세트의 카디널리티이고 d 는 각 샘플의 차원입니다. …


3
KNN을위한 최적의 K 선택
KNN을위한 최적의 K를 선택하기 위해 5 중 CV를 수행했습니다. 그리고 K가 클수록 오류가 작아지는 것처럼 보입니다 ... 죄송합니다. 범례가 없지만 색상이 다르면 시련이 다릅니다. 총 5 개가 있으며 그 사이에 약간의 차이가있는 것 같습니다. K가 커지면 오류는 항상 감소하는 것 같습니다. 그렇다면 최고의 K를 어떻게 선택할 수 있습니까? K = …

2
KNN에서 데이터를 확장해야하는 이유
가장 가까운 이웃 K 개를 사용할 때 왜 데이터를 정규화해야하는지 설명해 주시겠습니까? 나는 이것을 찾으려고 노력했지만 여전히 그것을 이해할 수없는 것 같습니다. 다음 링크를 찾았습니다. https://discuss.analyticsvidhya.com/t/why-it-is-necessary-to-normalize-in-knn/2715 그러나이 설명에서 기능 중 하나의 더 큰 범위가 예측에 영향을 미치는 이유를 이해하지 못합니다.

1
차원 저주가 일부 모델보다 다른 모델에 영향을 줍니까?
치수 저주에 대해 읽은 장소는 주로 kNN 및 선형 모델과 관련하여 설명합니다. 나는 100k 데이터 포인트가 거의없는 데이터 세트의 수천 가지 기능을 사용하여 Kaggle에서 최고 순위를 정기적으로 봅니다. 그들은 주로 Boosted tree와 NN을 사용합니다. 많은 기능이 너무 높아 보이며 차원 저주의 영향을받는다고 생각합니다. 그러나 이러한 모델이 경쟁에서 최고가 되었기 때문에 …

5
KNN 대치 R 패키지
KNN 대치 패키지를 찾고 있습니다. 나는 대치 패키지 ( http://cran.r-project.org/web/packages/imputation/imputation.pdf )를보고 있었지만 어떤 이유로 든 KNN 대치 기능 (설명에서 예제를 따르더라도) 0 값을 대치하기 위해 (아래와 같이). 나는 둘러 보았지만 아직 무언가를 찾을 수 없으므로 좋은 KNN 대치 패키지에 대한 다른 제안이 있는지 궁금해하고 있습니까? 여 아래 코드에서-NA 값은 Knn …

4
kNN의 관계, 가중치 및 투표 처리
kNN 알고리즘을 프로그래밍 중이며 다음을 알고 싶습니다. 타이 브레이크 : 과반수 투표에서 확실한 승자가 없으면 어떻게됩니까? 예를 들어 k 개의 가장 가까운 이웃이 다른 클래스에서 왔거나 k = 4 인 경우 A 클래스에서 2 명의 이웃이 있고 B 클래스에서 2 명의 이웃이 있습니까? 거리가 같은 이웃이 더 많아서 정확히 k …

4
행 정규화의 목적은 무엇입니까
열 정규화의 이유는 동일한 척도로 측정되지 않더라도 피쳐에 동일한 가중치를 부여하기 때문에 이해하지만, 가장 가까운 이웃 문헌에서는 종종 열과 행이 정규화됩니다. 행 정규화 란 무엇입니까? 왜 행을 정규화합니까? 구체적으로, 행 정규화의 결과는 행 벡터 간의 유사성 / 거리에 어떻게 영향을 줍니까?

3
적응 형 커널 밀도 추정기?
누구나 적응 형 커널 밀도 추정기 사용 경험을보고 할 수 있습니까? (적응 형 | 가변 | 가변 폭, KDE | 히스토그램 | 보간 기 등의 동의어가 많이 있습니다.) 가변 커널 밀도 추정에 따르면 "샘플 공간의 다른 영역에서 커널의 너비를 변경합니다. 실제로는 두 가지 방법이 있습니다." multigrid ... 물론 단일 방법으로 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.