«k-nearest-neighbour» 태그된 질문

k- 최근 접 이웃 분류기이 분류기는 메모리 기반이며 모델을 맞출 필요가 없습니다. 쿼리 포인트 x0이 주어지면 x0에 가장 가까운 k 개의 트레이닝 포인트 x (r), r = 1, ..., k를 찾은 다음 k 개의 이웃 사이에 다 수표를 사용하여 분류합니다.

3
단위 볼에서 N 샘플의 원점에 가장 가까운 중간 값에 대한 공식 설명
에서는 통계 학습 요소 , 문제는 고차원 공간에서 K-NN으로 하이라이트 문제로 도입된다. 거기 균일하게 분포되어 데이터 포인트 차원 부 공.P엔NN피pp 원점에서 가장 가까운 데이터 포인트까지의 중간 거리는 다음 식으로 제공됩니다. 디( p , N) = ( 1 − ( 12)1엔)1피d(p,N)=(1−(12)1N)1pd(p,N) = \left(1-\left(\frac{1}{2}\right)^\frac{1}{N}\right)^\frac{1}{p} 때 가장 가까운 지점으로 국경에 접근하는 방법, 볼의 …

1
커널 화 된 k 가장 가까운 이웃
나는 커널을 처음 사용하고 kNN을 커널 화하려고 시도하면서 걸림돌을 쳤다. 예비 다항식 커널을 사용하고 있습니다. 케이( x , y ) = ( 1 + ⟨ X , Y ⟩ )디K(x,y)=(1+⟨x,y⟩)dK(\mathbf{x},\mathbf{y}) = (1 + \langle \mathbf{x},\mathbf{y} \rangle)^d 일반적인 유클리드 kNN은 다음 거리 측정법을 사용합니다. 디( x , y ) = | …


1
Jeffries Matusita의 장점
내가 읽는 일부 논문에 따르면 Jeffries와 Matusita 거리가 일반적으로 사용됩니다. 그러나 아래 공식을 제외하고는 그것에 대한 많은 정보를 찾을 수 없었습니다. JMD (x, y) =∑(xi−−√2−yi−−√2)2−−−−−−−−−−−−−√2∑(xi2−yi2)22\sqrt[2]{\sum(\sqrt[2]{x_i}-\sqrt[2]{y_i})^2} 제곱근을 제외하고 유클리드 거리와 유사합니다. E (x, y) =∑(xi−yi)2−−−−−−−−−−√2∑(xi−yi)22\sqrt[2]{\sum(x_i-y_i)^2} JM 거리는 분류 측면에서 유클리드 거리보다 신뢰할 수 있다고 주장됩니다. 왜이 차이가 JM 거리를 향상시키는 지 …

4
차원의 저주 : kNN 분류기
Kevin Murphy의 저서 : Machine Learning-A Probabilistic Perspective를 읽고 있습니다. 첫 번째 장에서 저자는 차원의 저주를 설명하고 있으며 이해하지 못하는 부분이 있습니다. 예를 들어 저자는 다음과 같이 말합니다. 입력이 D 차원 단위 큐브를 따라 균일하게 분포되어 있다고 가정하십시오. 원하는 분수를 포함 할 때까지 x 주위에 하이퍼 큐브를 성장시켜 클래스 레이블의 …

1
k- 최근 접 이웃의 VC 치수
k가 사용 된 트레이닝 포인트의 수와 동일한 경우 k- 최근 접 이웃 알고리즘의 VC- 차원은 무엇입니까? 컨텍스트 : 이 질문은 제가 수강하는 과정에서 요청되었으며 거기에 주어진 답은 0입니다. 그러나 이것이 왜 그런지 이해하지 못합니다. 내 직감은 VC 차원이 1이어야한다는 것입니다. 모든 모델이 첫 번째 모델에 따라 한 클래스에 속하고 다른 …

1
자유로운 점심 정리와 K-NN 일관성
전산 학습에서 NFL 정리는 보편적 학습자가 없다고 말합니다. 모든 학습 알고리즘에 대해, 학습자 출력에 오류가 많고 확률이 높은 가설을 출력하는 분포가 있습니다 (오류 가설은 낮음). 결론은 학습하기 위해 가설 클래스 또는 분포를 제한해야한다는 것입니다. Devroye 등은 자신의 저서 "패턴 인식에 대한 확률론"에서 K- 최근 접 이웃 학습자들을위한 다음과 같은 정리를 …

2
연속 및 이진 변수가있는 K- 최근 접 이웃
열 a b c(3 속성) 이있는 데이터 세트가 있습니다 . a반면 숫자와 연속 b과 c두 가지 수준의 각 범주입니다. K-Nearest Neighbors 방법을 사용하여 분류 a하고 b있습니다 c. 따라서 거리를 측정 할 수 있으려면 및를 b추가 b.level1하고 추가하여 데이터 세트를 변환하십시오 b.level2. 관측치 i에 b범주 의 첫 번째 수준이있는 경우 b.level1[i]=1및 …

4
KNN이“모델 기반”이 아닌 이유는 무엇입니까?
ESL 2.4 장에서는 선형 회귀를 "모델 기반"으로 분류하는 것 같습니다.에프( x ) ≈ x ⋅ βf(x)≈x⋅βf(x) \approx x\cdot\betak- 최근 접 이웃에 대해서는 유사한 근사가 언급되지 않는다. 그러나 두 방법이 모두 가정하지는 않습니다.에프( x )f(x)f(x)? 나중에 2.4에서는 다음과 같이 말합니다. 최소 제곱은 에프( x )f(x)f(x) 전역 선형 함수에 의해 근사됩니다. k- …

4
10D MCMC 체인이 주어지면 R에서 사후 모드를 어떻게 확인할 수 있습니까?
질문 : 10 차원 MCMC 체인을 사용하여 10 개의 매개 변수 (열)에 의한 100,000 회 반복 (행), 사후 모드를 가장 잘 식별 할 수있는 방법은 무엇입니까? 특히 다중 모드에 관심이 있습니다. 배경:나는 계산에 정통한 통계학 자라고 생각하지만, 동료가이 질문을했을 때, 나는 합리적인 대답을 얻을 수 없다는 것이 부끄러웠다. 주요 관심사는 …

1
KNN에 어떤 유형의 데이터 정규화를 사용해야합니까?
정규화에는 두 가지 이상의 유형이 있다는 것을 알고 있습니다. 예를 들어 1- z- 점수 또는 t- 점수를 사용하여 데이터 변환. 이것을 보통 표준화라고합니다. 2- 0에서 1 사이의 값을 갖도록 데이터 크기 조정 정규화가 필요한 경우 이제 질문 KNN에 어떤 유형의 데이터 정규화를 사용해야합니까? 그리고 왜?
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.