커널 밀도 추정을 수행 할 때 Epanechnikov 커널이 이론적으로 적어도 최적이라는 것을 읽었습니다 (예 : here ). 이것이 사실이라면 왜 가우시안이 밀도 추정 라이브러리에서 기본 커널 또는 많은 경우 유일한 커널처럼 자주 표시됩니까?
커널 밀도 추정을 수행 할 때 Epanechnikov 커널이 이론적으로 적어도 최적이라는 것을 읽었습니다 (예 : here ). 이것이 사실이라면 왜 가우시안이 밀도 추정 라이브러리에서 기본 커널 또는 많은 경우 유일한 커널처럼 자주 표시됩니까?
답변:
Epanechnikov 커널이 이론적으로 최적으로 사용되지 않는 이유는 Epanechnikov 커널이 이론적으로 최적이 아니기 때문일 수 있습니다 . Tsybakov는 Epanechnikov 커널이 16-19 페이지의 비모수 적 추정 소개 (섹션 1.2.4) 에서 "이론적으로 최적"이라는 주장을 명백히 비판합니다 .
커널 에 대한 몇 가지 가정과 고정 밀도 를 요약하려고 하면 평균 적분 제곱 오차의 형태는 다음과 같습니다.
Tsybakov의 주된 비판은 음이 아닌 커널에 대해 최소화하는 것 같습니다. 음이 아닌 커널로 제한하지 않고 음이 아닌 더 나은 성능의 추정기를 얻을 수 있기 때문입니다.
Epanechnikov 커널에 대한 논쟁의 첫 번째 단계는 h에 대해 을 최소화하고 ( 더 넓은 클래스의 모든 커널이 아닌) 음이 아닌 모든 커널을 최소화 하여 K에 대한 "최적의"대역폭을 얻는 것으로 시작합니다
"최적의"커널 (Epanechnikov)
평균 적분 제곱 오차는 다음과 같습니다.
그러나 이것은 알 수없는 밀도 p 에 대한 지식 ( )에 의존하기 때문에 실행 가능한 선택이 아닙니다. 따라서 "oracle"수량입니다.
Tsybakov가 제안한 제안은 Epanechnikov 오라클에 대한 점근 적 MISE는 다음과 같습니다.
Tsybakov (2)는 종종 하나 (이 순서 2의 핵을 사용할 수있는 가장 달성 미장센 주장하지만, 다음 방송하고 있다고 모든 위해) 커널 추정기를 구성하기 ,되도록
비록 P N 번 계속 양극 부 추정기에 대한 동일한 결과 반드시 음수 가지고 있지 않은 P + N : = 최대 ( 0 , P는 N ) 경우에도 음이 아닌 것이 보장된다 ( K 아닙니다) :
따라서 충분히 작 으면 Epanechnikov oracle 보다 점근선이 작은 MISE를 갖는 실제 추정기 가 존재하며 , 심지어 알려지지 않은 밀도 p 에 대해 동일한 가정을 사용합니다 .
특히, 모든 커널 추정기 (또는 커널 추정기의 양의 부분)에 대한 고정 된 대한 점근 적 MISE의 부정확 한 값 은 입니다. 따라서 Epanechnikov 오라클은 실제 견적 자와 비교할 때조차도 최적에 가깝지 않습니다.
사람들이 Epanechnikov 오라클에 대한 주장을 처음으로 발전시킨 이유는 밀도 자체가 음이 아니기 때문에 커널 자체가 음이 아니어야한다고 주장하기 때문입니다. 그러나 Tsybakov가 지적했듯이, 음이 아닌 밀도 추정기를 얻기 위해 커널이 음이 아닌 것으로 가정 할 필요는 없으며 다른 커널을 허용하면 음이 아닌 밀도 추정기가 가능합니다 (1) oracles가 아닙니다. (2) 고정 된 대해 Epanechnikov 오라클보다 임의로 더 잘 수행 합니다. Tsybakov는이 불일치를 사용하여 고정 측면에서 최적 성을 주장하는 것이 타당하지 않지만 클래스 전체에서 균일 한 최적 특성만을 주장하는 것이 합리적이라고 주장합니다.밀도의. 그는 또한 MISE 대신 MSE를 사용할 때이 주장이 여전히 효과가 있다고 지적했다.
편집 : Corollary 1.1도 참조하십시오. p.25에서 Epanechnikov 커널이 다른 기준에 따라 허용되지 않는 것으로 나타났습니다. Tsybakov는 실제로 Epanechnikov 커널을 좋아하지 않는 것 같습니다.
가우스 커널은 예를 들어 도함수를 통한 밀도 추정에 사용됩니다.
This is because the Epanechnikov kernel has 3 derivatives before it's identically zero, unlike the Gaussian which has infinitely many (nonzero) derivatives. See section 2.10 in your link for more examples.
kdensity
.