클러스터링 문제를 해결하기 위해 Bayes를 사용하고 있습니다. 몇 가지 계산을 한 후 두 확률의 비율을 구해야합니다.
를 얻을 수 있습니다 . 이 확률은 이 답변 에서 설명한 것처럼 두 개의 다른 2D 다변량 KDE를 통합하여 얻습니다 .
P ( B ) = ∬ X , Y : g ( X , Y ) < g ( R에 B , S , B ) g ( X , Y )
여기서, F ( X , Y ) 와 g ( X , Y )는 KDEs하고 통합이 임계 값 이하의 모든 점을 수행 F하면 ( r에 을 , 이야 ) 및 g ( R에 B , S , B를 ) . 두 KDE 모두 가우시안 커널을 사용합니다 . 내가 작업하고있는 것과 비슷한 KDE의 대표적인 이미지는 여기에서 볼 수 있습니다 : 2D에 커널 밀도 추정기 통합 .
stats.gaussian_kdepython
함수 를 사용하여 KDE를 계산 하므로 다음과 같은 일반적인 형식을 가정합니다.
여기서 n
내 배열의 길이는 h
사용 된 대역폭입니다.
위의 적분은 계산 비용이 많이 드는 Monte Carlo 프로세스를 적용하여 계산됩니다. 나는 이런 경우 확률의 비율을 임계점에서 평가 된 PDF (KDE)의 비율로 대체하여 동일한 결과를 얻을 수 있다는 것을 읽었습니다. KDE 비율을 계산하는 것이 MC와의 적분 비율을 계산하는 것보다 훨씬 빠르기 때문에 이것에 관심이 있습니다.
따라서 질문은이 표현의 유효성으로 축소됩니다.
어떤 상황에서이 관계가 사실이라고 말할 수 있습니까?
[고정 된 오타 (EDIT)]
추가 :
여기 기본적으로 더 만들어 같은 질문하지만 수학적 형태.
P(X)
계산하지 않으려는 값을 알고 있어야합니다 . 해당 매개 변수의 관련성을 약간 확장 할 수 있습니까?