확률과 PDF의 비율


12

클러스터링 문제를 해결하기 위해 Bayes를 사용하고 있습니다. 몇 가지 계산을 한 후 두 확률의 비율을 구해야합니다.

P(A)/P(B)

를 얻을 수 있습니다 . 이 확률은 이 답변 에서 설명한 것처럼 두 개의 다른 2D 다변량 KDE를 통합하여 얻습니다 .P(H|D)

P ( B ) = X , Y : g ( X , Y ) < g ( R에 B , S , B ) g ( X , Y )

P(A)=x,y:f^(x,y)<f^(ra,sa)f^(x,y)dxdy
P(B)=x,y:g^(x,y)<g^(rb,sb)g^(x,y)dxdy

여기서, F ( X , Y )g ( X , Y )는 KDEs하고 통합이 임계 값 이하의 모든 점을 수행 F하면 ( r에 , 이야 )g ( R에 B , S , B를 ) . 두 KDE 모두 가우시안 커널을 사용합니다 . 내가 작업하고있는 것과 비슷한 KDE의 대표적인 이미지는 여기에서 볼 수 있습니다 : 2D에 커널 밀도 추정기 통합 .f^(x,y)g^(x,y)f^(ra,sa)g^(rb,sb)

stats.gaussian_kdepython 함수 를 사용하여 KDE를 계산 하므로 다음과 같은 일반적인 형식을 가정합니다.

KDE(x,y)=1ni=1n12h2e(xxi)2+(yyi)22h2

여기서 n내 배열의 길이는 h사용 된 대역폭입니다.

위의 적분은 계산 비용이 많이 드는 Monte Carlo 프로세스를 적용하여 계산됩니다. 나는 이런 경우 확률의 비율을 임계점에서 평가 된 PDF (KDE)의 비율로 대체하여 동일한 결과를 얻을 수 있다는 것을 읽었습니다. KDE 비율을 계산하는 것이 MC와의 적분 비율을 계산하는 것보다 훨씬 빠르기 때문에 이것에 관심이 있습니다.

따라서 질문은이 표현의 유효성으로 축소됩니다.

P(A)P(B)=f^(ra,sa)g^(rb,sb)

어떤 상황에서이 관계가 사실이라고 말할 수 있습니까?

[고정 된 오타 (EDIT)]


추가 :

여기 기본적으로 더 만들어 같은 질문하지만 수학적 형태.


1
ra,b,sa,b

1
나는 Mills Ratio 이 관련이 있다고 생각 합니다.
whuber

@ whuber의 비율은 분명히 내가 P(X)계산하지 않으려는 값을 알고 있어야합니다 . 해당 매개 변수의 관련성을 약간 확장 할 수 있습니까?
Gabriel

답변:


3

KDE는 정규 분포의 혼합입니다. 그것들 중 하나를 봅시다.

P(A)P(B)f

f(x,y)f(r,s)

에 해당

x2+y2r2+s2.

ρ,θ

P(r,s)=12π02πr2+s2ρexp(ρ2/2)dρdθ=exp((r2+s2)/2)=2πf(r,s).

이제 혼합물을 고려하십시오. 선형이기 때문에

P(r,s)=1ni2πf((rxi)/h,(syi)/h)=2πh2(1ni1h2f((rxi)/h,(syi)/h))=2πh2KDE(r,s).

fP2πh2


Pff1A1f2A2A1μ>1f=f1/2+f2/21/2A11/(2μ)A2

  1. (r,s)A1f(r,s)=1/2P(r,s)=1f(r,s)/P(r,s)=1/2

  2. (r,s)A2f(r,s)1/20A11/2f(r,s)/P(r,s)=(1/(2μ))/(1/2)=1/μ

  3. fP

11/μ1(0,Σ)Σf/P[1,1/μ]


PfPχ2(2)fP 비례해야합니다.


이것은 엄청나게 답변 whuber입니다, 정말 감사합니다. 여기에 작성한 모든 것을 완전히 처리하는 데 시간이 걸리지 만 계산을 완전히 신뢰하므로 질문이 해결 된 것으로 표시되었습니다. 건배.
Gabriel
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.