두 가우스 간의 지구 발동기 거리 (EMD)


26

과 사이에 EMD에 대한 닫힌 형식의 수식이 있습니까?x1N(μ1,Σ1)x2N(μ2,Σ2)


2
en.wikipedia.org/wiki/Earth_mover%27s_distance 에 따르면 EMD는 Mallows 또는 Wasserstein 거리와 동일하므로 googlin을 사용해 볼 수 있습니다.
kjetil b halvorsen

2
이 문서가 도움이 될 것입니다 : vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

답변:


27

지구 이동기의 거리로 기록 될 수있다 EMD(P,Q)=infEXY 상하 한이 모든 조인트 분포 점령되어, XY marginals와 XP , YQ . 이것은 첫 번째 Wasserstein 거리 로도 알려져 있으며 , 이는 Wp=inf(EXYp)1/p 이며 동일한 정보를 갖습니다.

하자 XP=N(μx,Σx) , YQ=N(μy,Σy) .

하한 : Jensen의 불평등으로

EXYE(XY)=μxμy,
규범은 볼록하므로 \ E \ lVert X-Y \ rVert \ ge \ lVert \ E (X-Y) \ rVert = \ lVert \ mu_x-\ mu_y \ rVert 이므로 EMD는 항상 적어도 수단 사이의 거리 (모든 분포에 대해).

W2 에 기반한 상한 : Jensen의 불평등에 의해 다시 (EXY)2EXY2 . 따라서 W1W2 입니다. 그러나 Dowson and Landau (1982)

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
EMD=W1 에 상한값을 지정합니다 .

타이트 상한 : 커플 링을 고려 이것은 Knott and Smith (1984) 에서 파생 된 맵입니다. , 분포의 최적의 맵핑을 최적화 이론 및 용도의 학회지 43 (1) PP 39-49 에 대한 최적의 매핑 등 ; 이 블로그 게시물을 참조하십시오 . 참고 및

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
이므로 커플 링이 유효합니다.

거리 다음이다 이제 와 정상 XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

따라서 의 상한 은 입니다. 불행하게도,이 기대에 대한 닫힌 형태는 일반 변수 법선에 대해 적어 놀라 울 정도로 불쾌 : 볼 이 질문 뿐만 아니라 이 하나 .W1(P,Q)ED

의 분산 이 구면 인 경우 (예 : , 이면 의 분산 은 )가 됨) 질문은 일반화 된 Laguerre 다항식의 관점에서 답을 제공합니다.DΣx=σx2IΣy=σy2ID(σxσy)2I

일반적으로, 우리는 Jensen의 불평등에 기반한 대한 간단한 상한을 가지고 있는데 , 예를 들어 첫 번째 질문에서 파생 : ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
마지막에 동등한 것은 및 와 유사하기 때문입니다. 따라서 동일한 고유 값을 가지므로 제곱근의 흔적이 같습니다.ΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

이 불평등은 가 퇴화되지 않는 한 합니다. 대부분의 경우 입니다.DΣxΣy

추측 : 아마도이 더 가까운 상한 인 가 빡빡 할 것입니다. 그런 다음 다시 여기에 다른 상한이 있었는데 실제로는 보다 느슨하다고 추측 된 추측이 추측을 너무 많이 믿지 않아야합니다. :)EDW2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.