지구 이동기의 거리로 기록 될 수있다 EMD(P,Q)=infE∥X−Y∥ 상하 한이 모든 조인트 분포 점령되어, X 및 Y marginals와 X∼P , Y∼Q . 이것은 첫 번째 Wasserstein 거리 로도 알려져 있으며 , 이는 Wp=inf(E∥X−Y∥p)1/p 이며 동일한 정보를 갖습니다.
하자 X∼P=N(μx,Σx) , Y∼Q=N(μy,Σy) .
하한 : Jensen의 불평등으로 E∥X−Y∥≥∥E(X−Y)∥=∥μx−μy∥,
규범은 볼록하므로
\ E \ lVert X-Y \ rVert \ ge \ lVert \ E (X-Y) \ rVert = \ lVert \ mu_x-\ mu_y \ rVert
이므로 EMD는 항상 적어도 수단 사이의 거리 (모든 분포에 대해).
W2 에 기반한 상한 :
Jensen의 불평등에 의해 다시
(E∥X−Y∥)2≤E∥X−Y∥2 . 따라서 W1≤W2 입니다. 그러나 Dowson and Landau (1982) 는
W2(P,Q)2=∥μx−μy∥2+tr(Σx+Σy−2(ΣxΣy)1/2),
EMD=W1
에 상한값을 지정합니다 .
타이트 상한 :
커플 링을 고려
이것은 Knott and Smith (1984) 에서 파생 된 맵입니다. , 분포의 최적의 맵핑을 최적화 이론 및 용도의 학회지 43 (1) PP 39-49 에 대한 최적의 매핑 등 ; 이 블로그 게시물을 참조하십시오 . 참고 및
XY∼N(μx,Σx)=μy+Σ−12x(Σ12xΣyΣ12x)12Σ−12xA(X−μx).
W2A=ATEYVarY=μy+A(EX−μx)=μy=AΣxAT=Σ−12x(Σ12xΣyΣ12x)12Σ−12xΣxΣ−12x(Σ12xΣyΣ12x)12Σ−12x=Σ−12x(Σ12xΣyΣ12x)Σ−12x=Σy,
이므로 커플 링이 유효합니다.
거리 다음이다 이제
와 정상
∥X−Y∥∥D∥D=X−Y=X−μy−A(X−μx)=(I−A)X−μy+Aμx,
EDVarD=μx−μy=(I−A)Σx(I−A)T=Σx+AΣxA−AΣx−ΣxA=Σx+Σy−Σ−12x(Σ12xΣyΣ12x)12Σ12x−Σ12x(Σ12xΣyΣ12x)12Σ−12x.
따라서 의 상한 은 입니다. 불행하게도,이 기대에 대한 닫힌 형태는 일반 변수 법선에 대해 적어 놀라 울 정도로 불쾌 : 볼 이 질문 뿐만 아니라 이 하나 .W1(P,Q)E∥D∥
의 분산 이 구면 인 경우 (예 : , 이면 의 분산 은 )가 됨) 질문은 일반화 된 Laguerre 다항식의 관점에서 답을 제공합니다.DΣx=σ2xIΣy=σ2yID(σx−σy)2I
일반적으로, 우리는 Jensen의 불평등에 기반한 대한 간단한 상한을 가지고 있는데 , 예를 들어 첫 번째 질문에서 파생 :
E∥D∥(E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
마지막에 동등한 것은 및 와 유사하기 때문입니다. 따라서 동일한 고유 값을 가지므로 제곱근의 흔적이 같습니다.ΣxΣyΣ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
이 불평등은 가 퇴화되지 않는 한 합니다. 대부분의 경우 입니다.∥D∥Σx≠Σy
추측 : 아마도이 더 가까운 상한 인 가 빡빡 할 것입니다. 그런 다음 다시 여기에 다른 상한이 있었는데 실제로는 보다 느슨하다고 추측 된 추측이 추측을 너무 많이 믿지 않아야합니다. :)E∥D∥W2