균일 동전과 바이어스 동전 사이의 통계적 거리


9

하자 통해 균일 한 분포 될 비트 및하자 통해 배포 될 비트들이 독립적이며 각 비트는 비트 확률로 . 일 때 와 사이의 통계적 거리 가 이라는 것이 사실 입니까?UnDn11/2ϵDUΩ(ϵn)n1/ϵ2


2
예. 와 사이의 통계 거리는 적어도 이며 ; 예를 들어 여기에 matus의 답변을 참조하십시오 : cstheory.stackexchange.com/questions/14471/…UVPrU(xi>n/2)PrD(xi>n/2)Ω(εn)
Yury

2
감사. 아마도 matus가 내가 받아 들일 수있는 대답으로 쓴 것에서 이것을 얻는 방법을 설명 할 수 있습니까?
Manu


1
Matus의 대답에 관해서는 Slud의 불평등보다 더 잘할 수 있습니다. 에 (2.13,2.14)를 참조 arxiv.org/abs/1606.08920
Aryeh

답변:


7

임의의 비트를 나타냅니다 . 정의에 따르면 와 사이의 통계 거리는 모든 t에 대해 적어도 입니다 . 우리는 t = n / 2 + \ sqrt {n}을 선택 합니다.x1,,xnUDPrU(xit)PrD(xit)tt=n/2+n

참고 일부 절대 상수에 대한 . 경우 다음 통계적 거리가 최소 인 , 우리가 행해진 다. 따라서 아래에서 합니다.PrU(xit)c1c1>0PrD(xit)c1/2c1/2PrD(xit)c1/2

하자 IID 베르누이 확률 변수가 와 . 우리의 목표는 임을 증명하는 것입니다 . 평균값 정리로, 일부 대해 입니다. 이제 ; 이는 원하는 통계 거리가 필요에 따라 이상임을 의미 합니다.f(s)=Pr(xit)엑스1,,엑스홍보(엑스나는=1)=1/2에스에프(0)에프(ε)=Ω(ε)

에프(0)에프(ε)=ε에프'(ξ),
ξ(0,ε)에프'(ξ)Ω()Ω(ε)

쓰기, 및 참고 그러므로,

에프(ξ)=케이(케이)(12ξ)케이(12+ξ)케이,
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2ξ)(1/2+ξ)2(2tn)=4n.
에프'(ξ)4케이(케이)(12ξ)케이(12+ξ)케이=4에프(ξ)4에프(ε)4(1/2).
여기서, . 우리는 보여 주었다 .에프(ε)=홍보(엑스1++엑스)1/2에프'(ξ)=Ω()

5

다소 초등적이고 약간 더 지저분한 증거입니다 (또는 적어도 나에게는 그렇게 느낍니다).

편의상, 을 과 함께 가정하십시오.ε=γγ[0,1)

의 표현을 명시 적으로 . V(,)

2dTV(P,U)=x{0,1}n|(12+γn)|x|(12γn)n|x|12n|=12nk=0n(nk)|(1+2γn)k(12γn)nk1|12nk=n2+nn2+2n(nk)|(1+2γn)k(12γn)nk1|Cnk=n2+nn2+2n|(1+2γn)k(12γn)nk1|
여기서 은 절대 상수입니다. 우리는 각 summand를 개별적으로 하한 : 수정 및 , 를 통해 각 소환이 수렴되는 수량에 의해 하한 ( 때 ) ~C>0k=kn2[n,2n]
(1+2γn)k(12γn)nk=(14γ2n)n/2(1+2γn12γn)(14γ2n)n/2(1+2γn12γn)nne4γ2γ2
ne4γ2γ21>4γ2γ2>2γ ; 각각이 임을 암시합니다 . 요약하면 청구 된Ω(γ)
2dTV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)

(제품 분포가 좋은 특성으로 인해 Hellinger를 프록시로 사용하는 것은 유혹적이며 훨씬 빠를 것이지만, 최종 하한에서 2 차 요인에 의해 손실이 발생합니다.)
Clement C.

1
좋은! 나는 초등 접근법을 좋아합니다. 우리는 에서도 비 점근 적으로 만들 수 있어야합니다 . 한 가지 방법은 이면 멋진 부등식 . 조금 더 지저분합니다. n(1+z1z)n(1+2z)n1+weww2/2
usul
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.