리버스 체 르노 프 바운드


31

꼬리 확률이 적어도 너무 크다는 것을 제한하는 역 Chernoff 경계가 있습니까?

즉, X1,X2,,Xn 이 독립 이항 랜덤 변수이고 μ=E[i=1nXi] . 다음 우리는 증명할 수있는 Pr[i=1nXi(1+δ)μ]f(μ,δ,n) 일부에 대한 함수 f .


1
p=n2/3Pr[|TS1|1.1n1/3]Pr[|TS2|1.1n1/3]exp(cn1/3)c

네 말이 맞아, 나는 chernoff bound에서 어떤 용어에 사각형이 있는지 혼란스러워했다. 나는 약한 경계를 반영하기 위해 질문을 변경했습니다. 현재 응용 프로그램에서 도움이 될 것이라고 생각하지 않지만 다른 이유로 흥미로울 수 있습니다.
Ashwinkumar BV

답변:


28

다음은 표준 Chernoff 경계가 특정 범위의 매개 변수에 대해 지수의 일정한 요인에 가깝다는 명백한 증거입니다. (특히, 변수가 0 또는 1이고 확률이 1/2 이하인 1 및 일 때, Chernoff 상한은 상수보다 작습니다.)ϵ(0,1/2)

실수를 발견하면 알려주십시오.

정리 1. (Chernoff 경계의 기밀성) 독립, 0/1 랜덤 변수 (rv) 의 평균 이라고합시다 . 가정 하고 및 에 대해Xkϵ(0,1/2]p(0,1/2]ϵ2pk3

(i) 각 rv가 최대 확률로 1 이면p

Pr[X(1ϵ)p]  exp(9ϵ2pk).

(ii) 각 rv가 확률 가 1 이상인 경우 ,p

Pr[X(1+ϵ)p]  exp(9ϵ2pk).

증명. 우리는 다음 관찰을 사용합니다.

청구항 1 의 경우 , 다음 1k1(k)  1e2π(k)(kk)k

주장의 증거 1. 스털링의 근사에 의해 여기서i!=2πi(i/e)ieλλ[1/(12i+1),1/12i].

따라서 은 은 최소한 QED(k)k!!(k)!

2πk(ke)k2π(e)  2π(k)(ke)kexp(112k+1112112(k))
  12π(k)(kk)ke1.

Lemma 증명 1 부 (i). 일반성을 잃지 않으면 합 의 각 0/1 랜덤 변수는 확률이 정확히 1 인 것으로 가정합니다 . 참고 는 합 와 같습니다. .X pPr[X(1ϵ)p]i=0(1ϵ)pkPr[X=i/k]Pr[X=i/k]=(ki)pi(1p)ki

수정 . 합계의 항이 증가하므로 인덱스 이있는 항의 값은 각각 이므로 총합의 값은 적어도 . 증명을 완성하기 위해 =(12ϵ)pk+1iPr[X=/k](ϵpk2)Pr[X=/k]

(ϵpk2)Pr[X=/k]  exp(9ϵ2pk).

가정 및 주고 , 좌측 위에 있도록하는 적어도하다 . 경계로, 제 1 사용 , 이는 차례에 적어도 여기서 및 ϵ2pk3ϵ1/2ϵpk623ϵpk(k)p(1p)k(k)ABA=23eϵpk/2πB=(k)(kk)kp(1p)k.

완료하려면 및 합니다.Aexp(ϵ2pk)Bexp(8ϵ2pk)

주장 2. Aexp(ϵ2pk)

청구항 2 의 가정 및 (i) .ϵ2pk3ϵ1/2pk12

정의에 따르면 입니다. 에 의해 (i), . 따라서 (ii) 입니다.pk+1pk121.1pk

에서 로 (ii)의 오른쪽을 대체 하면 (iii) 됩니다.AA23eϵpk/2.2π

가정, 내포 , 이는 (III)을 제공한다 (Ⅳ)와 .ϵ2pk3ϵpk3A23e3/2.2π0.1

에서 는 그 (V)을 다음 .ϵ2pk3exp(ϵ2pk)exp(3)0.04

(iv)와 (v)는 함께 주장을한다. QED

주장 3. .Bexp(8ϵ2pk)

클레임 증명 3. 되도록 수정 합니다. 의 선택은 암시 하므로 청구는 됩니다. 후자의 불평등의 양쪽을 과 같고 단순화하면 대체 하고 단순화하면 δ=(1δ)pk
δ2ϵBexp(2δ2pk)1/

pk(k(1p)k)k/1  exp(2δ2pk).
=(1δ)pk
(1δ)(1+δp1p)1(1δ)p1  exp(2δ21δ).
양쪽의 로그를 취하고 두 번 사용하면 위의 왼쪽은 단순화합니다. 때문에 보다 작습니다. . QEDln(1+z)z
δ+δp1p(1(1δ)p1)  2δ21δ.
δ2/(1p)(1δ)2δ2/(1δ)p1/2

클레임 2와 3은 합니다. 이것은 정리의 (i) 부분을 의미합니다.ABexp(ϵ2pk)exp(8ϵ2pk)

Lemma의 증명 1 부 (ii). 일반성의 손실없이 각 랜덤 변수는 확률이 정확히 이라고 가정합니다 .1p

참고 . 수정 .Pr[X(1+ϵ)p]=i=(1ϵ)pknPr[X=i/k]^=(1+2ϵ)pk1

합계 의 마지막 항의 합계는 적어도 이며, 적어도 입니다. (그 증명은 경우와 동일하다 (I)를 제외 대체 와 로 대체 되도록 .) QEDϵpk(ϵpk2)Pr[X=^/k]exp(9ϵ2pk)^δδ^^=(1+δ^)pk


몇 가지 [수학 처리 오류]-수정 가능성이 있습니까?
Aryeh

그 수학 표현은 잘 표시하는 데 사용되었습니다. 어떤 이유로 \ choose 명령이 mathjax에서 작동하지 않습니다. \ binom도 아닙니다. 예를 들어 $ a \ choose b $ 는 제공 . 아마도 이것은 mathjax 구성의 버그 일 것입니다. 잘만되면 그것은 곧 고쳐질 것이다. 한편 arxiv.org/pdf/cs/0205046v2.pdf 또는 cs.ucr.edu/~neal/Klein15Number 부록의 Lemma 5.2를 참조하십시오 . (ab)
Neal Young

22

베리 Esseen은 정리 가보다 높은만큼, 꼬리 확률 하한을 줄 수있다 .n1/2

사용할 수있는 또 다른 도구는 Paley-Zygmund 불평등 입니다. 임의의 정수 및 실수로 된 임의의 변수 ,kX

Pr[|X|>=12(E[Xk])1/k]E[Xk]24E[X2k]

다항식 정리와 함께 대해 레이더 마커 랜덤 변수 인 Paley-Zygmund는 매우 강한 하한을 얻을 수 있습니다. 또한 경계 독립 임의 변수와 함께 작동합니다. 예를 들어 4 개의 독립적 인 랜덤 변수의 합이 일정한 확률 로 임을 쉽게 알 수 있습니다 .Xnn±1Ω(n)


14

Bernoulli 시도의 경계 합계 (예 : 임의의 변수가 아닌)에 실제로 만족한다면 다음은 매우 빡빡합니다.

수녀의 불평등 *. 하자 IID를 갖는 베르누이 RV로부터 끌어 수 및하자 정수 주어질. (a) 및 또는 (b) 인 경우 여기서 는 표준 법선의 cdf입니다.{Xi}i=1nE(X1)=pknp1/4npknpkn(1p)

Pr[iXik]1Φ(knpnp(1p)),
Φ

( 표준 노멀을 변형 한 것처럼 대한 논증을 대치하면 이것은 CLT가 말한 것과 정확히 일치합니다. 실제로, 조건의 조건을 만족하는 이항 법이 위 꼬리에서 해당 가우시안을 지배 할 것임을 알려줍니다.)Φ

여기에서 경계를 사용 하여 더 좋은 것을 얻을 수 있습니다. 예를 들어, Feller의 첫 번째 책인 Gaussians 섹션에서 모든 대해 여기서 는 표준 법선의 밀도입니다. 위키피디아 기사에는 "Q-function"에 대해서도 비슷한 한계가 있습니다.Φz>0

z1+z2φ(z)<1Φ(z)<1zφ(z),
φ

그것과 다른 사람들이 말한 것 외에, 아마도 스털링과 함께 이항식을 직접 사용해 볼 수도 있습니다.

(*) Slud의 불평등에 대한 일부 새로운 진술은 이러한 조건 중 일부를 생략합니다. 나는 Slud의 논문에서 이것을 재현했습니다.


7

de Moivre-Laplace 정리는, 적절하게 정규화 된 후 특정 조건 하에서 정규 분포로의 분포가 수렴합니다. 일정한 하한을 원한다면 충분합니다.|TS1|

와 같은 하한의 경우 약간 더 미세한 도구가 필요합니다. 여기 내가 아는 한 가지 참조가 있습니다 (그러나 우연히 만-나는 그러한 불평등을 직접 사용할 기회가 없었습니다). 이항 분포의 꼬리 확률에 대한 몇 가지 명시적인 하한은 정리 1.5 책 Béla Bollobás, Cambridge, 2nd edition의 Random graphs 로, 확률과 그 적용 에 대한 추가 정보는 Reller의 Feller 및 Foundations of Probability of Provenability of Rényi에 의해 참조됩니다.nc


4

일반화 된 Littlewood-Offord 정리는 정확히 당신이 원하는 것이 아니지만 무작위 변수의 합이 특정 값 (포함하여 기대). 아마도 유용 할 것입니다.

공식적으로 정리는 다음과 같습니다.

일반화 된 Littlewood-Offord 정리 : 및 은 대해 이고 은 값이 0과 1 인 독립적 인 랜덤 변수가되도록합니다. 들면 , 그 가정 모두 . 그런 다음 에 대해 여기서 는 에만 의존하는 상수 입니다.a1,,ans>0|ai|s1inX1,,Xn0<p12pPr[Xi=0]1p1inrR

Pr[ri=1naiXi<r+s]cpn
cpp

3
이런 유형의 결과는 "작은 공의 불평등"으로도 알려져 있으며 Nguyen과 Vu는 훌륭한 설문 조사 결과를 가지고 있음을 아는 것이 도움이 될 수 있습니다 .math.osu.edu / nguyen.1261 / cikk / LO-survey.pdf . 여기의 나의 관점은 당신의 관점과 약간 다릅니다. 나는 "역전 체로 노프 (Reverse Chernoff)"가 작은 공의 확률 질량을 0 부근에서 더 낮게 추정하는 것으로 생각한다. 나는 작은 공의 불평등이 작은 공 확률이 0에서 공에 의해 최대화된다고 정 성적으로 말하는 것으로 생각한다. 감각 역 체 르노 프 바운드는 보통 작은 공의 불평등보다 증명하기가 더 쉽습니다.
Sasho Nikolov

3

Wikipedia에 명시된 표준 Chernoff 경계의 지수는 0/1 값의 임의 변수에 대해 엄격합니다. 하자 및하자 독립 확률 변수의 순서 일되도록 각 , 및 . 그런 다음 모든 , 0<p<1X1,X2,iPr[Xi=1]=pPr[Xi=0]=1pε>0

2D(p+εp)nn+1Pr[i=1nXi(p+ε)n]2D(p+εp)n.

여기서 는 Bernoulli 랜덤 사이의 Kullback-Leibler 분기입니다 매개 변수와 함께 및 .D(xy)=xlog2(x/y)+(1x)log2((1x)/(1y))xy

언급 한 바와 같이, 상기 상부는 위키에 입증 부등식 (바인드 https://en.wikipedia.org/wiki/Chernoff_bound 이름 "Chernoff-Hoeffding 정리, 첨가제 형태"에서). 하한은 예를 들어 "유형의 방법"을 사용하여 증명할 수 있습니다. [1]의 Lemma II.2를 참조하십시오. 또한 이것은 Cover and Thomas의 정보 이론에 관한 고전 교과서에서 다룹니다.

[1] Imre Csiszár : 유형의 방법. 정보 이론에 관한 IEEE 거래 (1998). http://dx.doi.org/10.1109/18.720546


또한 이며 그것이 . 이것은 때 전형적인 경계가 예리함을 보여줍니다. (그리고 대해 ). D(p+δpp)=p22pδ2+O(δ3)p=1/212δ2+O(δ4)δ=O(n1/3)eCδ2δ=O(n1/4)p=1/2
Thomas Ahle
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.