쿠폰 수집기 시간에 대한 하한은 얼마입니까?


20

이자형[]lnV에이아르 자형()2홍보(>ln+기음)<이자형기음

이 상한은 체비 쇼프 불평등에 의해 주어진 것보다 낫습니다. 이것은 대략 1/기음2 입니다.

내 질문은 : 대한 Chebyshev보다 더 나은 하한 이 있습니까? (예를 들어, )?홍보(<ln기음)<이자형기음


명백한 하한은 이지만, 여러분이 알고 계신 것 같습니다 ...Pr(T<n)=0
onestop

답변:


14

분석이 완전히 기본적이고 원하는 결과를 정확하게 제공하기 때문에 이것을 두 번째 답변으로 제공하고 있습니다.

제안 내용 및 , 기음>01

(<로그기음)<이자형기음.

증명의 기본 개념은 간단합니다.

  1. 모든 쿠폰이 로 수집 될 때까지 의 시간을 나타냅니다. 여기서 는 i 번째 (이전) 고유 쿠폰이 수집 된 시간입니다. T_i는 의 평균 시간이 기하 랜덤 변수 \ FRAC {N} {N-1} + .=나는=1나는나는나는나는나는+1
  2. Chernoff 바운드 버전을 적용하고 단순화하십시오.

증명

임의의 임의 에스>0 , 우리는

(<)=(이자형에스>이자형에스)이자형에스이자형이자형에스.

이후 =나는나는나는 무관 한, 우리가 쓸 수

이자형이자형에스=나는=1이자형이자형에스나는

이제 가 기하학적이므로 성공 확률 로 가정하면 간단한 계산에 P E 전자 - S T 내가 = P는 내가나는나는

이자형이자형에스나는=나는이자형에스1+나는.

문제 의 는 , , 등입니다. 따라서 p 1 = 1 p 2 = 1 1 / n p 3 = 1 2 / n n i = 1 E e s T i = n i = 1 i / n나는1=12=11/=12/

나는=1이자형이자형에스나는=나는=1나는/이자형에스1+나는/.

의합시다 선택 과 일부 . 그런 다음 및 , t = n log n c n c > 0 e s t = n e c e s = e 1 / n1 + 1 / n n i = 1 i / n에스=1/=로그기음기음>0

이자형에스=이자형기음
이자형에스=이자형1/1+1/
나는=1나는/이자형에스1+나는/나는=1나는나는+1=1+1.

이것을 종합하면

(<로그기음)+1이자형기음<이자형기음

바라는대로.


그것은 아주 좋고 의사가 지시 한 것입니다. 고맙습니다.
David

@David, 궁금한 점 : 의도 된 응용 프로그램은 무엇입니까?
추기경

긴 이야기. 내가 관심있는 알고리즘의 실행 시간을 분석하기 위해 요리 한 Markov 체인의 혼합 시간에 대한 하한을 증명하려고 노력하고 있습니다. 수집기 문제. BTW, 나는 이런 종류의 Chernoff 스타일을 정확하게 찾으려고 놀고 있었지만 에서 해당 제품을 제거하는 방법을 찾지 못했습니다 . :-)을 선택하는 것이 좋습니다 . s = 1 /나는에스=1/
David

@David, 은 거의 확실히 차선책이지만 얻은 이후 시도해야 할 명백한 것 같았 습니다. 이는 유도에서 얻은 것과 같은 용어입니다. 상한. e s t = n e cs=1/nest=ne기음
추기경

1
요청 : 위에 제시 한 증거는 본인의 것입니다. 문제가 흥미를 느끼기 때문에 나는 즐거움으로 그것을 해결했습니다. 그러나 나는 참신함을 주장하지 않습니다. 실제로, 나는 유사한 기술을 사용하는 유사한 증거가 문헌에 아직 존재하지 않는다고 상상할 수 없다. 사람이 참조 알고 있다면, 제발 여기에 댓글로 게시 할 수 있습니다. 나는 하나를 알고 매우 관심 이 있습니다 .
추기경

9

@cardinal은 이미 내가 찾고있는 경계를 정확하게 제공하는 대답을 주었지만 더 강한 경계를 줄 수있는 비슷한 Chernoff 스타일의 인수를 발견했습니다.

제안 : ( 보다 강력합니다 )c > π 2

Pr(Tnlogncn)exp(3c2π2).
c>π23

증명 :

@cardinal의 대답에서와 같이 는 성공 확률 인 독립 기하 랜덤 변수 의 합 이라는 사실을 사용할 수 있습니다 . 팔로우 즉 및 .T i p i = 1 i / n E [ T i ] = 1 / p i E [ T ] = n i = 1 E [ T i ] = n n i = 1 1TTipi=1i/nE[Ti]=1/piE[T]=i=1nE[Ti]=ni=1n1inlogn

이제 새 변수 및 . 그런 다음 S : = i S iSi:=TiE[Ti]에스: =나는에스나는= Pr ( exp ( s S) exp ( s

Pr(Tnlogncn)Pr(TE[T]cn)=Pr(Scn)
=Pr(exp(sS)exp(scn))es기음이자형[이자형에스에스]

평균을 계산하면

E[e에스에스]=나는이자형[이자형에스에스나는]=나는이자형에스/나는1+1나는(이자형에스1)이자형12에스2나는나는2
여기서 불평등은 및 입니다 .e z이자형에스1에스 z0ez1+ze12z2z0

따라서 , 우리는 쓸 수 (TNipi2=n2i=1n11i2n2π2/6

Pr(Tnlogncn)e112(nπs)2scn.

최소화하면 마침내 Pr ( T n log n s>0

Pr(Tnlogncn)e3c2π2

1
(+1) 모듈로 사소한 오타 두 개, 이것은 좋습니다. 당신이 한 것처럼 평균에 가까운 것을 확장하면 종종 더 잘 작동합니다. 나는 점근 적 결과에 비추어 고차 수렴을 보는 것에 놀라지 않습니다. 이제, 이와 같은 상한을 보여 주면, Vershynin의 용어에서 이 지수 에 비례한다는 것을 알 수 있습니다. (Tnlogn)/n
추기경

1
논쟁은 상한으로 직접 일반화되지 않는 것 같습니다. 를 (및 는 )로 교환 하면 를 계산할 때까지 동일한 단계를 수행 할 수 있습니다. . 그러나이 시점에서 내가 할 수있는 최선의 방법은 어느 여전히 잎 와 I 돈 이것으로 무엇을 해야할지 모르겠다c s s E [ e s S ] ccssE[esS]ies/pi1spiEez1zexp(z22(1z))
E[esS]e12s2ipi2(1s/pi)
David

2
흥미롭게도, 비록 (하한에 대한) 전체 인수 쿠폰 콜렉터 문제지만 아니 만 작동하는 것으로 보인다 어떤 경계 분산이 동일하지 않은 독립된 형상 변수의 합. 구체적으로, 주어진 , 여기서 각 는 성공 확률 갖는 독립 GV 이고 여기서 , T i p i i p T=iT나는T나는p나는Pr(T나는나는2에이<
홍보(이자형[]에이)이자형에이22에이
David

4

중요 사항 : 본인은이 답변에서 원래 제공 한 증거를 삭제하기로 결정했습니다. 그것은 더 길고, 더 계산적이고, 더 큰 망치를 사용했으며, 내가 준 다른 증거와 비교할 때 약한 결과를 입증했습니다. 도처에 열등한 접근 방식이 있습니다. 정말로 관심 이 있다면 편집 내용을 볼 수 있다고 가정합니다.

내가 원래 인용하고 있다는 점근 적 결과는 여전히 대답 아래에 발견에게 쇼를 할과 우리가 조금 더 나은이를 위해 보유하고있는 다른 대답에 증명 바운드보다 할 수있는 모든 .n


다음과 같은 점근 적 결과가 유지됩니다.

P(T>nlogn+cn)1eec

P(Tnlogncn)eec.

상수 및 한계는 로 간주됩니다 . 두 결과로 나뉘어 있지만 가 음이 아닌 것으로 제한되지 않기 때문에 거의 같은 결과 입니다. n ccRnc

예를 들어, Motwani and Raghavan, Randomized Algorithms , 60-63 페이지의 증거를 참조하십시오.


또한 : David는 친절하게이 답변에 대한 주석에서 언급 한 상한에 대한 증거를 제공합니다.


예, 그것은 모든 고정 대해 유지됩니다 . 예를 들어 Levin, Peres 및 Wilmer의 저서 Markov Chains and Mixing Times, Proposition 2.4에서 (매우 간단한) 증거를 찾을 수 있습니다. 그러나 증거는 하한에는 적용되지 않습니다. n
David

1
사실, 나뿐만 아니라 여기에 증거를 쓰다 수 있습니다 "하자 (가)있는 이벤트가 될 번째 [쿠폰] 유형이 가장 먼저 표시되지 않습니다 쿠폰을 그린 최초의 관찰이. . 각 시행마다 쿠폰 확률이 이므로 시험은 독립적입니다. 위의 오른쪽은 , 증명 (2.7). " Aiinlogn+cnP(τ>nlogn+cn)=P(iAi)iP(Ai)1n1ii(11/n)nlogn+cnnexp(nlogn+cnn)=ec
David

@David, 훌륭하고 간단합니다. 나는 다른 용어로 포함-제외 공식을 확장하면서 빠르게 놀고 있었지만, 빨리 어디로 가지도 않았고 더 이상 볼 시간이 없었습니다. 이벤트는 에는 쿠폰 후에 남아 있지 않은지 이벤트에 해당 시험. 이와 관련된 마틴 게일이 있어야합니다. 당신은 (추정 된) 관련 martingale에 대해 Hoeffding의 불평등을 시도 했습니까? 점근 적 결과는 강력한 측정 농도를 나타냅니다. {T<tn}t
추기경

@David, 위의 증거에 표시가 뒤집혀 있지만 다른 독자들에게도 분명합니다.
추기경

@David, 귀하의 질문에 대한 다른 게시 된 답변을 참조하십시오. 방법은 귀하가 제공 한 상한과 다르지만, 여기에 제시 한 대답과 달리 사용 된 도구는 거의 초등입니다.
추기경

2

Benjamin Doerr "랜덤 검색 휴리스틱 이론"의 "랜덤 검색 휴리스틱 분석 : 확률 이론 도구"장에서 온라인 PDF 링크를 참조하십시오.

제안 하자 쿠폰 수집 프로세스의 정지 시간이 될. 그런 다음 .홍보[(1ϵ)(1)ln]이자형ϵ

이것은 원하는 무증상 (@cardinal의 두 번째 대답에서)을 주지만 모든 및 에 대해 true라는 이점이 있습니다.ϵ

여기 증거 스케치가 있습니다.

증거 스케치 : 하자 하는 경우가 될 처음에 번째 쿠폰 수집 그립니다. 따라서 입니다. 중요한 사실은 가 , 대해 음의 상관 관계가 있다는 것입니다 . 직관적으로,이는 것을 알고로, 매우 분명하다 첫 번째의 쿠폰 덜 가능성이 있음을 만들 것립니다 번째 쿠폰도 처음에 그려 립니다. 엑스나는나는홍보[엑스나는=1]=(11/)엑스나는나는[]홍보[나는나는,엑스나는=1]나는나는홍보[엑스나는=1]나는j

주장을 증명할 수는 있지만 각 단계에서 세트 을 1 씩 확대합니다 . 그런 다음 대해 으로 표시됩니다 . 마찬가지로, 평균화하면 됩니다. Doerr는 이것에 대한 직관적 인 주장만을 제공합니다. 증명의 한 가지 방법은 다음과 같습니다. 모든 쿠폰 다음에 오는 쿠폰 을 조건으로하는 것을 볼 수 있습니다.[ 내가 I , X = 1 | X j = 1 ] 나는홍보[나는나는,엑스나는=1|엑스j=1]홍보[나는나는,엑스나는=1]j나는j I I k | 나는 | k홍보[나는나는,엑스나는=1|엑스j=0]홍보[나는나는,엑스나는=1]j나는 에서 새 쿠폰 그리기의 가능성이 있음을, 그린 후 지금까지 지금 , 이전 대신나는케이 | 나는| k|나는|케이1 j|나는|케이 . 시간을 분해하는 기하학적 확률 변수의 합 모든 쿠폰을 수집 그래서, 우리는에 그 조화 볼 수 있습니다 한 후 오는 -coupon 가능성 (이전에 쿠폰을 수집하는 데 성공 확률을 증가, 따라서 단지 그것을 만드는 조절을하고 확률 적 우세에 의해 : 확률 적 우세 측면에서 컨디셔닝에 의해 각 기하 랜덤 변수가 증가하며,이 우세는 합에 적용될 수 있습니다.j나는

이 음의 상관 관계가 주어지면 을 따릅니다. 원하는 경계 t = ( 1 - ε ) ( N - 1 ) (LN) N홍보[(1ϵ)(1)ln](1(11/))=(1ϵ)(1)ln .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.