추정에 대한 하한


11

다음 테스트 문제에 대해 하한이 알려진 경우 ( 이 다른 질문 과 관련하여) 알고 싶습니다 . 음수가 아닌 숫자 시퀀스에 대한 쿼리 액세스 권한이 부여됩니다 및 , 또는 합니다. ε ( 0 , 1 ) n k = 1 a k = 1 n k = 1 a k1 εana1ε(0,1)k=1nak=1k=1nak1ε

(적응) 무작위 알고리즘이 두 경우를 구별하기에 충분하고 필요한 쿼리 (조회) 수는 이상 입니까?2/3

나는 합계를 근사하는 관련 문제에 대해 로그 ( ) 상한과 결정적 알고리즘의 해당 문제에 대략 일치하는 하한 을 제공 하는 이전 게시물 을 발견 했습니다 . 그러나 내가 고려중인 특정 문제 (특히 무작위 알고리즘)에 대한 결과를 찾을 수 없습니다.n


편집 : 아래의 대답에 따라, 나는 더 명확해야한다고 생각합니다. 위에서 (특히 하한에 대한 무증상)에서 은 무한대로가는 것으로 보이는 "주요"량이며 은 (임의로) 작음) 상수.εnε


나는 당신이 을 의미한다고 생각합니다 . k=1nak1ε
RB

실제로-고쳤다.
Clement C.

음, 순서가 없으면 대한 의존성 이 필요할 것입니다 (샘플링 유무에 관계없이). A "나쁜"인스턴스 (서열 쌍) 예를 들면 모두 함께 시퀀스 것 K 의 이상임 1 - εnak 번 (임의의, 랜덤)을 제외한J되도록j는하나이고 동일ε(제 순서)과0(제 단위). Ω(n)쿼리가없으면두 시퀀스를 구별 할 수 없습니다.1εn1jajε0Ω(n)
Clement C.

쿼리 모델을 사용하면 를 쿼리 하는 k 를 선택할 수 있다고 가정합니다. 맞습니까? kak
kodlu

예 ( '공개 할 지점'을 선택할 수 있습니다).
Clement C.

답변:


5

내가 보여줄 수있는 하한은 다음과 같습니다. 고정하기위한 것으로 나는 추측 오른쪽 하한은 Ω ( 로그 N ) ,하지만 자연스럽게 내가 잘못 될 수 있습니다.ϵΩ(logn)

나는 편의상 줄어드는 순서를 사용할 것이다. 기본 메커니즘은 시퀀스를 블록 으로 나누는 것 입니다. 에서 I 번째 블록이있을 예정 N I 요소 (즉, Σ에게 I를 N = N ).Liniini=n

다음에서는 일부 파라미터 δ > 0에 대해 알고리즘이 확률 로 성공하기를 원합니다 .1δδ>0

첫 번째 하한 : .Ω(1ϵlog1δ)

번째의 블록이 갖는 N = 2 개 I - 1 개 있도록 요소 L = LG N . 우리는 상기 모든 요소의 값을 설정 내가 되도록 번째 블록 ( 1 개 + X I ) / ( (2) N I L ) 여기서 X 제가 하나 인 가변 0 또는 1 . 분명히이 시퀀스의 총합은 α = L i = 1 1 + X입니다.ini=2i1L=lgni(1+Xi)/(2niL)Xi01그렇지 않으면확률β1이고0 인Xi를선택한다고 상상해보십시오. α를 추정하려면신뢰할 수있는β추정값이 필요합니다. 미립자, 우리는 기본 구별 할 수 있도록하려면β=1-4ε을, 말을하고,β=1.

α=i=1L1+Xi2niL=12+12L(i=1LXi).
Xiβ10αββ=14ϵβ=1

이제 이러한 랜덤 변수의 을 샘플링 하고 Z 1 , , Z m을 샘플링 된 변수로 가정하십시오. 설정 Y = m i = 1 ( 1 X i ) ( 보체 변수 의 합을 취하고 있음 )에 μ = E [ Y ] = ( 1 β ) m 이 있으며 Chernoff 부등식은 그 경우 β는 = 1 - 4mZ1,,ZmY=i=1m(1Xi)μ=E[Y]=(1β)m 다음 μ = 4 ε의 m , 실패 확률은 P [ Y 2 ε의 m ] = P [ Y ( 1 - 1 / 2 ) μ ]EXP ( - μ ( 1 / 2 ) 2 / 2 ) = exp ( ϵ m / 2 ) . 이 수량을보다 작게 만들려면β=14ϵμ=4ϵm

P[Y2ϵm]=P[Y(11/2)μ]exp(μ(1/2)2/2)=exp(ϵm/2).
, 우리는 m 2 가 필요하다δ .m2ϵln1δ

핵심 관찰은 Chernoff 불평등이 빡빡하다는 것입니다 (모든 매개 변수에 대해 정확하지는 않지만 조심해야합니다.이 경우에는 정확하므로).

두 번째 하한 : .Ω(logn/loglogn)

세트 할 일 블록 크기를 N = L I , L = Θ ( 로그 N / 로그 로그 n은 ) 블록의 개수이다. i 번째 블록 의 요소는 α i = ( 1 / L ) / n i 값을 갖습니다 . 따라서 시퀀스의 값의 총합은 1 입니다.ini=LiL=Θ(logn/loglogn)iαi=(1/L)/ni1

이제, 우리는, 임의의 블록을 뜨리는 말을 결정할 수도 한 번째, 그리고 자사 블록에있는 모든 값을 설정 α J - 1 = L의 α의 J (대신 α J를 ). 이것은 j 번째 블록 의 기여 를 1 / L 에서 1 로 증가시키고, 시퀀스의 총 질량을 (거의) 2로 증가시킵니다 .jαj1=Lαjαjj1/L12

이제 비공식적으로 임의의 알고리즘은 각 블록의 값을 확인해야합니다. 따라서 시퀀스의 값 이상을 읽어야합니다 .L

확률이 인 위의 인수를보다 공식적으로 만들려면 질량 1 의 원래 시퀀스를 입력으로 지정하십시오 (이를 원래 입력이라고 함). 그렇지 않으면 값이 증가한 블록을 임의로 선택하십시오 (수정 된 입력). 분명히, 무작위 알고리즘이 L / 8 미만의 항목을 읽는 경우 수정 된 입력을 감지 할 확률은 (대략) 1 / 8 입니다. 따라서 L / 8 미만의 항목을 읽는 경우이 알고리즘이 실패 할 확률 은 ( 1 - p ) ( 7 /p=1/21L/81/8L/8

(1p)(7/8)>7/16>1/3.

추신 : 나는 매개 변수에 더주의를 기울이면 첫 번째 하한을 로 향상시킬 수 있다고 생각합니다 .Ω(1/ϵ2)


감사합니다! 나는 처음에 관한 작은 질문이 파운드 (특히 가능한 차 개선). 여기에 단방향 약속 문제가 있기 때문에 알고리즘이 β < 1 이라는 증거를 제공하는 값을 "확인"하자마자 보다 정확한 β 추정값을 얻지 않고도 결론을 내릴 수 있습니다 . 즉 , 기본적으로 모든 X i 가 1이거나 적어도 ϵ 비율이 아닐 것으로 예상 하므로 1 / ϵ 가이 구성에 최적 임을 의미 합니까? Ω(1/ϵ)β<1β1/ϵXiϵ
클레멘트 C.

네. 1과 1- 엡실론 만 구별하고 싶을 때는 물론 하한을 개선 할 수 없습니다. 다른 범위를 구별하려고 생각했습니다 ... s
Sariel Har-Peled

4

하한

적어도 쿼리는 두 경우를 구별 할 필요합니다.Ω(1/ϵ)

시퀀스 고려 주어진 ε , 2 ε , 3 ε , 4 ε이 , ... ,에 해당 되도록 선택 1 + + N = 1을 . 특히, 우리는 n 1 / √를 취할 수 있습니다a1,,anϵ,2ϵ,3ϵ,4ϵ,na1++an=1 .n1/2ϵ

이제 새로운 시퀀스를 생성 ' 1 , ... , ' N 감산하여 상기 시퀀스의 하나의 요소를 변경함으로써 ε을 . 즉, ' 1 = 1 , ' 2 = 2 점을 제외하고, 등, A는 " 나는 = I를 - ε . 공지 사항이 ' 1 + + ' N = 1 - ε .a1,,anϵa1=a1a2=a2ai=aiϵa1++an=1ϵ

얼마나 많은 프로브는 구별 걸립니까 1 , ... , N 에서 ' 1 , ... , ' N을 ? 글쎄, 그것들은 단일 요소 ( i 번째 요소) 에서만 다르므로 일정한 식별 확률을 달성하기 위해서는 Ω ( n ) 프로브가 필요합니다. 이제 n 1 / a1,,ana1,,aniΩ(n) ; 우리는Ω(1/n1/2ϵ프로브가 필요합니다.Ω(1/ϵ)

상한

쿼리를 사용하여 두 경우를 구별 할 수 있다고 생각 합니다. 이것이 최적인지 모르겠습니다.O(lg(n/ϵ)[lgn+1/ϵ2])

방법은 다음과 같습니다. 범위 를 다음과 같이 분할 해 봅시다 :[0,1]

[0,1]=[0,0.25ϵ/n](0.25ϵ/n,0.5ϵ/n](0.5ϵ/n,ϵ/n](ϵ/n,2ϵ/n](2ϵ/n,4ϵ/n](,1].

각 이렇게하면, 파티션입니다 내가 값이 위의 범위를 정확히 하나에 해당해야합니다. 우리는 분할 할 수 있습니다 나는 그들이에 다양 한에 따라 값을. 각 내가 값이 범위를 정확히 하나에 해당하고, 특정 범위에 속하는 사람은 모든 정렬 된 순서로 연속적으로 나타납니다. 따라서, 임의의 주어진 범위 [ , U ] , 우리는 인덱스를 찾을 수 I , J 되도록 I , ... , J[ , U ]aiaiai[,u]i,jai,,aj[,u]이진 검색을 사용합니다. 이를 위해서는 이진 검색 이 필요합니다 . 우리가 그렇게했다고 가정합니다.O(lg(n/ϵ))

이제 각 범위의 값 합계를 추정합니다. 첫 번째 범위는 다른 모든 범위와 별도로 처리됩니다.

  • 첫 번째 범위 경우 해당 범위의 값 합계를 0m × 0.25 ϵ / n 사이의 범위로 묶을 수 있습니다 . 여기서 m 은 해당 범위에 속하는 값의 수입니다. 이후 m N , 바인딩이 절대 오차는 기껏 것이다 0.25 ε .[0,0.25ϵ/n)0m×0.25ϵ/nmmn0.25ϵ

  • 서로 다른 범위에 대해 O ( 1 / δ 2 ) 임의 프로브를 사용하여 해당 범위의 값 합계를 상대 오차 내에 바인딩 할 수 있습니다 . 여기서 핵심은 해당 범위의 모든 값이 알려진 하한을 가지며 최대 2 의 하한입니다. δ = 0.25 ϵ을 선택합니다 .δO(1/δ2)2×δ=0.25ϵ

모든 추정치의 합계하지만 첫 번째 범위의 오류는 대부분의에있을 것입니다 . 제 범위의 추정 오차는 최대가 될 것이다 0.25 ε . 따라서, 이러한 모든 추정치의 합계 총 에러가있을 것이다 0.5 ε 개의 구별하기에 충분하고, 하나 의 총 대 1 - ε .0.25ϵ0.25ϵ0.5ϵ11ϵ


감사합니다. 이것은 흥미로워 보입니다 (내가 말할 수있는 한, 위의 논문 / 토론에서 사용 된 것과 같은 접근 방식은 아닙니다). 나는 당신이 쓴 것을 더 깊이 볼 것입니다. 그러나 나는 상한이 아닌 하한, 즉 얼마나 많은 쿼리가 필요한지를 찾고 있습니다.
Clement C.

(시간이 다가 오면서 나는 그럼에도 불구하고 답변에 "현상"을 수여하고있다-비록 내가 어딘가에 있다면 하한에 대한 참조를 찾고있다.)
Clement C.

2
@ClementC., 귀하의 요청에 따라 하한을 추가했습니다.
DW

nε
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.