추정에 대한 하한

다음 테스트 문제에 대해 하한이 알려진 경우 ( 이 다른 질문 과 관련하여) 알고 싶습니다 . 음수가 아닌 숫자 시퀀스에 대한 쿼리 액세스 권한이 부여됩니다 및 , 또는 합니다. $a_n \geq \dots\geq a_1$ $\varepsilon \in (0,1)$ $\sum_{k=1}^n a_k = 1$ $\sum_{k=1}^n a_k \leq 1-\varepsilon$

(적응) 무작위 알고리즘이 두 경우를 구별하기에 충분하고 필요한 쿼리 (조회) 수는 이상 입니까? $2/3$

나는 합계를 근사하는 관련 문제에 대해 로그 ( ) 상한과 결정적 알고리즘의 해당 문제에 대략 일치하는 하한 을 제공 하는 이전 게시물 을 발견 했습니다 . 그러나 내가 고려중인 특정 문제 (특히 무작위 알고리즘)에 대한 결과를 찾을 수 없습니다. $n$

편집 : 아래의 대답에 따라, 나는 더 명확해야한다고 생각합니다. 위에서 (특히 하한에 대한 무증상)에서 은 무한대로가는 것으로 보이는 "주요"량이며 은 (임의로) 작음) 상수. $n$ $\varepsilon$

reference-request randomized-algorithms property-testing

— 클레멘트 C.
소스

나는 당신이

을 의미한다고 생각합니다 .

\sum_{k = 1}^{n} a_{k} \leq 1 - ε

$\sum_{k=1}^n a_k \leq 1-\varepsilon$

— RB

실제로-고쳤다.

— Clement C.

음, 순서가 없으면

대한 의존성 이 필요할 것입니다 (샘플링 유무에 관계없이). A "나쁜"인스턴스 (서열 쌍) 예를 들면 모두 함께 시퀀스 것

의 이상임

n

$n$

a_{k}

$a_k$

번 (임의의, 랜덤)을 제외한

되도록

하나이고 동일

(제 순서)과

(제 단위).

쿼리가없으면두 시퀀스를 구별 할 수 없습니다.

\frac{1 - ε}{n - 1}

$\frac{1-\varepsilon}{n-1}$

j

$j$

a_{j}

$a_j$

ε

$\varepsilon$

0

$0$

Ω (n)

$\Omega(n)$

— Clement C.

쿼리 모델을 사용하면

를 쿼리

를 선택할 수 있다고 가정합니다. 맞습니까?

k

$k$

a_{k}

$a_k$

— kodlu

예 ( '공개 할 지점'을 선택할 수 있습니다).

— Clement C.

답변:

내가 보여줄 수있는 하한은 다음과 같습니다. 고정하기위한 것으로 나는 추측 오른쪽 하한은 ,하지만 자연스럽게 내가 잘못 될 수 있습니다. $\epsilon$ $\Omega( \log n)$

나는 편의상 줄어드는 순서를 사용할 것이다. 기본 메커니즘은 시퀀스를 블록 으로 나누는 것 입니다. 에서 번째 블록이있을 예정 요소 (즉, ). $L$ $i$ $n_i$ $\sum_i n_i = n$

다음에서는 일부 파라미터 대해 알고리즘이 확률 로 성공하기를 원합니다 . $\geq 1-\delta$ $\delta >0$

첫 번째 하한 : . $\displaystyle \Omega\left( \frac{1}{\epsilon} \log \frac{1}{\delta} \right)$

번째의 블록이 갖는 있도록 요소 . 우리는 상기 모든 요소의 값을 설정 되도록 번째 블록 여기서 하나 인 가변 또는 . 분명히이 시퀀스의 총합은 $i$ $n_i = 2^{i-1}$ $L = \lg n$ $i$ $(1+X_i)/(2n_iL)$ $X_i$ $0$ $1$ 그렇지 않으면확률가이고 각를선택한다고 상상해보십시오. 를 추정하려면신뢰할 수있는추정값이 필요합니다. 미립자, 우리는 기본 구별 할 수 있도록하려면, 말을하고,.

α = \sum_{i = 1}^{L} \frac{1 + X_{i}}{2 n_{i} L} = \frac{1}{2} + \frac{1}{2 L} (\sum_{i = 1}^{L} X_{i}) .

$\alpha = \sum_{i=1}^L \frac{1+X_i}{2n_i L} = \frac{1}{2} + \frac{1}{2L}\left(\sum_{i=1}^L X_i \right).$

X_{i}

$X_i$

β

$\beta$

1

$1$

0

$0$

α

$\alpha$

β

$\beta$

β = 1 - 4 ϵ

$\beta = 1-4\epsilon$

β = 1

$\beta=1$

이제 이러한 랜덤 변수의 을 샘플링 하고 샘플링 된 변수로 가정하십시오. 설정 ( 보체 변수 의 합을 취하고 있음 )에 이 있으며 Chernoff 부등식은 그 경우 $m$ $Z_1, \ldots, Z_m$ $Y = \sum_{i=1}^m (1-X_i)$ $\mu = E[Y] = (1-\beta) m$ 다음 , 실패 확률은 이 수량을보다 작게 만들려면 $\beta =1-4\epsilon$ $\mu = 4\epsilon m$

P [Y \leq 2 ϵ m] = P [Y \leq (1 - 1 / 2) μ] \leq \exp (- μ (1 / 2)^{2} / 2) = \exp (- ϵ m / 2) .

$P\left[ Y \leq 2\epsilon m \right] = P\left[ Y \leq (1-1/2) \mu \right] \leq \exp \left( -\mu (1/2)^2 / 2 \right) = \exp \left( -\epsilon m / 2 \right).$

, 우리는

가 필요하다

δ

$\delta$

m \geq \frac{2}{ϵ} \ln \frac{1}{δ}

$\displaystyle m \geq \frac{2}{\epsilon} \ln \frac{1}{\delta}$

핵심 관찰은 Chernoff 불평등이 빡빡하다는 것입니다 (모든 매개 변수에 대해 정확하지는 않지만 조심해야합니다.이 경우에는 정확하므로).

두 번째 하한 : . $\Omega( \log n / \log \log n)$

세트 할 일 블록 크기를 , 블록의 개수이다. 번째 블록 의 요소는 값을 갖습니다 . 따라서 시퀀스의 값의 총합은 입니다. $i$ $n_i = L^i$ $L = \Theta( \log n / \log \log n)$ $i$ $\alpha_i = \Bigl(1/L\Bigr)/n_i$ $1$

이제, 우리는, 임의의 블록을 뜨리는 말을 결정할 수도 한 번째, 그리고 자사 블록에있는 모든 값을 설정 (대신 ). 이것은 번째 블록 의 기여 를 에서 로 증가시키고, 시퀀스의 총 질량을 (거의) 증가시킵니다 . $j$ $\alpha_{j-1} = L \alpha_j$ $\alpha_j$ $j$ $1/L$ $1$ $2$

이제 비공식적으로 임의의 알고리즘은 각 블록의 값을 확인해야합니다. 따라서 시퀀스의 값 이상을 읽어야합니다 . $L$

확률이 인 위의 인수를보다 공식적으로 만들려면 질량 의 원래 시퀀스를 입력으로 지정하십시오 (이를 원래 입력이라고 함). 그렇지 않으면 값이 증가한 블록을 임의로 선택하십시오 (수정 된 입력). 분명히, 무작위 알고리즘이 미만의 항목을 읽는 경우 수정 된 입력을 감지 할 확률은 (대략) 입니다. 따라서 미만의 항목을 읽는 경우이 알고리즘이 실패 할 확률 은 $p=1/2$ $1$ $L/8$ $1/8$ $L/8$

(1 - p) (7 / 8) > 7 / 16 > 1 / 3.

$(1-p)(7/8) > 7/16 > 1/3.$

추신 : 나는 매개 변수에 더주의를 기울이면 첫 번째 하한을 로 향상시킬 수 있다고 생각합니다 . $\Omega(1/\epsilon^2)$

— 사리 엘 하 필링
소스

감사합니다! 나는 처음에 관한 작은 질문이

파운드 (특히 가능한 차 개선). 여기에 단방향 약속 문제가 있기 때문에 알고리즘이

이라는 증거를 제공하는 값을 "확인"하자마자 보다 정확한

추정값을 얻지 않고도 결론을 내릴 수 있습니다 . 즉 , 기본적으로 모든

가 1이거나 적어도

비율이 아닐 것으로 예상 하므로

가이 구성에 최적 임을 의미 합니까?

Ω (1 / ϵ)

$\Omega(1/\epsilon)$

β < 1

$\beta < 1$

β

$\beta$

1 / ϵ

$1/\epsilon$

X_{i}

$X_i$

ϵ

$\epsilon$

— 클레멘트 C.

네. 1과 1- 엡실론 만 구별하고 싶을 때는 물론 하한을 개선 할 수 없습니다. 다른 범위를 구별하려고 생각했습니다 ... s

— Sariel Har-Peled

하한

적어도 쿼리는 두 경우를 구별 할 필요합니다. $\Omega(1/\sqrt{\epsilon})$

시퀀스 고려 주어진 ,에 되도록 선택 . 특히, 우리는 취할 수 있습니다 $a_1,\dots,a_n$ $\epsilon,2\epsilon,3\epsilon,4\epsilon,\dots$ $n$ $a_1+\dots+a_n = 1$ . $n \approx 1/\sqrt{2\epsilon}$

이제 새로운 시퀀스를 생성 감산하여 상기 시퀀스의 하나의 요소를 변경함으로써 . 즉, , 점을 제외하고, 등, . 공지 사항이 . $a'_1,\dots,a'_n$ $\epsilon$ $a'_1=a_1$ $a'_2=a_2$ $a'_i = a_i - \epsilon$ $a'_1 + \dots + a'_n = 1-\epsilon$

얼마나 많은 프로브는 구별 걸립니까 에서 ? 글쎄, 그것들은 단일 요소 ( 번째 요소) 에서만 다르므로 일정한 식별 확률을 달성하기 위해서는 프로브가 필요합니다. 이제 $a_1,\dots,a_n$ $a'_1,\dots,a'_n$ $i$ $\Omega(n)$ ; 우리는 $n \approx 1/\sqrt{2\epsilon}$ 프로브가 필요합니다. $\Omega(1/\sqrt{\epsilon})$

상한

쿼리를 사용하여 두 경우를 구별 할 수 있다고 생각 합니다. 이것이 최적인지 모르겠습니다. $O(\lg(n/\epsilon) [\lg n + 1 / \epsilon^2])$

방법은 다음과 같습니다. 범위 를 다음과 같이 분할 해 봅시다 : $[0,1]$

[0, 1] = [0, 0.25 ϵ / n] \cup (0.25 ϵ / n, 0.5 ϵ / n] \cup (0.5 ϵ / n, ϵ / n] \cup (ϵ / n, 2 ϵ / n] \cup (2 ϵ / n, 4 ϵ / n] \cup \dots \cup (\dots, 1] .

$[0,1] = [0,0.25\epsilon/n] \cup (0.25\epsilon/n,0.5\epsilon/n] \cup (0.5\epsilon/n,\epsilon/n] \cup (\epsilon/n,2\epsilon/n] \cup (2\epsilon/n,4\epsilon/n] \cup \dots \cup (\ldots,1].$

각 이렇게하면, 파티션입니다 값이 위의 범위를 정확히 하나에 해당해야합니다. 우리는 분할 할 수 있습니다 그들이에 다양 한에 따라 값을. 각 값이 범위를 정확히 하나에 해당하고, 특정 범위에 속하는 사람은 모든 정렬 된 순서로 연속적으로 나타납니다. 따라서, 임의의 주어진 범위 , 우리는 인덱스를 찾을 수 되도록 $a_i$ $a_i$ $a_i$ $[\ell,u]$ $i,j$ $a_i,\dots,a_j \in [\ell,u]$ 이진 검색을 사용합니다. 이를 위해서는 이진 검색 이 필요합니다 . 우리가 그렇게했다고 가정합니다. $O(\lg(n/\epsilon))$

이제 각 범위의 값 합계를 추정합니다. 첫 번째 범위는 다른 모든 범위와 별도로 처리됩니다.

첫 번째 범위 경우 해당 범위의 값 합계를 과 사이의 범위로 묶을 수 있습니다 . 여기서 은 해당 범위에 속하는 값의 수입니다. 이후 , 바인딩이 절대 오차는 기껏 것이다 . $[0,0.25\epsilon/n)$ $0$ $m \times 0.25\epsilon/n$ $m$ $m \le n$ $0.25 \epsilon$
서로 다른 범위에 대해 임의 프로브를 사용하여 해당 범위의 값 합계를 상대 오차 내에 바인딩 할 수 있습니다 . 여기서 핵심은 해당 범위의 모든 값이 알려진 하한을 가지며 최대 의 하한입니다. 선택합니다 . $\delta$ $O(1/\delta^2)$ $2 \times$ $\delta = 0.25 \epsilon$

모든 추정치의 합계하지만 첫 번째 범위의 오류는 대부분의에있을 것입니다 . 제 범위의 추정 오차는 최대가 될 것이다 . 따라서, 이러한 모든 추정치의 합계 총 에러가있을 것이다 개의 구별하기에 충분하고, 의 총 대 . $0.25 \epsilon$ $0.25 \epsilon$ $\le 0.5 \epsilon$ $1$ $1-\epsilon$

— DW
소스

감사합니다. 이것은 흥미로워 보입니다 (내가 말할 수있는 한, 위의 논문 / 토론에서 사용 된 것과 같은 접근 방식은 아닙니다). 나는 당신이 쓴 것을 더 깊이 볼 것입니다. 그러나 나는 상한이 아닌 하한, 즉 얼마나 많은 쿼리가 필요한지를 찾고 있습니다.

— Clement C.

(시간이 다가 오면서 나는 그럼에도 불구하고 답변에 "현상"을 수여하고있다-비록 내가 어딘가에 있다면 하한에 대한 참조를 찾고있다.)

— Clement C.

@ClementC., 귀하의 요청에 따라 하한을 추가했습니다.

— DW

n

$n$

ε

$\varepsilon$