무작위 정렬 네트워크가 작동 할 확률

입력 주어지면 , 우리는 두 개의 변수 와 를 반복적으로 선택 하고 경우 이들을 바꾸는 비교 게이트를 추가하여 게이트로 무작위 정렬 네트워크를 구성합니다 . $n$ $x_0, \ldots, x_{n-1}$ $m$ $x_i, x_j$ $i < j$ $x_i > x_j$

질문 1 : 고정 들어 , 필수의 방법 대형 확률로 정확하게 정렬하는 네트워크의 수 ? $n$ $m$ $> \frac{1}{2}$

각 연속 쌍이 교체되는 것을 제외하고 올바르게 정렬 된 입력은 각각에 대해 시간 이 걸리기 때문에 적어도 하한 이 있습니다. 비교기로 선택 될 쌍. 그것은 또한 더 많은 요소를 가진 상한 입니까? $m = \Omega(n^2 \log n)$ $\Theta(n^2 \log n^2)$ $\log n$

질문 2 : 가능성이 높은 근접 비교기를 선택하여 을 달성하는 비교기 게이트의 분포가 있습니까? $m = \tilde{O}(n)$

sorting-network

— 제프리 어빙
소스

한 번 에 하나의 입력을보고 유니온 경계를 설정 하여 상한을 얻을 수 있다고 생각 하지만 그 소리는 빡빡합니다.

O (n^{3} l o g^{O (1)})

$O(n^3log^{O(1)})$

— daniello

질문 2에 대한 아이디어 : 깊이

의 정렬 네트워크를 선택하십시오 . 각 단계에서 정렬 네트워크의 게이트 중 하나를 무작위로 선택하고 해당 비교를 수행하십시오.

단계 후에 , 제 1 층의 모든 게이트가 적용될 것이다. 또 다른

단계 후에 , 제 2 층의 모든 게이트가 적용될 것이다. 이것이 단조임을 보여줄 수 있다면 (정렬 네트워크의 중간에 추가 비교를 삽입해도 상처를 줄 수 없습니다)

의 해를 얻습니다

O (\log^{2} n)

$O(\log^2 n)$

\tilde{O} (n)

$\tilde{O}(n)$

\tilde{O} (n)

$\tilde{O}(n)$

\tilde{O} (n)

$\tilde{O}(n)$ 평균적으로 전체 비교기. 그러나 독점이 실제로 유지되는지 확실하지 않습니다.

— DW

@DW : 단 조성이 반드시 유지되는 것은 아닙니다. 고려 시퀀스

시퀀스

작품;

는 (입력 (1, 0, 0)을 고려하십시오)하지 않습니다. 아이디어는

\begin{array}{rcl} s & = & (x_{1}, x_{2}), (x_{0}, x_{2}), (x_{0}, x_{1}); \\ s^{'} & = & (x_{1}, x_{2}), (x_{0}, x_{1}), (x_{0}, x_{2}), (x_{0}, x_{1}) . \end{array}

$\begin{eqnarray*} s &=&(x_1, x_2), (x_0, x_2), (x_0, x_1);\\ s'&=&(x_1, x_2), \mathbf{(x_0, x_1)}, (x_0, x_2), (x_0, x_1).\end{eqnarray*}$

s

$s$

s^{'}

$s'$

(x_{0}, x_{2}), (x_{0}, x_{1})

$(x_0, x_2), (x_0, x_1)$

제외한 모든 입력을 정렬합니다 ( 여기 참조 ). 에서

해당 입력에 도달 할 수없는

. 에서

가 있습니다.

(0, 1, 0)

$(0, 1, 0)$

s

$s$

(x_{0}, x_{2}), (x_{0}, x_{1})

$(x_0, x_2), (x_0, x_1)$

s^{'}

$s'$

— 닐 영

각 단계에서 무작위로 두 개의 인접 변수

선택하여 네트워크가 선택된 변형을 고려하십시오 . 이제 인접성 스왑이 반전을 생성하지 않기 때문에 단조 로움이 유지됩니다. DW 내지 An의 아이디어 @ 적용 홀짝 정렬 네트워크 가지며,

라운드 : 홀수 라운드는 모든 인접한 비교

이 모든 인접한 비교에도 라운드에서, 홀수

짝수이다. 무작위 네트워크는 이 네트워크를 "포함"하므로

비교 에서 정확 합니다. (또는 뭔가 빠졌습니까?)

x_{i}, x_{i + 1}

$x_i, x_{i+1}$

n

$n$

i

$i$

i

$i$

O (n^{2} \log n)

$O(n^2\log n)$

— 닐 영

인접 네트워크의 단조 : 주어진

대해

합니다.

경우

라고 말

(

a, b \in {0, 1}^{n}

$a, b\in\{0,1\}^n$

j \in {0, 1, \dots, n}

$j\in\{0,1,\ldots,n\}$

s_{j} (a) = \sum_{i = 1}^{j} a_{i}

$s_j(a) = \sum_{i=1}^j a_i$

a ⪯ b

$a\preceq b$

s_{j} (a) \leq s_{j} (b)

$s_j(a) \le s_j(b)$

\forall j

$\forall j$ ). 비교 "

"을 수정하십시오 . 하자

와

에서 온 와

가 비교를 수행하여. 제 1 및 . 제 2 경우 다음 . 그런 다음 귀납적으로 표시하십시오 :

가 입력

의 비교 시퀀스

의 결과 인 경우

x_{i} < x_{i + 1}

$x_i < x_{i+1}$

a^{'}

$a'$

b^{'}

$b'$

a

$a$

b

$b$ $a' \preceq a$ $b' \preceq b$ $a\preceq b$ $a' \preceq b'$

y

$y$

s

$s$

x

$x$ 한

수퍼 - 시퀀스의 결과

의

에

후

. 따라서

가 정렬되면

됩니다.

y^{'}

$y'$

s^{'}

$s'$

s

$s$

x

$x$

y^{'} ⪯ y

$y' \preceq y$

y

$y$

y^{'}

$y'$

— 닐 영

다음은 bitonic sort에 적용된 DW의 아이디어를 기반으로 한 질문 2에 대한 경험적 데이터입니다. 들면 변수 선택 비례하는 확률을 , 다음 선택 비교기 얻기 위해 임의로 . 이것은 이 2의 거듭 제곱 인 경우 비교기의 분포를 비트 닉 정렬로 일치 시키며 그렇지 않으면 근사치입니다. $n$ $j - i = 2^k$ $\lg n - k$ $i$ $(i,j)$ $n$

이 분포에서 가져온 주어진 무한 시퀀스 게이트에 대해 많은 임의의 비트 시퀀스를 정렬하여 정렬 네트워크를 얻는 데 필요한 게이트 수를 근사화 할 수 있습니다. 여기서위한 것으로 추정의 평균 인계 와 게이트 서열 카운트를 근사화하기 위해 사용 가능한 비트 시퀀스가 : 일치 표시 , 바이 토닉 정렬 같은 복잡도. 그렇다면 우리는 각 게이트를 가로 질러 오는 쿠폰 수집기 문제로 인해 여분의 인자를 먹지 않습니다 . $n < 200$ $100$ $6400$ $\Theta(n \log^2 n)$ $\log n$

강조 : 만 사용하고 게이트의 예상 수 없습니다 대략적인 비트 시퀀스를 . 평균 필요한 게이트는 그 수가 증가을 수행을 위해 I를 사용하는 경우에는 , 및 시퀀스 추정은 , 및 . 따라서, 마지막 몇 개의 시퀀스를 얻는 것은 점근 적으로 복잡하지는 않지만 점근 적 복잡성을 증가시킬 수 있습니다. $6400$ $2^n$ $n = 199$ $6400$ $64000$ $640000$ $14270 \pm 1069$ $14353 \pm 1013$ $14539 \pm 965$

편집 : 여기에 최대 과 유사한 플롯이 있지만 정확한 게이트 수를 사용합니다 (샘플링과 Z3의 조합을 통해 계산). 나는 2의 거듭 제곱 에서 임의의 $n = 80$ $d = j-i$ 비례하는 확률로 $d \in [1,\frac{n}{2}]$ . 여전히 그럴듯 해 보입니다. $\frac{\log n - \log d}{d}$ $\Theta(n \log^2 n)$

— 제프리 어빙
소스

좋은 실험! 당신 만의 작은 부분 샘플링하고 있습니다 :하지만 쿠폰 컬렉터 문제는 여기에 발생할 수있는 다른 방법이

모든 입력에 정확성을 검증하기 위해 필요한 비트 시퀀스. 이 유형과 크기의 임의의 네트워크가 임의의 순열 whp를 정렬한다고 실험에서 (과학적으로는 물론 수학적으로는 아닙니다) 결론을 내릴 수 있습니다 . 또한 철저한보고 싶은데요

모두 랜덤 네트워크에 테스트

당신이 가서 기꺼이까지되는. (

은 사용하는 언어 및 하드웨어에 따라 너무 나쁘거나

일 수 있습니다).

2^{n}

$2^n$

2^{n}

$2^n$

n

$n$

n = 20

$n=20$

n = 30

$n=30$

— Joshua Grochow

정확히

까지는 동일하게 보이지만 결정적인 것으로 보지는 않습니다.

n = 27

$n = 27$

— 제프리 어빙

@JoshuaGrochow : 정확한 값을

까지 추가했습니다 .

n = 80

$n = 80$

— Geoffrey Irving

좋은! 그래도 정확한 데이터에 대한 확산이 증가하고있는 것으로 보이며, 이는 추가 인자

? (즉, "스프레드"가

비율로 증가하는 경우 )

\log n

$\log n$

\log n

$\log n$

— Joshua Grochow

네, 추가 요인을 배제 할 수는 없습니다. 그래도

인 경우 놀랐 습니다

에서 최대

있고 상수는 의심 할 여지없이

가깝습니다 . 이 시점에서 나는 이론이 이어져야한다고 생각한다. :)

\log n

$\log n$

\lg n \approx 6

$\lg n \approx 6$

1

$1$

— Geoffrey Irving