무작위 표본에서 Kolmogorov 복잡성의 예상 값

Kolmogorov 문자열의 복잡성은 계산할 수 없습니다. 그러나, 사이즈의 임의의 서브 세트에서 길이의 이진 스트링의 , 얼마나 적은 일부 정수보다 복잡성을 가질 것으로 기대된다 이하 (의 함수로서 , 및 )? $M$ $n$ $n_{0}$ $n$ $M$ $n$ $n_{0}$

cc.complexity-theory kolmogorov-complexity

— vs
소스

여기서 "표준"Kolmogorov 복잡성을 사용하고 있습니까, 아니면 접두사를 복잡합니까?

— Aubrey da Cunha

실제로 나는 Kolmogorov의 복잡성만을 생각하고있었습니다. 모든 문자열의 우주를 고려할 때 domotorp이 언급 한 경계를 추측했습니다 . 크기 의 임의의 무작위 하위 집합에 대한 '일관된'결과 가 생성 될 수 있는지는 확실하지 않았습니다 . 그러나 접두사 복잡성으로 인해 다른 관점이 생길까요?

2^{n_{o}}

$2^{n_{o}}$

M

$M$

— vs

확실히 크기의 순서를 변경하지는 않을 것입니다. 사실 이제 내 대답은 두 버전 모두에 묶여 있다고 생각합니다.

— domotorp

모든 및 모든 에 대해 임의의 비트 문자열 에 Kolmogorov 복잡도 가 있을 확률 은 보다 큼 ( ) . 따라서 문자열 의 무작위 분포에서는 인 문자열을 . 직관적으로 문자열을 선택할 확률은 매우 높습니다 Kolmogorov의 복잡성으로 인해

n

$n$

c

$c$

n

$n$

x

$x$

K (x) \geq n - c

$K(x) \geq n-c$

1 - \frac{1}{2^{c}}

$1 - \frac{1}{2^c}$

c = n - n_{0}

$c = n-n_0$

M

$M$

\frac{M}{2^{(} n - n_{0})}

$\frac{M}{2^(n-n_0)}$

K (x) < n_{0}

$K(x) \lt n_0$

— Marzio De Biasi

답변:

Kolmogorov의 복잡성은 부가적인 상수까지만 결정되므로 정확한 답을 줄 수는 없습니다. 여기서 설명하는 범위는 훨씬 약합니다.

물론 얼마나 많은 문자열이 보다 작은 복잡성을 가지고 있는지 알고 나면 예상 수를 쉽게 계산할 수 있습니다 . 일반적으로 Kolmogorov의 복잡성에 대한 첫 번째 진술은이 수가 최대 이라는 것입니다. 길이가 더 작은이 문자열 만 많기 때문입니다. 반면에, 프로그램이 "길이 의 번째 숫자를 취함 "이라고하면 보다 작은 문자열을 . 여기서 은 Kolmogorov의 프리픽스 프리 버전 복잡성 (최대 $2^n$ $n_0$ $2^{n_0}-1$ $n$ $x$ $2^{n_0-K(n)-C}$ $n_0$ $K(n)$ $n$ $\log n+\log^* n + O(1)$ ). 구체적으로는, 문자열은 제 입력 촬영하는 튜링 기계의 설명 포함 p가 출력하는 프리픽스없는 프로그램에 대한 설명이고, 은이 출력 길이 일 수 이고, 비트 그런 다음 가 뒤에옵니다 . $px$ $n$ $x$ $n$ $O(1)$ $px$

아마도 이러한 범위를 향상시킬 수는 있지만 정확한 답변을 얻을 수 있을지는 의문입니다.

— 도모토
소스

'프로그램에 "길이 n, x 번째 숫자를 취하십시오"라고 표시되어있는 경우에 대해 조금 설명해 주시겠습니까?

— vs

당신이 옳습니다, 접두사가 없어야합니다, 수정했습니다.

— domotorp

정확한 답을 줄 수 있습니다. 최대 (일반) 복잡도를 갖는 길이 의 문자열 수 는 이며 상수까지입니다. 따라서 무작위로 부분 집합을 선택하는 프로세스는 합리적인 확률로 미만의 복잡도의 문자열의 부분을 . 우리의 주장을 보여주기 위해, 와 같은 복잡성을 갖는 스트링의 수 또한 주어짐 을 보여 주면 충분합니다 . 1에서 까지 대한이 값의 합을 결정하여 필요한 결과를 보여줄 수 있습니다. $n$ $n_0$ $2^{n_0 - K(n_0|n)}$ $2^{-K(n_0|n) + O(1)}$ $n_0$ $k$ $2^{k - K(k|n)}$ $k$ $n_0$ . 이를 표시하기 위해, 우리는 (. 인해 B. Bauwens 및 A. 쉔에 보통 복잡성하는 가산 결과를 이용해 일반 콜 모고 로프 복잡도에 대한 가산 정리 :. 297-302 2013 2월 컴퓨팅 시스템의 이론, 52 (2)) 여기서 접두사가없는 Kolmogorov 복잡성을 나타냅니다. 선택하면 복잡성 의 각 비트 문자열 에 대해 따라서 이러한 각 대해 입니다. 하자

C (a, b) = K (a | C (a, b)) + C (b | a, C (a, b)) + O (1) .

$C(a,b) = K(a|C(a,b)) + C(b|a,C(a,b)) + O(1).$

K (\cdot)

$K(\cdot)$

a = n

$a = n$

n

$n$

b

$b$

k

$k$

k = C (b) = C (n, b) + O (1) = K (n | k) + C (b | n, k) + O (1) .

$k = C(b) = C(n,b) + O(1) = K(n|k) + C(b|n,k) + O(1).$

b

$b$

C (b | n, k) = k - K (n | k) + O (1)

$C(b|n,k) = k - K(n|k)+O(1)$

k^{'} = k - K (n | k)

$k' = k - K(n|k)$ . 이제 그러한 문자열 가 최대 이고, 길이가 사전 순으로 첫 번째 문자열 각각이 만족 한다는 것을 알 수 있습니다 . 따라서 는 시킵니다.

O (2^{k^{'}})

$O(2^{k'})$

b

$b$

2^{k^{'}}

$2^{k'}$

n

$n$

C (b | n, k) \leq k^{'} + O (1)

$C(b|n,k) \le k' + O(1)$

Ω (2^{k^{'}})

$\Omega(2^{k'})$

C (b | n, k) = k^{'} + O (1)

$C(b|n,k) = k' + O(1)$

— 브루노 바우 웬스
소스