무작위 표본에서 Kolmogorov 복잡성의 예상 값


9

Kolmogorov 문자열의 복잡성은 계산할 수 없습니다. 그러나, 사이즈의 임의의 서브 세트에서 길이의 이진 스트링의 , 얼마나 적은 일부 정수보다 복잡성을 가질 것으로 기대된다 이하 (의 함수로서 , 및 )?Mnn0nMnn0


여기서 "표준"Kolmogorov 복잡성을 사용하고 있습니까, 아니면 접두사를 복잡합니까?
Aubrey da Cunha

실제로 나는 Kolmogorov의 복잡성만을 생각하고있었습니다. 모든 문자열의 우주를 고려할 때 domotorp이 언급 한 경계를 추측했습니다 . 크기 의 임의의 무작위 하위 집합에 대한 '일관된'결과 가 생성 될 수 있는지는 확실하지 않았습니다 . 그러나 접두사 복잡성으로 인해 다른 관점이 생길까요? 2noM
vs

확실히 크기의 순서를 변경하지는 않을 것입니다. 사실 이제 내 대답은 두 버전 모두에 묶여 있다고 생각합니다.
domotorp

1
모든 및 모든 에 대해 임의의 비트 문자열 에 Kolmogorov 복잡도 가 있을 확률 은 보다 큼 ( ) . 따라서 문자열 의 무작위 분포에서는 인 문자열을 . 직관적으로 문자열을 선택할 확률은 매우 높습니다 Kolmogorov의 복잡성으로 인해 ncnxK(x)nc112cc=nn0MM2(nn0)K(x)<n0
Marzio De Biasi

답변:


10

Kolmogorov의 복잡성은 부가적인 상수까지만 결정되므로 정확한 답을 줄 수는 없습니다. 여기서 설명하는 범위는 훨씬 약합니다.

물론 얼마나 많은 문자열이 보다 작은 복잡성을 가지고 있는지 알고 나면 예상 수를 쉽게 계산할 수 있습니다 . 일반적으로 Kolmogorov의 복잡성에 대한 첫 번째 진술은이 수가 최대 이라는 것입니다. 길이가 더 작은이 문자열 만 많기 때문입니다. 반면에, 프로그램이 "길이 의 번째 숫자를 취함 "이라고하면 보다 작은 문자열을 . 여기서 은 Kolmogorov의 프리픽스 프리 버전 복잡성 (최대2nn02n01nx2n0K(n)Cn0K(n)nlogn+logn+O(1)). 구체적으로는, 문자열은 제 입력 촬영하는 튜링 기계의 설명 포함 p가 출력하는 프리픽스없는 프로그램에 대한 설명이고, 은이 출력 길이 일 수 이고, 비트 그런 다음 가 뒤에옵니다 .pxnxnO(1)px

아마도 이러한 범위를 향상시킬 수는 있지만 정확한 답변을 얻을 수 있을지는 의문입니다.


'프로그램에 "길이 n, x 번째 숫자를 취하십시오"라고 표시되어있는 경우에 대해 조금 설명해 주시겠습니까?
vs

당신이 옳습니다, 접두사가 없어야합니다, 수정했습니다.
domotorp

3

정확한 답을 줄 수 있습니다. 최대 (일반) 복잡도를 갖는 길이 의 문자열 수 는 이며 상수까지입니다. 따라서 무작위로 부분 집합을 선택하는 프로세스는 합리적인 확률로 미만의 복잡도의 문자열의 부분을 . 우리의 주장을 보여주기 위해, 와 같은 복잡성을 갖는 스트링의 수 또한 주어짐 을 보여 주면 충분합니다 . 1에서 까지 대한이 값의 합을 결정하여 필요한 결과를 보여줄 수 있습니다.nn020케이(0|)2케이(0|)+영형(1)0케이2케이케이(케이|)케이0. 이를 표시하기 위해, 우리는 (. 인해 B. Bauwens 및 A. 쉔에 보통 복잡성하는 가산 결과를 이용해 일반 콜 모고 로프 복잡도에 대한 가산 정리 :. 297-302 2013 2월 컴퓨팅 시스템의 이론, 52 (2)) 여기서 접두사가없는 Kolmogorov 복잡성을 나타냅니다. 선택하면 복잡성 의 각 비트 문자열 에 대해 따라서 이러한 각 대해 입니다. 하자

C(a,b)=K(a|C(a,b))+C(b|a,C(a,b))+O(1).
K()a=nnbk
k=C(b)=C(n,b)+O(1)=K(n|k)+C(b|n,k)+O(1).
bC(b|n,k)=kK(n|k)+O(1)k=kK(n|k). 이제 그러한 문자열 가 최대 이고, 길이가 사전 순으로 첫 번째 문자열 각각이 만족 한다는 것을 알 수 있습니다 . 따라서 는 시킵니다.O(2k)b2knC(b|n,k)k+O(1)Ω(2k)C(b|n,k)=k+O(1)
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.