CNF 공식의 무작위성 측정


12

CNF 공식은 무작위 대 구조의 두 가지 클래스로 나눌 수 있다는 것이 널리 알려져 있습니다. 랜덤 CNF 공식과 반대로 구조화 된 CNF 공식은 우연히 일어날 가능성이없는 패턴을 보여주는 일종의 순서를 나타냅니다. 그러나 어느 정도의 무작위성을 나타내는 구조화 된 수식 (예 : 특정 특정 절 그룹은 다른 것보다 훨씬 덜 구조화 된 것처럼 보입니다)뿐만 아니라 일부 약한 구조 형식을 가진 임의의 수식 (예 : 특정 특정 절 그룹은 다른 것보다 덜 무작위 적 인 것처럼 보입니다) ). 따라서 수식의 무작위성은 예 / 아니요 사실이 아닙니다.

하자 CNF 식 주어진 것을 함수일 F F 사이의 실수 값 반환 01 : 포괄적 0 동안 수단 순수한 구조화 화학식 1 개 수단 순수 랜덤 식.r:F[0,1]FF0101

누군가가 이제까지 그런를 발명하기 위해 노력하고 있습니다 궁금 . 물론 r에 의해 반환되는 가치는 (이것은 적어도 제 의도입니다) 탄탄한 이론적 진실보다는 합리적인 기준에 따라 실제적인 측정 일 것입니다.rr

또한 의 정의에 사용 되거나 수식의 다른 유용한 전체 속성을 결정 하는 데 사용할 수있는 통계 지표를 정의하고 연구 한 적이 있는지 알고 싶습니다 . 통계 지표로 나는 다음과 같은 것을 의미합니다.r

  1. HCV는 (히트는 분산 카운트)

    하자 변수를 지정해, 그 함수가 될 V의 JN , 횟수를 반환 v에 J의 에 나타납니다 F를 . VF에 사용 된 변수 세트라고 합시다 . ˉ h F = 1 이라고하자hF:NNvjNvjFVF는 AHC (Average Hit Count)입니다. HCV는 다음과 같이 정의됩니다. HVC=1h¯F=1|V|vjVhF(vj)

    임의의 경우 HCV는 매우 낮고 (모든 변수는 거의 같은 횟수로 언급 됨) 구조화 된 인스턴스에서는 그렇지 않습니다 (일부 변수는 매우 자주 사용되며 일부는 그렇지 않습니다. 즉 "사용 클러스터"가 있습니다.HVC=1|V|vjV(hF(vj)h¯F)2



  2. AID는 (평균 불순물 학위)를

    보자 횟수 될 v에 j는 긍정적 발생하고 할 시간을 - F ( V의 J ) 가 음의 발생 횟수를. 하자 난을 : N을[ 0 , 1 ] 함수일 가변 주어진 것을 브이 JV , 그 ID (불순물 대학교)를 반환한다. 함수 i ( v j ) 는 다음과 같이 정의됩니다. i (hF+(vj)vjhF(vj)i:N[0,1]vjVi(vj) . 양의 시간의 절반과 음의 시간의 절반에 해당하는 변수는 최대 불순물 정도를 갖는 반면, 항상 양의 또는 항상 음에 발생하는 변수 (즉, 순수 리터럴)에는 최소 불순물이 있습니다. AID는 간단히 다음과 같이 정의됩니다. AID=1i(vj)=2min(hF+(vj),hF(vj))hF(vj)

    임의의 경우 (적어도 확률이0.5 인변수를 부정하여 생성 된 경우), AID는 거의1이지만, 구조화 된 경우에는 일반적으로1과거리가 멀습니다.AID=1|V|vjVi(vj)

    0.511

  3. IDV (불순도 변화)

    IDV는 확률이 아닌 변수를 부정하여 생성 된 임의의 인스턴스를 설명하기 때문에 AID 단독보다 더 강력한 지표 입니다. 다음과 같이 정의됩니다 : I D V = 10.5

    임의의 경우에 IDV는0(모든 변수가 동일한 확률로 무시되기 때문에)이지만 구조화 된 인스턴스에서는0과거리가 멀습니다. IDV=1|V|vjV(i(vj)AID)2

    00

동기 부여

  1. CNF 공식의 작동 방식, 무작위 / 구조 측정 방법, 통계 지표를 통해 다른 유용한 전체 속성을 추론 할 수있는 경우, 이러한 지표를 사용하여 검색 속도를 높이는 방법 및 방법을 이해합니다.
  2. 통계 지표를 현명하게 조작하여 CNF 공식의 만족도 (또는 솔루션 수)를 유추 할 수 있는지 궁금합니다.

질문

  1. CNF 공식의 무작위성을 측정하는 방법을 제안한 사람이 있습니까?
  2. CNF 공식의 유용한 전체 속성을 연구하거나 기계적으로 추론하는 데 사용할 수있는 통계 지표를 제안한 사람이 있습니까?

1
이 답변의 논문을 참조하십시오 ( cstheory.stackexchange.com/questions/4321/… ). 그것은 당신에게 그러한 r을 정의하는 방법에 대한 팁을 줄 수 있습니다
Marcos Villagra

1
비트 문자열의 임의성을 측정하기에 가능한 관련 논의는 mathoverflow.net/questions/37518/...
야로 슬라브 Bulatov에게

한동안 혼자서이 일을 해왔 기 때문에 나는 이것을 많이 말할 수 있습니다. SAT를 고려하면 1과 2에 대한 공식은 지수입니다. 반면 k-SAT의 경우 1과 2의 공식은 다항식입니다. 이것은 RANDOM K-SAT 질문의 정확한 정의와 관련이 있으며, 아무도 대답하고 싶지 않은 것 같습니다.
Tayfun Pay

@Geekster : 여기에 답변을 하시겠습니까?
Hsien-Chih Chang 張顯 之

@Geekster : "... 1과 2의 공식은 지수" 란 무엇입니까?
Giorgio Camerani

답변:


3

나는 "무작위"구조가 더 대칭 적이라는 물리학적인 직관을 빌릴 것을 제안합니다. CNF에 대한 대칭은 변수가 변형되지 않도록하는 변수의 변환입니다. 해당 기준에 따라 다음과 같은 3 가지 변수의 기능

x1x2x3.

또는 말하기

(x1x2¬x3)(x1¬x2x3)(¬x1x2x3)(¬x1¬x2¬x3).

말보다 덜 무작위입니다

(x1x2¬x3)(x1¬x2x3)(¬x1¬x2x3).

일반적으로 유한 구조에 대한 "무작위"개념을 정의하는 것은 어려운 일입니다. 역사적으로 가장 간단한 유한 구조 인 바이너리 시퀀스에서 시도되었습니다. 예를 들어, 직관적으로 01010101 시퀀스는 01001110보다 "임의의 랜덤"이 아닙니다. 그러나 유한 한 랜덤 시퀀스 의 형식적인 정의가 일관되지 않음을 금방 깨달았습니다 ! 그러므로, 유한 한 구조에 대한 임의성 척도를 정의하려는 순진한 시도에 회의적이어야한다.


나는 "구조는 대칭의 존재를 의미하지만 무작위성은 대칭의 부재를 의미한다" 라는 직관에 전적으로 동의 한다 . 당신은 참조 구문 (반면에 대칭 의미 대칭이 그 기능을 변경하지만 변경되지 않은 솔루션 공간을 떠나). 저는 항상 대칭이 핵심이라는 것을 확신했습니다.
Giorgio Camerani

1
@Walter : 대칭이라는 개념은 알고리즘보다는 대수를 활용하려는 시도입니다. 알고리즘 복잡성은 유한 객체에 대한 일관된 정의를 무시하는 척도입니다. 이 Feel로 그냥 ... 주변의 문제를 밀어 좋아 - 그러나 우리는 (을 Negate 하나의 변수을 Negate이가하는 것보다 간단 것으로, 예를 들어, 변환) 각 요소에 할당 복잡도 측정 할 수있는 그룹이
Tegiri Nenashi
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.