“정말 어려운 문제는 어디에 있습니까?” 주제에 대한 현재의 아이디어는 무엇입니까?


27

나는 이 논문 이 매우 흥미로웠다는 것을 알았다 . 요약하자면, 실제로 NP 완료 문제가 최악 인 경우는 거의 없습니다. 이 기사의 개념은 인스턴스가 일반적으로 매우 부족하거나 지나치게 제한되어 있으며, 둘 다 비교적 해결하기 쉽다는 것입니다. 그런 다음 몇 가지 문제에 대해 '제약성'척도를 제안합니다. 이러한 문제는 해의 가능성이 0에서 100 %로 '위상 전이'인 것으로 보입니다. 그런 다음 가설을 세웁니다.

  1. 모든 NP- 완료 (또는 모든 NP 문제) 문제는 '제약성'척도를 갖습니다.
  2. 각 NP- 완전 문제에 대해 '제약성'의 함수로 솔루션이 존재할 확률에 대한 그래프를 작성할 수 있습니다. 또한,이 그래프에는 그 확률이 ​​빠르고 극적으로 증가하는 위상 전이가 포함됩니다.
  3. NP- 완전 문제의 최악의 예는 그 위상 전이에 있습니다.
  4. 위상 전이에 문제가 있는지의 여부는 한 NP- 완전 문제를 다른 것으로 전이함에 따라 변하지 않는다.

이 논문은 1991 년에 출판되었다. 나의 질문은 지난 25 년간이 아이디어에 대한 후속 연구가 있 었는가? 그렇다면 현재의 주류 사고는 무엇입니까? 그들이 정확하고, 부정확하고, 관련이없는 것을 발견 했습니까?


CCS, k-sat, k-coloring의 무작위 사례는 TCS 커뮤니티에서 광범위하게 연구되었습니다. 예를 들어, 특정 문제를 효율적으로 해결할 수있는 밀도 / '제약성'은 솔루션 존재 가능성이 1에서 0whp로 갈 확률이 임계 값보다 낮다는 사실이 많은 관심을 끌었습니다.
JWM

'쉬운 용해성'의 문턱은 어느 정도의 확률로 놓여 있습니까 (대략 말하기)? 0.2 이상 0.001 이상입니까?
dimpol

1
@dimpol은 일반적으로 정확한 임계 값을 정의하지 않습니다. 요점은 입력 크기에 따라 "제한"이 확률이 0 또는 1이되는 지점입니다. 일반적인 설명은 "알고리즘 A는 적어도 확률로 변수와 절을 갖는 임의의 3-SAT 인스턴스를 해결합니다 . 여기서 은 과 함께 1이됩니다 ." 임계 값은 확률이 0에서 1로 ΔΔ
변하는

아이디어는 일반적으로 매우 영향력이 있고이 주제와 관련된 매우 많은 논문이 있으며 연구는 계속되고 있다고 생각합니다. 그러나 위상 천이는 물리학에서 더 많이 나오고 (MAT가 아래 답변을 참조하십시오) 컴퓨터 과학자들이 그 중요성에 대해 조금 더 회의적 일 수 있기 때문에 크로스 커팅 개념이며, 아마도 실험적 / 실험적 개념 일 수도 있습니다. 다른 사람들이이 의견에 동의하면 일부 pt에서 답변을 시도 할 수도 있지만, 지금은 이론적 컴퓨터 과학 채팅
고장 할 것입니다

1
또한 참조 흔한 NP 완전 문제에 상전이 방법 . 또한 Walsh 1998 의 제한 칼날 이 중요하고 전환점과 관련이 있지만 정확히 동일한 개념은 아니지만 많은 부분에서 추적되지 않았다고 생각합니다.이 논문은 프랙탈을 직접 언급하지는 않지만 참조에 대해 암시 적으로 생각합니다. 자기 유사성, 규모
불일치

답변:


26

다음은 유한 및 알고리즘 모델 이론 워크샵 (2012)에서 Vardi 의 프레젠테이션을 기반으로 한 상태에 대한 대략적인 요약입니다 .

경질 실체는 부족한 영역에서 지나치게 제한적인 영역으로의 위상 전이에있는 것으로 관찰되었습니다. 근본적인 추측은 위상 전이와 NP 문제의 계산 복잡성 사이에 강한 연관성이 있다는 것입니다.

Achlioptas–Coja-Oghlan은 솔루션 공간이 기하 급수적으로 많은 작은 클러스터로 산산되는 satisfiabe 영역에 밀도가 있음을 발견했습니다. Vinay Deolalikar 는 산산조각이 계산 경도를 암시한다는 가정하에 를 증명하려는 유명한 시도를 기반으로했습니다 . Deoralikar의 증명은 XOR-SAT가 있고 산산이 부서진다는 사실에 반박했습니다 . 따라서 산산조각을 사용하여 계산 경도를 증명할 수 없습니다.P

현재의 주류 사고는 Vardi가 언급 한 것처럼 위상 전이가 본질적으로 계산 복잡성과 관련이없는 것으로 보인다.

마지막으로, K-SAT의 상 전이와 계산 경도 사이의 연결을 조사하는 Nature에 출판 된 기사가 있습니다.


개요에 감사드립니다. 이로 인해 실질적인 혁신이 이루어지지 않았습니다.
dimpol

1
나는 산산이 부서지는 현상이 NP-hard 문제에 대한 많은 휴리스틱 알고리즘의 기반 인 로컬 검색 기반 알고리즘 클래스를 배제하는 것으로 간주 될 수 있다고 생각합니다.
Kaveh

3
Vardi에 의한 유사 / 약간 수정 된 대화 / 비디오, 위상 전이 및 계산 복잡성 , 밴프 국제 연구소
vzn

@vzn Nice, Vardi의 비디오를 시청해야합니다.
Mohammad Al-Turkistany 2012 년

14

그렇습니다. Cheeseman, Kanefsky 및 Taylor의 1991 년 논문 이후 많은 작업이있었습니다.

NP-Complete 문제의 위상 전이에 대한 리뷰를 검색하면 많은 결과를 얻을 수 있습니다. 그러한 검토 중 하나는 Hartmann과 Weigt [1]입니다. 더 높은 수준의 소개는 Brian Hayes American Scientist 기사 [2] [3]를 참조하십시오.

Cheesemen, Kanefsky 및 Taylor의 1991 년 논문은 컴퓨터 과학자들이 수학 문헌에주의를 기울이지 않는 불행한 사례입니다. 치즈 만, 카 네프 스키, 테일러의 논문에서 그들은 해밀턴 사이클 (Hamiltonian Cycle)이 임계 임계치 근처에서 검색 비용을 픽업하여 위상 전이를 갖는 것으로 식별했다. 그들이 사용한 랜덤 그래프 모델은 Erdos-Renyi 랜덤 그래프 (고정 된 가장자리 확률 또는 동등하게 가우스도 분포)였습니다. 이 사례는 Cheeseman 등의 1991 년 논문 이전에이 임계 값의 임계 값 또는 그 근처에서도이 클래스의 그래프에 대해 거의 확실한 다항식 시간 알고리즘이 알려진 것으로 잘 연구되었습니다. Bollobas의 "Random Graphs"[4]는 좋은 참고 자료입니다. 내가 믿는 최초의 증거는 Angliun and Valiant [5]에 의해 Bollobas, Fenner 및 Frieze [6]에 의해 개선되었습니다. 치즈 맨 이후

랜덤 Erdos-Renyi 랜덤 그래프에서 해밀턴 사이클에 대한 위상 천이는 해답을 찾을 확률의 빠른 천이가 있다는 의미에서 존재하지만 이것은 해밀턴 사이클을 찾는 "내재적"복잡성의 증가로 해석되지는 않습니다. 이론과 실제에서 중요한 전이에서도 Erdos-Renyi 랜덤 그래프에서 Hamiltonian Cycles를 찾기위한 다항식 시간 알고리즘이 거의 확실합니다.

설문 조사 전파 [8]는 임계 임계 값에 매우 근접한 임의의 3-SAT에 대한 만족스러운 사례를 찾는 데 큰 성공을 거두었습니다. 내 현재 지식은 조금 녹슬 기 때문에 임계 임계 값 근처에서 만족스럽지 않은 경우에 대해 "효율적인"알고리즘을 찾는 데 큰 진전이 있는지 확실하지 않습니다. 내가 아는 한 3-SAT는 만족스럽고 임계 임계 값에 가깝지만 만족할 수없는 임계 임계 값 근처에서 알 수없는 (또는 어려운?) 경우 해결하기 쉬운 경우 중 하나입니다.

내 지식은 지금 조금 나왔지만 마지막 으로이 주제를 자세히 살펴보면 나에게 눈에 띄는 몇 가지가있었습니다.

  • Hamiltonian Cycle은 Erdos-Renyi 랜덤 그래프에 대해 "쉬운"입니다. 어려운 문제는 어디에 있습니까?
  • 숫자 분할은 거의 확실한 확률 0 또는 1 영역에서 매우 멀어도 해결할 수 있어야하지만 중간 크기의 인스턴스 크기에 대해서도 효율적인 알고리즘이 없습니다 (내가 아는 한, 각각 500 비트의 1000 수는 최신 알고리즘). [9] [10]
  • 3-SAT는 임계 임계 값 근처의 만족할 수있는 인스턴스, "수백만 개의 변수"인 경우에도 중요하지만 임계 임계 값 근처의 만족할 수없는 인스턴스에는 어렵습니다.

나는 동료 검토 논문을 출판하지 않았으므로 논문을 여기에 포함시키는 것을 망설이고 논문을 작성했습니다.주제에. 기본적으로 "본질적으로 어려운"가능한 임의의 앙상블 클래스 (해밀턴 사이클, 숫자 분할 문제 등)는 "스케일 불변성"속성을 갖는 것입니다. Levy-stable distribution은 power law tail을 갖는이 품질을 가진 가장 자연스러운 분배 중 하나이며, 어떻게 든 Levy-stable distribution을 포함하는 NP-Complete 앙상블에서 random instance를 선택할 수 있습니다. 정규 분포 (즉, Erdos-Renyi) 대신 Levy-stable degree 분포로 무작위 그래프를 선택하면 본질적으로 어려운 Hamiltonian Cycle 인스턴스를 찾을 수 있다는 약한 증거가 있습니다. 다른 것이 없다면 적어도 일부 문헌 검토의 출발점을 제공 할 것입니다.

[1] AK Hartmann 및 M. Weigt. 조합 최적화 문제의 위상 전이 : 기본, 알고리즘 및 통계 역학. Wiley-VCH, 2005.

[2] B. 헤이즈. 가장 어려운 문제입니다. 미국 과학자, 90 (2), 2002.

[3] B. 헤이즈. 임계 값에서 미국 과학자, 91 (1), 2003.

B. 볼로 바스. 랜덤 그래프, 제 2 판. 2001 년 뉴욕 ​​캠브리지 대학 출판부

D. Angluin과 LG Valiant. 해밀턴 회로 및 매칭을위한 빠른 확률 알고리즘. J. 컴퓨터, Syst. Sci., 18 : 155–193, 1979.

[6] B. Bollobás, TI Fenner 및 AM Frieze. 랜덤 그래프에서 해밀턴 경로와 사이클을 찾기위한 알고리즘. Combinatorica, 7 : 327–341, 1987 년.

[7] B. Vandegriend와 J. Culberson. 해밀턴 사이클 문제에서는 G n, m 위상 전이가 어렵지 않습니다. J. of AI Research, 9 : 219–245, 1998.

A. 브라운 슈타인, M. Mézard, R. Zecchina. 설문 조사 전파 : 만족도 알고리즘. 무작위 구조와 알고리즘, 27 : 201–226, 2005.

[9] I. Gent와 T. Walsh. 숫자 분할을위한 휴리스틱 분석. 전산 지능, 14 : 430–451, 1998.

[10] CP Schnorr 및 M. Euchner. 격자 기준 감소 : 실용적인 알고리즘 개선 및 부분합 합 문제 해결. 계산 이론의 기초 론 '91, L. Budach, ed., 컴퓨터 과학 강의 노트, 529 권, 68 ~ 85 쪽, 1991 년.


0

25 년간의 연구와 현재 아이디어는 어디에 있습니까?

+++ 아이디어 1 :

만족도 해결 경험에서 실제로 우리가 해결하려고하는 공식에 유효한 k 절을 추가하는 것이 (nk) 변수 qbf를 결정하는 것과 유사하다는 것을 알았습니다.

그것은 NP에 대한 현재의 sat 해결 방법이 pspace-hard임을 보여주는 접근법 인 것 같습니다!

+++ 아이디어 2 :

또 다른 아이디어는 AllQBF 문제가 부울 계층의 실제 문제라는 것입니다. AllQBFs 문제는 다음과 같습니다. 수식 R의 모든 2 ^ n qbfs를 결정하는 부울 식 Q를 생성합니다. 원래 수식 R이 모노톤 또는 2-cnf 인 경우 AllQBF는 쉽습니다.

Q가 종종 지수이기 때문에 AllQBF는 QBF가 Exp라는 것을 나타내는 그럴듯한 길처럼 보입니다. 따라서 Q 할당 (원래 공식 R의 정량화)을 평가하는 것은 지수입니다. 따라서 NP를 증명하는 길에는 Exp가 적어도 몇 개의 벽돌이 있습니다.

+++ 아이디어 3 : 일반 k-cnfs

Btw에서 모든 위상 전이 연구는 정규 k-cnfs를 놓쳤습니다. 여기서 정규 그래프와 유사하게 변수의 발생 횟수는 어느 방향 으로든 고정되어 있습니다. 정규 k-cnfs는 표준 모델보다 훨씬 더 어렵습니다 모든 변수가 제약 조건에서 동일하게 보이기 때문입니다.

25 년 전, 치즈 맨을 읽은 직후, 나는 모든 변수가 동일하게 보이기 때문에 정규 그래프 색상에 중점을 두었습니다. 그래서 나는 여기에서 나의 대답 특권을 남용하고, 25 년 동안의 결과를 정규 그래프로 보여줄 것입니다!

+++ 아이디어 4 : 만족도 벤치 마크 연구를위한 골든 포인트

나는 D 정규 N 정점 그래프의 C 채색을 상당히 광범위하게 연구했습니다. 다음 표는 일반 그래프 색상에 대한 골든 포인트 결과를 요약 한 것입니다.

높은 확률의 경우 N 개의 임의 인스턴스가 만족되었습니다. 매우 높을 경우, N ^ 2는 만족할 만했다. Super High의 경우 N ^ 3 개의 임의 인스턴스가 만족되었습니다.

높은 확률 (1-1 / N) 황금 채색 포인트는 다음과 같습니다.

C3D5N180 C4D6N18 C4D7N35 C4D8N60 C4D9N180? C5D10N25 C5D11N42 C5D12N72

매우 높은 확률 (1-1 / (N ^ 2)) 황금 채색 포인트는 다음과 같습니다.

C3D5N230? C4D6N18 C4D7N36 C4D8N68 C4D9N ??? C5D10N32 C5D11N50 C5D12N78

초고 확률 (1-1 / (N ^ 3)) 황금 채색 포인트는 다음과 같습니다.

C3D5N ??? C4D6N22 C4D7N58 C4D8N72? C4D9N ??? C5D10N38 C5D11N58 C5D12N ??

C4D9 항목은 9도 그래프의 4 가지 색상을 나타냅니다. 이것들은 25 년간의 문제 해결에서 겪은 가장 어려운 무작위 4cnfs입니다. 나는 최근 10 일 동안의 CPU 시간 후에 172 개의 정점 9도 그래프를 채색했습니다.

+++ 아이디어 5 : C5D16N ???? 골든 포인트는 약간 존재한다고 추측됩니다.

감사합니다. Daniel Pehoushek


4
이것은 미공개 연구를 발표하기에 적합한 장소가 아닙니다. 모든 것을 자세히 설명하는 종이를 작성하고 arxiv 또는 다른 곳에 놓고 요약과 함께 여기에 링크를 게시하십시오.
Sasho Nikolov

C4D9 정규 그래프 채색 점은 문제의 제목에 따라 극도로 어려운 점입니다. 약간의 맥락이 필요했기 때문에 나머지 테이블이 필요했습니다.
다니엘 pehoushek
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.