탐욕 추측이 왜 그렇게 어려운가?


14

나는 최근 최단 슈퍼 스트링 문제 에 대한 욕심 추측에 대해 배웠다 .

이 문제에서 우리는 문자열의 집합 주어진 우리는 발견 할 짧은 superstring 예와 같은 각 의 문자열로 나타납니다 .s1,,sn ssis

이 문제는 NP-hard이며 긴 논문 시퀀스 후에이 문제에 대해 가장 잘 알려진 근사 알고리즘은 [Paluch '14] 의 비율을 갖습니다 .2+1130

실제로 생물 학자들은 다음 Greedy 알고리즘을 사용합니다.

각 단계에서 모든 쌍에 대해 최대 겹치는 두 문자열 (다른 문자열의 접두사 인 최대 접미사)을 병합 하고 하나의 문자열 만 남을 때까지 (모든 입력 문자열의 슈퍼 스트링 인)이 새 인스턴스에서 반복하십시오. )

이 Greedy Algorithm의 근사 비율에서 하한 는 입력 있습니다.2c(ab)k,(ba)k,(ab)kc

흥미롭게도, 이것이 최악의 예라고 생각합니다. 즉 Greedy는 최단 슈퍼 스트링 문제에 대해 근사치를 달성합니다 . 그런 자연스럽고 쉬운 알고리즘이 분석하기가 어렵다는 것을 알고 매우 놀랐습니다.2

이 질문이 왜 어려운지 암시하는 직관, 사실, 관찰, 예가 있습니까?


7
그 이유 중 하나는 문제의 표준 그래프 표현 (예 : Monge 및 Triple 불평등)의 알려진 속성이 욕심 많은 추측을 증명하기에 충분하지 않기 때문일 수 있습니다. 예를 들어 Laube, Weinard "조건부 불평등과 가장 짧은 공통 수퍼 스트링 문제"및 Schinger, Weinard, "욕심이없는 수퍼 스트링 추측"을 참조하십시오.
Alex Golovnev

@ AlexGolovnev : 나에게 완벽하게 좋은 답변 인 것 같습니다!
조슈아 그로 호프

@JoshuaGrochow : 감사합니다! 이제 답변으로 확장하겠습니다.
Alex Golovnev

답변:


8

먼저 욕심 추측에 대해 알려진 것을 요약 해 보겠습니다.

  1. Blum, Jiang, Li, Tromp, Yannakakis 는 Greedy Algorithm이 4 개의 근사값을 나타내고 Kaplan과 Shafrir 은 가장 짧은 공통 슈퍼 스트링 문제에 대해 3.5의 근사값을 나타냄을 보여줍니다.
  2. 욕심 많은 알고리즘의 버전은 3 근사치를 제공하는 것으로 알려져 있습니다 ( Blum, Jiang, Li, Tromp, Yannakakis ).
  3. 3 Tarhio, Ukkonen ; Cazaux, Rivals ) 또는 ( Kulikov, Savinov, Sluzhaev ) 일 때 유지 됩니다.4
  4. Greedy 알고리즘은 Greedy 알고리즘이 특정 순서 ( Weinard, Schnitger ; Laube, Weinard )로 문자열을 병합하는 경우 발생합니다 .
  5. Greedy Algorithm은 압축 Tarhio, Ukkonen 의 2 개 근사값을 제공합니다 (입력 문자열의 총 길이에서 가장 짧은 공통 슈퍼 스트 레팅 길이를 뺀 값으로 정의 됨).
  6. Greedy Algorithm Ukkonen 의 매우 효율적인 구현이 있습니다.

욕심 추측을 증명하기 어려운 이유 중 하나는 다음과 같습니다. Greedy Algorithm의 근사 보장을 제공하는 대부분의 접근 방식은 입력 문자열 세트의 오버랩 그래프 (또는 이에 상응하는 접두사 그래프)를 분석합니다. 이러한 그래프의 일부 속성 (예 : Monge 및 Triple 불평등) 만 알고 있지만 이러한 속성으로는 Greedy Conjecture ( Weinard, Schnitger ; Laube, Weinard ) 를 증명하기에 충분하지 않습니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.