나는 최근 최단 슈퍼 스트링 문제 에 대한 욕심 추측에 대해 배웠다 .
이 문제에서 우리는 문자열의 집합 주어진 우리는 발견 할 짧은 superstring 예와 같은 각 의 문자열로 나타납니다 .
이 문제는 NP-hard이며 긴 논문 시퀀스 후에이 문제에 대해 가장 잘 알려진 근사 알고리즘은 [Paluch '14] 의 비율을 갖습니다 .
실제로 생물 학자들은 다음 Greedy 알고리즘을 사용합니다.
각 단계에서 모든 쌍에 대해 최대 겹치는 두 문자열 (다른 문자열의 접두사 인 최대 접미사)을 병합 하고 하나의 문자열 만 남을 때까지 (모든 입력 문자열의 슈퍼 스트링 인)이 새 인스턴스에서 반복하십시오. )
이 Greedy Algorithm의 근사 비율에서 하한 는 입력 있습니다.
흥미롭게도, 이것이 최악의 예라고 생각합니다. 즉 Greedy는 최단 슈퍼 스트링 문제에 대해 근사치를 달성합니다 . 그런 자연스럽고 쉬운 알고리즘이 분석하기가 어렵다는 것을 알고 매우 놀랐습니다.
이 질문이 왜 어려운지 암시하는 직관, 사실, 관찰, 예가 있습니까?