유한 세트의 정규 표현식 크기 최소화


15

언어 사양으로 DFA가 있더라도 정규 표현식의 크기를 최소화하는 것은 PSPACE- 완전한 것으로 알려져 있습니다 .

언어가 유한하면 결과는 무엇입니까?

두 가지 모델에서이 문제를 고려할 수 있습니다.

  1. 입력은 언어의 모든 문자열이며 모든 문자열의 길이의 합으로 입력 크기를 측정합니다.
  2. 입력은 DFA이며 DFA 상태 수에 따라 입력 크기를 측정합니다.

Kleene 별은 유한 경우에 유용하지 않으므로 ,그리고 (연결)은 표현에 사용됩니다. 물론 정규 표현식의 길이는 임의적입니다. 대신 각 작업에 가중치를 부여하고 (괄호 추가 포함) 정규 표현식의 가중치를 최소화하도록 요청할 수 있습니다.()|

편집 : adrianN이 지적했듯이 문법 기반 코드와 관련이 있습니다. 유한 세트를 설명하기 위해 최소 길이 컨텍스트 프리 문법을 생성하는 것은 NP-complete입니다. 최소 크기 컨텍스트 자유 문법이 최소 크기 정규식에 대해 많은 것을 암시 할 수있는 이유는 분명하지 않습니다. 영리한 재 작성 규칙이이 두 가지를 연관시킬 수 있으며 첫 번째 모델에서 문제가 NP에 있음을 증명할 수 있습니다.


3
문법 기반 코드 와 관련이있는 것 같습니다 .
adrianN

입력 크기가 제한되어 있다고 가정하십시오. kleene star가 유효 할 수 있습니다. 따라서 입력 크기가 유한 언어에서 가장 긴 문자열로 제한되는지 정의하는 것이 합리적입니다. 이 경우에도 kleene star가 여전히 제외되는 경우. 또한 (명백한?) 휴리스틱으로 DFA를 최소화하고 그로부터 RE를 구성하는 것이 하나의 전략입니다 ... 또한 변수 대체를 사용하는 RE는 DAG와 유사한 구조를 가지며 알려진 (많은) 강력한 알고리즘이 없습니다. DAG와 유사한 구조를 최소화하는 방법에 대해 .... 변수 대체가없는 RE는 나무와
같으며

다른 각도. brzozowski에 의해 도입 된 RE "유도체"는 RE를 DFA로 직접 전환 시키는데 유용한 것으로 공지되어있다. 예를 들어 Owens, Reppy, Turon에 의해 재검토정규식 유도체를 참조한다 . 역 문제에 대해 동일한 구조를 사용하는 방법이있을 수 있습니다. 어쨌든 전반적인 문제이지만 공개적인 문제인 것 같습니다 ....
vzn

답변:


4

다음의 주장은 본질적으로 ( 1 ) 에서 온 것 입니다. 두 문제의 결정 버전은 다음과 같이 다항식 계층 의 두 번째 수준 (보다 정확하게는 복잡도 클래스 )에 포함됩니다. 최대 k 의 정규 표현식을 추측 하고 주어진 결정 론적 유한 오토 마톤 (각각 : 단어 목록으로 제공된 언어)과 같은지 확인하십시오.Σ2케이

귀하의 문제에 대한 더 이상의 결과는 알려지지 않았습니다. 정규식 대신에 최소 동등한 비 결정적 유한 오토 마톤을 찾는 것이 목표 인 유사하게 보이는 최적화 문제의 경우 다음 결과가 알려져 있습니다.

  • DFA로 설명 된 입력의 경우 최소 등가 NFA 문제는 hard입니다 (( 1 ) 참조 ). 여기서, D P 는 "차이 다항식 시간"을 나타내고; 이것은 부울 계층 의 두 번째 레벨에있는 "시그마"복잡성 클래스 입니다.
  • 단어 목록으로 설명 된 입력의 경우 최소 등가 NFA 문제는 hard입니다 (( 2 ) 참조 ).
  • 들면 및 입력 진리표 바와 같이, 최소 등가 NFA 문제가 N P의 - 완전한 (참조 2 ).{0,1}미디엄

주의 : 무한 언어의 설정과 달리, NFA 최소화 사례에서 귀하의 질문에 대한 문제로 직접 축소되는 것으로 보이지 않습니다.

참고 문헌 :

(1) Hermann Gruber 및 Markus Holzer. 유한 언어 및 단항 언어에 대한 NFA 최소화의 계산 복잡성 . 에서 : 언어 및 오토마타 이론 및 응용에 관한 제 1 차 국제 컨퍼런스 (LATA 2007), 261-272, 2007.

(2) Hermann Gruber 및 Markus Holzer. 비 결정적 상태 및 전이 복잡성의 불확실성 P <> NP . 에서 : 11 차 언어 이론 개발에 관한 국제 회의 (DLT 2007), LNCS 4588, pp. 205-216, 2007.

={}


-6

알려진 정확한 답이 없거나 이것보다 더 나은 답이 없으면 분명히 RE를 최소화하는 subj에 대한 연구에 대한 거의 / 최근의 참조가 있습니다.

Georg Schnitger Gregor Gramlich 의 NFA 및 정규식 최소화 (2005)

우리는 비결정론 적 유한 오토마타 (nfa 's)의 최소화뿐만 아니라 주어진 nfa, 정규식 또는 결정 론적 유한 오토마타 (dfa 's)에 대한 정규식의 최소화에 관한 근사치 결과를 보여줍니다. 우리는 n 상태, 전이, resp로 주어진 nfa 또는 정규 표현식을 효율적으로 최소화하는 것이 불가능하다는 것을 보여줍니다. P = PSPACE가 아닌 한 요인 o (n) 내의 기호. n 상태의 주어진 dfa에 대한 우리의 근사치 결과는 암호화 가정을 기반으로하며 효율적인 알고리즘은 최소한 poly (log n)의 근사 계수를 갖습니다. 또한 설정을 통해 일관된 최소 dfa 문제를 분석 할 수 있습니다.


4
이 질문은 언어가 유한 할 때 어떤 일이 발생하는지 다루지 않기 때문에이 질문은 구체적으로 제기되었습니다.
Chao Xu

1
괜찮 으면 [관련 / nec] bkg 역할을합니다. 그러나 다른 질문에 [게시 된] 대답이 없다면,이 질문에서도 그다지 놀라운 것은 아니지만 거의 변이 각도가 도움이되지 않을 수 있습니다. 또한 [ mea culpa ]는 다른 질문에서이 논문이 MdB에 의해 인용 된 것을 눈치 채지 못했습니다.
vzn
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.