문맥없는 문법으로서 일반 언어의 교차의 복잡성


20

지정된 정규 표현은 아닌 사소한 경계가 가장 작은 문맥 자유 문법의 크기에있다, R 1R n은 ?아르 자형1,,아르 자형아르 자형1아르 자형


??? 이것을 시각화하려고합니다. 트릭이 있습니까? 의 교차점 은 규칙적입니다. CFG 인 표준 방법을 통해 최소 DFA (wrt state count)를 찾을 수 있습니다. 아르 자형
vzn

@vzn : 네 말이 맞아. 문제는이 DFA, 즉 CFG가 매우 클 수 있다는 것입니다. CFG의 추가 기능을 사용하여 교차점에 대한 간결한 설명을 얻을 수 있는지 궁금합니다.
최대

추측하지 않습니다. RL을 인식하는 (즉, 동등한) 모든 CFL이 스택을 사용하지 않거나 상태가 증가하지 않는 스택으로 변환 될 수 있으며 PDA (wrt state count)의 최소 크기는 최소 크기와 동일합니다. DFA. 이것에 대한 증거를들은 적이 없습니다. 어쩌면 힘들지 않습니까? 간단한 질문이 어떤 는 DFA보다 작은 RL을 인식하는 PDA? 생각하지 마십시오.
vzn

@vzn : 유용한 추측이지만 거짓 : 최대 중첩 깊이가 k 인 두 가지 유형의 괄호에서 가 Dyck 언어의 하위 집합이되게하십시오 . 거기에 대한 CFG이다 L의 K 크기의 O ( k는 ) 하지만, 최소한의 DFA (심지어, 내가 생각하는, 최소한의 NFA)는 크기가 O ( 2 케이 ) . LkkLkO(k)O(2k)
최대

Dyck 언어 는 CFL이지만 RL은 아닙니다 ...? 그러나 최대 중첩 깊이를 제한하고 있습니다 ... 그렇다면 RL 교차로 동일한 언어를 만들 수 있습니까? 최소 DFA가 그렇게 크다는 증거는 무엇입니까? 즉 상태 ? 당신은 최소 기준이나 다른 곳을 정의하지 않고 자연 상태로 상태를 취했지만 유일한 것은 아닙니다. 영형(2케이)
vzn

답변:


6

이것은 좋은 질문이며 실제로 내 관심 안에 있습니다. 맥스에게 물어봐서 다행입니다.

하자 DFA의 대부분에서 O ( N ) 주어 각각의 상태. DFA 언어의 교차를 허용하는 지수가 많은 상태의 PDA가 있다면 좋을 것입니다. 그러나 그러한 PDA가 항상 존재하지는 않을 것이라고 제안합니다.영형()

복사 언어를 고려하십시오. 이제 길이 n의 문자열을 복사하도록 제한하십시오.

공식적으로 -copy를 고려하십시오 : = { x x: = .{엑스엑스|엑스{0,1}}

copy 를 최대 O ( n )n 개의 DFA 크기의 교집합으로 나타낼 수 있습니다 . 그러나, 최소 허용 DFA는 N -copy을 갖는 2 Ω ( N ) 상태.영형()2Ω()

마찬가지로, 우리가 이진 스택 알파벳으로 제한한다면, copy 를 받아들이는 가장 작은 PDA 는 기하 급수적으로 많은 상태를 가지고 있다고 생각합니다 .

추신 더 논의하고 싶은 경우에는 저에게 이메일을 보내 주시기 바랍니다. :)


5

사소한 하한 또는 상한이있을 수 있다고 생각하지 않습니다.
하한의 경우 고정 k에 대해 언어 를 고려하십시오 . 문맥이없는 가장 작은 문법의 크기는 L 1 의 정규식 크기에 로그 적이 지만, L 1 에 대한 가장 작은 자동자 크기는 L 1 의 정규식 크기에 선형입니다 . L 1 이 다른 언어와 교차하는 경우이 지수 차이는 동일하게 유지 됩니다. 상한 의 경우 정확히 하나로 구성된 언어 L 2 를 고려하십시오.1={에이2케이}케이1111
L2deBruijn - 시퀀스 길이의 . 이를위한 작은 문법의 크기 것으로 알려져 L 2는 최악의 경우, 즉 인 O ( NnL2이므로,L2의 "가장 작은"오토 마톤과의 차이는 단순히 대수 인자입니다.O(nlogn)L2

사소한 일반 하한 또는 상한은 이러한 결과와 모순 됩니다. 언어의 교차에 대해 참인 것이 1 언어 의 교차에 대해 참이어야하기 때문입니다 .n1


단일 deBruijn-Sequence에 대한 가장 작은 문법의 크기에 대한 언급은 매우 흥미 롭습니다. 참조를 부탁드립니다. 고맙습니다.
Michael Wehar

또한, 나는 잘못 생각할 수 있지만 정규 표현식의 결과가 아닌 단일 정규 표현식의 문제 만 해결 한 것 같습니다.
Michael Wehar

@MichaelWehar Yep, 나는 단 하나의 정규 표현식만을 고려했습니다. 개 언어 의 교집합 이 사실이라면 사소한 교집합도 반드시 맞아야합니다. 이러한 경우를 제외하기 위해 질문을 재구성하는 방법을 모르겠습니다. 참조를 추가했습니다. 즉시 처리해야합니다. 죄송합니다. n
john_leo

1
고맙습니다! 구체적인 예를 설명 할 수있었습니다. 다음은 그러한 예의 존재로 이어지는 간단한 설명입니다. n을 주자. 길이 n의 2 ^ n 문자열이 있습니다. 또한 최대 n / log (n) 상태의 튜링 머신은 2 ^ n 개 이하입니다. 따라서 n / log (n) 상태보다 작은 Turing 머신이 언어 {x}를 허용하지 않도록 길이 n의 일부 문자열 x. 따라서 {x}는 n 개 상태의 DFA에서 승인되며 n / log (n) 개 이하의 PDA에서는 승인 할 수 없습니다.
Michael Wehar

5

마이클의 두 번째 판단을하겠습니다. 이것은 실제로 흥미로운 질문입니다. Michael의 주요 아이디어는 문헌의 결과와 결합되어 엄격한 증거와 유사한 하한을 제공 할 수 있습니다.

나는 CFG 크기에 대한 경계를 알파벳의 총 알파벳 수의 관점에서 언급 할 것이다. 정규 표현식입니다. 이 숫자를 k 로 표시하십시오. john_leo가 지적했듯이 교차점에 참여하는 정규 표현식의 수에는 유용한 경계가 없습니다.nk

영업 이익도 마이클 둘은 필요한이 언급 찾을 수 있지만 위의 경계 않았다 쉽게 입증 할 수있는 NFA에 정규 표현식의 교차점을 변환 (상태의 수에). 레코드의 경우 다음과 같습니다. 정규식을 Glushkov automata로 변환합니다. 그런 다음 제품 구성을 적용하여 이러한 언어의 교차점에 대한 NFA를 얻습니다. (I 하나 개선 할 수 있다고 가정받는 바인딩 2 K + 1 정도.)은 (S) - 상태 NFA는 크기의 (a CFG의 특별한 경우이다) 우측 선형 문법으로 변환 할 수 O ( S 2 )2k+12k+1sO(s2)(문법의 왼쪽과 오른쪽의 총 기호 수로 문법 크기를 측정하면) 크기 됩니다. 실용적인 응용 프로그램을 염두에 둔다면이 바운드는 끔찍하게 들립니다. NFA의 크기를 추정하기 위해 비결정론 적 상태 복잡성 대신 비결정론 적 전환 복잡성을 사용하여 더 나은 범위를 입증하려고 노력하는 것이 노력의 가치가 있습니다.O(4k)

다른 부분은 정규 표현식의 교차점으로 간결하게 표현할 수 있지만 CFG로 설명하기에는 반드시 번거로운 감시 언어를 찾는 것입니다. (여기서 우리는 언어를 생성하는 모든 CFG의 크기에 대한 하한을 설정해야하며, 그 수는 무한히 많을 수 있습니다.) 다음 인수는 하한.2Ω(k/logk)

유한 언어 여기서 w R이 환입 나타내고 w를 . 그러면 L n 은 다음 2 n + 1 정규식의 교집합으로 표현 될 수 있습니다.Ln={wwRw{a,b}|w|=n}wRwLn2n+1

  • , 1 ri=(a+b)ia(a+b)2(ni1)a(a+b)+(a+b)ib(a+b)2(ni1)b(a+b) ;1나는
  • , 1 에스나는=(에이+)에이(에이+)2(나는1)에이(에이+)나는+(에이+)(에이+)2(나는1)(에이+)나는 ;1나는
  • =(에이+)

이 식의 교집합에서 알파벳 기호 의 총 수 O ( n 2 ) 입니다.케이영형(2)

( 1 ) 에서 정리 13의 증거에 주어진 인수를 사용하여, 을 생성하는 모든 비 주기적 CFG가 적어도 2 n / ( 2 n ) = 2 Ω ( )을 가져야 한다는 것을 증명할 수 있습니다각 규칙의 오른쪽 길이가 최대2인 경우 고유 변수. 후자의 조건은 단일 변수로 유한 한 언어를 생성 할 수 있기 때문에 변수 수에 대해 논쟁하는 데 필요합니다. 그러나 문법 크기의 관점에서 볼 때,이 조건은 실제로 제한이 아닙니다. CFG를 선형 크기의 크기만으로 CFG를이 형식으로 변환 할 수 있기 때문입니다 (2참조). Arvind et al. n은 크기n의 알파벳을 초과하며, 이는nn/(2n)의 경계를 산출한다; 그러나 논쟁은 명백한 수정으로 이어진다.2/(2)=2Ω(케이/로그케이)2/(2)

그러나 사이에 큰 갭이 남아 및 상술은 하한.영형(4)

참고 문헌 :

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.