지정된 정규 표현은 아닌 사소한 경계가 가장 작은 문맥 자유 문법의 크기에있다, R 1 ∩ ⋯ ∩ R n은 ?
지정된 정규 표현은 아닌 사소한 경계가 가장 작은 문맥 자유 문법의 크기에있다, R 1 ∩ ⋯ ∩ R n은 ?
답변:
이것은 좋은 질문이며 실제로 내 관심 안에 있습니다. 맥스에게 물어봐서 다행입니다.
하자 DFA의 대부분에서 O ( N ) 주어 각각의 상태. DFA 언어의 교차를 허용하는 지수가 많은 상태의 PDA가 있다면 좋을 것입니다. 그러나 그러한 PDA가 항상 존재하지는 않을 것이라고 제안합니다.
복사 언어를 고려하십시오. 이제 길이 n의 문자열을 복사하도록 제한하십시오.
공식적으로 -copy를 고려하십시오 : = { x x .
copy 를 최대 O ( n ) 의 n 개의 DFA 크기의 교집합으로 나타낼 수 있습니다 . 그러나, 최소 허용 DFA는 N -copy을 갖는 2 Ω ( N ) 상태.
마찬가지로, 우리가 이진 스택 알파벳으로 제한한다면, copy 를 받아들이는 가장 작은 PDA 는 기하 급수적으로 많은 상태를 가지고 있다고 생각합니다 .
추신 더 논의하고 싶은 경우에는 저에게 이메일을 보내 주시기 바랍니다. :)
사소한 하한 또는 상한이있을 수 있다고 생각하지 않습니다.
하한의 경우 고정 k에 대해 언어 를 고려하십시오 . 문맥이없는 가장 작은 문법의 크기는 L 1 의 정규식 크기에 로그 적이 지만, L 1 에 대한 가장 작은 자동자 크기는 L 1 의 정규식 크기에 선형입니다 . L 1 이 다른 언어와 교차하는 경우이 지수 차이는 동일하게 유지 됩니다.
상한 의 경우 정확히 하나로 구성된 언어 L 2 를 고려하십시오.
deBruijn - 시퀀스 길이의 . 이를위한 작은 문법의 크기 것으로 알려져 L 2는 최악의 경우, 즉 인 O ( N이므로,L2의 "가장 작은"오토 마톤과의 차이는 단순히 대수 인자입니다.
사소한 일반 하한 또는 상한은 이러한 결과와 모순 됩니다. 언어의 교차에 대해 참인 것이 1 언어 의 교차에 대해 참이어야하기 때문입니다 .
마이클의 두 번째 판단을하겠습니다. 이것은 실제로 흥미로운 질문입니다. Michael의 주요 아이디어는 문헌의 결과와 결합되어 엄격한 증거와 유사한 하한을 제공 할 수 있습니다.
나는 CFG 크기에 대한 경계를 알파벳의 총 알파벳 수의 관점에서 언급 할 것이다. 정규 표현식입니다. 이 숫자를 k 로 표시하십시오. john_leo가 지적했듯이 교차점에 참여하는 정규 표현식의 수에는 유용한 경계가 없습니다.
영업 이익도 마이클 둘은 필요한이 언급 찾을 수 있지만 위의 경계 않았다 쉽게 입증 할 수있는 NFA에 정규 표현식의 교차점을 변환 (상태의 수에). 레코드의 경우 다음과 같습니다. 정규식을 Glushkov automata로 변환합니다. 그런 다음 제품 구성을 적용하여 이러한 언어의 교차점에 대한 NFA를 얻습니다. (I 하나 개선 할 수 있다고 가정받는 바인딩 2 K + 1 정도.)은 (S) - 상태 NFA는 크기의 (a CFG의 특별한 경우이다) 우측 선형 문법으로 변환 할 수 O ( S 2 )(문법의 왼쪽과 오른쪽의 총 기호 수로 문법 크기를 측정하면) 크기 됩니다. 실용적인 응용 프로그램을 염두에 둔다면이 바운드는 끔찍하게 들립니다. NFA의 크기를 추정하기 위해 비결정론 적 상태 복잡성 대신 비결정론 적 전환 복잡성을 사용하여 더 나은 범위를 입증하려고 노력하는 것이 노력의 가치가 있습니다.
다른 부분은 정규 표현식의 교차점으로 간결하게 표현할 수 있지만 CFG로 설명하기에는 반드시 번거로운 감시 언어를 찾는 것입니다. (여기서 우리는 언어를 생성하는 모든 CFG의 크기에 대한 하한을 설정해야하며, 그 수는 무한히 많을 수 있습니다.) 다음 인수는 하한.
유한 언어 여기서 w R이 환입 나타내고 w를 . 그러면 L n 은 다음 2 n + 1 정규식의 교집합으로 표현 될 수 있습니다.
이 식의 교집합에서 알파벳 기호 의 총 수 는 O ( n 2 ) 입니다.
( 1 ) 에서 정리 13의 증거에 주어진 인수를 사용하여, 을 생성하는 모든 비 주기적 CFG가 적어도 2 n / ( 2 n ) = 2 Ω ( √ )을 가져야 한다는 것을 증명할 수 있습니다각 규칙의 오른쪽 길이가 최대2인 경우 고유 변수. 후자의 조건은 단일 변수로 유한 한 언어를 생성 할 수 있기 때문에 변수 수에 대해 논쟁하는 데 필요합니다. 그러나 문법 크기의 관점에서 볼 때,이 조건은 실제로 제한이 아닙니다. CFG를 선형 크기의 크기만으로 CFG를이 형식으로 변환 할 수 있기 때문입니다 (2참조). Arvind et al. n은 크기n의 알파벳을 초과하며, 이는nn/(2n)의 경계를 산출한다; 그러나 논쟁은 명백한 수정으로 이어진다.
그러나 사이에 큰 갭이 남아 및 상술은 하한.
참고 문헌 :
V. Arvind, Pushkar S. Joglekar, Srikanth Srinivasan. 다항식의 산술 회로와하다 마드 곱 , FSTTCS 2009, Vol. LIPIcs 4 개, 25-36 페이지
랭, 마틴; Leiß, Hans (2009). " CNF에 또는 CNF에? CYK 알고리즘의 아직 효과적인 버전 ". Informatica Didactica 8.