특수 언어 클래스 : "원형"언어. 알고 있습니까?


20

유한 알파벳 시그마에 대해 다음과 같은 "원형"언어 클래스를 정의하십시오. 실제로, 그 이름은 DNA 컴퓨팅 분야에서 사용되는 것으로 보이는 다른 것을 나타내는 것으로 이미 존재합니다. AFAICT, 그것은 다른 종류의 언어입니다.

언어 L은 Σ ∗의 모든 단어 w 에 대해 순환 iff입니다 .Σ

w모든 정수k>0 에 대해 가 L에 속하는 경우에만 w 는 L에wk속합니다.

이 언어 클래스가 알려져 있습니까? 나는 규칙적이고 특히 다음과 같은 순환 언어에 관심이 있습니다.

  • 이미 알려진 경우 이름

  • 허용되는 언어가 위의 정의를 준수하는지 여부에 관계없이 자동 (특히 DFA)을 고려할 때 문제의 결정 가능성


1
이것은 매우 흥미로운 질문입니다. 두 가지 관련 질문이 있습니다. 1) 정규 언어 L과 관련 DFA가있는 경우 순환 형으로 만들 수 있습니까? 2) 언어 L이 주어지면 circ (L)이 규칙적이거나 멋진 속성이 있습니까?
Suresh Venkat

추신 : 이것은 아마도 분명하지만 왜 순환 언어가 일반 언어의 하위 클래스라고 생각합니까?
Suresh Venkat

3
@Suresh, 나는 그것이 a) 규칙적이라면 언어를 원형으로 정의한다고 생각한다. b) 폐쇄 특성 충족시킵니다 wL,nN:wnL.
피터 테일러


1
고마워해야 할 수도 있지만 이것이 첫 번째 질문이었으며 의견, 답변 및 토론의 품질에 대해 감사했습니다. 감사.
빈센조 ml

답변:


19

첫 번째 부분에서는 원형을 결정하기위한 지수 알고리즘을 보여줍니다. 두 번째 부분에서는 이것이 문제가 coNP-hard임을 보여줍니다. 세 번째 부분에서, 우리는 모든 순환 언어가 형식 (여기서 r 은 빈 정규 표현식이 될 수 있음) 의 언어의 합집합임을 보여줍니다 . 노조가 반드시 분리되어 있지는 않습니다. 네 번째 부분에서 우리는 분리 된 합으로 쓸 수없는 순환 언어를 보여 줍니다. r + i .r+rri+

편집 : Mark의 의견에 따라 일부 수정 사항이 통합되었습니다. 특히, 원형도가 coNP-complete 또는 NP-hard라고 주장한 나의 이전 주장은 수정되었다.

편집 : 정규 형식을 에서 r + i로 수정했습니다 . "본질적으로 모호한"언어를 전시했습니다.riri+


Peter Taylor의 의견에 계속해서, DFA에서 언어가 원형인지 여부를 결정하는 방법은 매우 비효율적입니다. 상태가 이전 상태의 튜플 인 새 DFA를 구성합니다 . 이 새로운 DFA는 이전 DFA의 사본 n 개를 동시에 실행 합니다.nn

언어가 원형이 아닌 경우 다음 단어가 우리가 반복적으로 DFA를 통해 실행하면, 초기 상태로 시작되도록 0은 우리가 얻을 상태 1 , ... , s의 N 그러한 s의 1은 수용하지만 하나 다른 것 중 하나는 받아들이지 않습니다 (모두 받아들이면 순서 s 0 , , s n 은 순환해야 w * 는 항상 언어로 표시됩니다). 다시 말해, 우리는 s 0 , , s n 경로를 가지고 있습니다ws0s1,,sns1s0,,snw ~ s 1 ,, s n 여기서 s 1 은 수락하지만 다른 것 중 하나는 수락하지 않습니다. 반대로, 언어가 원형이라면 그럴 수 없습니다.s0,,sn1s1,,sns1

따라서 문제를 간단한 직접 도달 가능성 테스트로 줄였습니다 (가능한 모든 "나쁜" 튜플을 확인하십시오 ).n


순환 성의 문제는 coNP-hard입니다. 변수 xmC 1 , , C m 과 함께 3SAT 인스턴스가 있다고 가정 합니다. 우리는 가정 할 수 N = m (더미 변수를 추가)하고 , n은 소수 (그렇지 않으면 사이의 소수를 찾을 수 N2 N AKS의 소수성 테스트를 사용하고 더미 변수와 절을 추가).nxmC1,,Cmn=mnn2n

다음 언어를 고려한다 : "입력이 없는 형태의 여기서 X I 이기 만족 할당 C I ". 이 언어에 대한 O ( n 2 ) DFA를 쉽게 구성 할 수 있습니다. 언어가 원형이 아닌 경우 언어에 단어 w 가 있으며, 그 중 일부는 언어에 있지 않습니다. 언어에없는 단어의 길이는 n 2 이므로 w 의 길이는 1 또는 n 이어야합니다 . 길이가 길 경우x1xnxiCiO(n2)wn2w1n ,대신 w n (여전히 언어로되어 있음)을 고려하여 w 는 언어이고 w n 은 언어가 아닙니다. 사실, n은 언어 수단 아니라고 인 할당을 만족.1wnwwnwnw

반대로, 만족스러운 할당은 언어의 비순환 성을 증명하는 단어로 변환됩니다. 만족스러운 할당 는 언어에 속하지만 w n 은 그렇지 않습니다. 따라서 3SAT 인스턴스가 만족스럽지 않으면 언어는 원형입니다.wwn


이 부분에서는 순환 언어의 일반적인 형식에 대해 설명합니다. 순환 언어 대한 일부 DFA를 고려하십시오 . 시퀀스 C = C 0 , ... 이다 실제 경우 C 0 = S (초기 상태), 다른 상태는 수용되고, C가 나는 = C의 j는 의미 C I + 1 = C의 J + 1 . 따라서 모든 실제 시퀀스는 결국 주기적이며 DFA에는 유한하게 많은 상태가 있기 때문에 실제 시퀀스는 유한하게 만 존재합니다.LC=C0,C0=sCi=CjCi+1=Cj+1

우리는 단어를 말할 동작합니다가에 따라 C 단어 상태에서 DFA 걸리는 경우 상태로 c를 내가 + 1 모두, 내가 . 그러한 모든 단어 E ( C ) 의 집합 은 규칙적입니다 (논쟁은이 답변의 첫 부분과 유사합니다). 참고 E ( C는 ) 의 서브 세트이고 L이 .cici+1iE(C)E(C)L

실제 시퀀스 감안 정의 C의 (k)를 순차로 C를 K ( t ) = C ( k 값 t ) . 시퀀스 C k 도 실수입니다. 단지 유한 한 여러 시퀀스가 있기 때문에 C의 K , 언어 D ( C ) 모두의 합집합 E ( C에서 k는 ) 정규이다.CCkCk(t)=C(kt)CkCkD(C)E(Ck)

우리는 x , y D ( C ) 이면 x y D ( C ) 의 속성을 가진다고 주장합니다 . 실제로, x C ky C l 이라고 가정하십시오 . 그런 다음 x y C k + l 입니다. 따라서 D ( C ) = D ( C ) +r 형식으로 쓸 수 있습니다.D(C)x,yD(C)xyD(C)xCkyClxyCk+lD(C)=D(C)+ 일부 정규 표현식에 대한 연구 .r+r

언어의 모든 단어 는 실제 시퀀스 C에 해당합니다 . 즉, w가 동작 하는 실제 시퀀스 C 가 있습니다. 따라서 L 은 모든 실제 시퀀스 C에 대해 D ( C ) 의 합집합입니다 . 따라서 모든 원형 언어는 r + i 형식으로 표현 됩니다. 반대로, 그러한 모든 언어는 (사소한) 원형입니다.wCCwLD(C)Cri+


짝수 또는 a 또는 짝수의 b 또는 둘 다를 포함 하는 a , b대한 모든 단어 의 순환 언어 을 고려하십시오 . 우리는 그것이 불연속 합계로 쓰여질 수 없음을 보여줍니다. r + i ; "비 연속"은 r + ir + j = ∅을 의미 합니다.La,babri+ri+rj+=

Niri+ x = a N b N ! x L x r + i i x N r + i z = a N ! b N ! y = A N ! b N r + j z i j x y LN>maxNix=aNbN!xLxri+ixNri+z=aN!bN!y=aN!bNrj+zijxyL . 따라서 표현은 분리 될 수 없습니다.


여기에 많은 오류가있는 것 같습니다. 당신은 SAT가 아닌 UNSAT를 줄이므로 coNP가 어렵다는 것을 보여주고 있습니다. (비) 회원에 대한 다항식 시간 증인은 무엇입니까?
마크 Reitblatt

"언어에없는 단어의 길이는 이므로" 가 아니어야합니까 ? n mn2nm
마크 Reitblatt

나는 그것이 "사소한 coNP"라고 생각하지 않습니다. 적어도 나에게는 분명하지 않습니다. 은 "명백한"인증서는 문자열 될 것 언어 및 전원 있도록 언어가 아닙니다. 그러나 왜 그런 단어가 polynomially-sized 해야하는지는 분명하지 않습니다. 아마도 내가 간과하고있는 오토마타 이론의 단순한 사실에 의한 것일 수도 있습니다. k l klklk
마크 Reitblatt

더욱 심각한 명백한 결점은 각 절이 개별적으로 만족스러운 것에서 만족할 수있는 전체 공식으로 점프한다는 것입니다. 물론 내가 잘못 읽지 않는 한.
Mark Reitblatt

나는 원형도가 coNP에 있다는 것이 확실하지 않다는 것에 동의합니다. 다른 한편으로, 나는 나머지 논쟁에서 아무런 문제도 보지 않습니다 (이제 넣었습니다 ). 각 조항이 동일한 할당으로 충족되면이 할당으로 3SAT 인스턴스가 충족됩니다. n=m
Yuval Filmus

17

다음은 이러한 언어에 대한 몇 가지 논문입니다.

Thierry Cachat, 1 글자 합리적인 언어의 힘, DLT 2001, Springer LNCS # 2295 (2002), 145-154.

S. Hovath, P. Leupold 및 G. Lischke, DLT 2002, Springer LNCS # 2450 (2003), 220-230.

H. Bordihn, 문맥이없는 언어의 힘에 대한 문맥이없는 것은 결정 불가능하다, TCS 314 (2004), 445-449.


6

@Dave Clarke, L = a * | b *는 원형이지만 L *는 (a | b) *입니다.

decidability의 측면에서, 언어 이 생길 경우 원형 인 있도록 의 +에서 폐쇄이다 또는 순환 언어의 유한 조합 인 경우가.L ' L L 'LLLL

(귀하의 를 바꾸는 "원형"을 재정의 하려고하고 있습니다. 많은 것을 단순화합니다. 그런 다음 시작 언어가 엡실론 전이만 허용하는 상태 인 NDFA가 존재하는 것으로서 순환 언어를 특성화 할 수 있습니다. 각 수락 상태로 엡실론 전이가 있음).>


네 말이 맞아 잘못된 게시물을 삭제했습니다.
Dave Clarke

로의 적응과 관련하여 : 최소 DFA는 항상 정확히 하나의 수락 가능한 상태, 즉 시작 상태를 가져야한다고 생각합니다. 더 많은 수용 상태가 발생할 수 있지만 시작 상태로의 ε 전환이 필요합니다 . ε
Raphael

1
@Raphael, 다시 L = a * | b *를 고려하십시오. 시작 상태가 유일한 수락 상태이고 a 및 b를 수락하는 DFA는 (a | b) *를 수락해야합니다.
피터 테일러

decidability의 질문에, 다시 : 당신과 함께 DFA가 있다고 가정 있는 상태 N A를 받고 있습니다. 단어 w 를 받아들이고 w 2 , w 3 , ..., w n a + 1 도 허용 한다고 가정합니다 . 그런 다음 x > 0에 w x 를 사용 합니다. (증거는 비둘기 구멍 원리의 ​​간단한 적용입니다). 최소 (최소 | w | ) 반례 ( w , x ) 를 보여줄 수 있다면nnaww2w3wna+1wxx>0|w|wx) DFA에 의해 수용된 언어의 순환 성에 의 함수에 의해 제한되는 길이를 갖는 경우 무차별 대입 시험이 가능하다. 나는 의심 | | < = n + 1 이지만 증명하지 못했습니다. n|w|<=n+1
피터 테일러

위의 @Raphael의 아이디어에 대한 후속 조치. start state = only accept state 아이디어는이 문제에 대해 잘못되었지만 흥미로운 속성을 포착합니다. M이 minDFA 인 경우 시작 상태는 L (M)이 접두어없는 언어의 Kleene 스타 인 경우에만 허용 상태입니다. 이것은 내가 가장 좋아하는 DFA 퀴즈 tidbits 중 하나이므로 빨리 공유 할 수 있습니다! ;)
mikero

5

편집 : 완전한 (간단한) PSPACE 완성도 증명이 아래에 나타납니다.

두 가지 업데이트. 첫째, 다른 답변에 설명 된 일반적인 양식은 Calbrix와 Nivat의 논문에 이미 접두사ω 라는 제목의 언어와 합리적인 ω- 언어의 기간 언어로 표시되어 있지만 불행히도 온라인에서는 사용할 수 없습니다.

둘째, DFA가 PSPACE-complete 인 언어가 원형인지 여부를 결정합니다.

PSPACE의 원형도. Savitch의 정리에 의해 NPSPACE = PSPACE이므로, 비원 형성에 대해 NPSPACE 알고리즘을 제공하는 것으로 충분합니다. 하자 와 DFA 일 | Q | = n 상태 신택 틱의 모노 이드 사실 L ( A는 ) 이하인 크기를 갖는 N , N이 경우 것을 의미 L ( A는 ) 원형 아닌 다음 단어가 w 이하인 길이를 N , NA=(Q,Σ,δ,q0,F)|Q|=nL(A)nnL(A)wnn되도록 하지만 w KL ( ) 일부 K N . 이 알고리즘 은 w를 추측 하고 O ( n log n ) 공간 ( n n 까지 계산하는 데 사용됨 )을 사용하여 모든 q Q대해 δ w ( q ) = δ ( q , w ) 를 계산합니다 . 그런 다음 δ w (wL(A)wkL(A)knwδw(q)=δ(q,w)qQO(nlogn)nn 하지만 δ ( K ) wF 일부 K N .δw(q0)Fδw(k)Fkn

원 형성은 PSPACE-hard입니다. Kozen은 그의 고전적인 1977 년 논문 에서 자연 증명 시스템에 대한 하한선에서 DFA 목록에 따라 허용되는 언어의 교차가 비어 있는지 여부를 결정하기가 PSPACE가 어렵다는 것을 보여주었습니다 . 이 문제를 순환 성으로 줄입니다. DFAS 이진 주어 1 , ... , A는 N , 우리는 소수 발견 P [ N , 2 N를 ] 및 삼원 DFA 구성 언어 수용성 (더 많은 노력으로 를 만들 수 있습니다A1,,Anp[n,2n]AApL(A)L(A1)L(An)

L(A)={2w12w22wp:wiL(A1+(imodn))}¯.
A교차점 이 비어있는 경우에만 가 원형 이라는 것을 ( 가 소수 라는 사실을 사용하여) 보는 것은 어렵지 않습니다 .pL(A)L(A1)L(An)

0

길이가 인 모든 은 ( , 로 쓸 수 있습니다 . 그것은 분명 그 및 . 펌핑 보조로 언어는 비어 있지 않은 입력에 대해 규칙적입니다.p > 0 x y i z x = z = ϵ y = w ϵ | x y | p | y | = | | > 0sLp>0xyizx=z=ϵy=wϵ|xy|p|y|=|w|>0

들어 , 정의는 빈 문자열의 수를 받아 빈 문자열을 받아들이는 NDFA 이후 보유하고있다.w=ϵ

위의 언어의 공용체는 언어 L이며 정규 언어는 공용 언어로 닫혀 있기 때문에 모든 순환 언어가 규칙적입니다.

라이스 정리에 따르면 는 결정 불가능합니다. 증거는 규칙 성과 비슷합니다.CIRCULARITY/TM


1
펌핑 보조기구는 규칙이지만 필수 조건이지만 충분하지는 않습니다. 특히, 펌핑 조건을 만족시키는 비정규 언어가 있습니다. 또한 라이스 정리는 는 결정할 수 없다고 말할 것 입니다. 그렇다고해서 는 결정할 수 없습니다 ( 는 DFA, a TM)! 예를 들어 DFA에 대한 공허 테스트는 결정 가능하지만 TM에 대한 공허 테스트는 불가능합니다. { D | L ( D )  는 원형이다 } D M{M|L(M) is circular}{D|L(D) is circular}DM
alpoge

1
계산할 수없는 순환 언어가 있습니다. 하자 , 여기서 아닌 일부 계산 가능한 언어 (예를 들어, 정지 된 TMS 코드)이다. 그런 다음 는 원형이지만 명확하게 계산할 수 없습니다 ( 대한 oracle을 사용하여 결정 ). R D D RD={0x1:xR}RDDR
유발 Filmus

2
@ 피터,이 답변을 읽었습니까? 규칙적인 조건이없는 원형 언어가 규칙적이라는 것을 증명하려고했습니다.
Yuval Filmus

1
@ 유발, 내 실수. @chazisop, 펌핑 보조 정리는 언어의 비 규칙 성을 증명하는 데 유용하지만 규칙은 아닙니다. (첫 문장의 어설 션은 " 길이 인 모든 을 로 쓸 수 있습니다. 여기서 "으로 명확하게 거짓 임)으로 줄어 듭니다 . p > 0 y i y ϵsLp>0yiyϵ
피터 테일러

1
예, CIRCULARITY / TM을 사용하여이를 참조합니다. 순환 / DFA는 아마도 결정 가능할 것입니다.
chazisop
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.