"고밀도"정규식은 ?를 생성합니다 .


25

정규식에 대한 추측은 다음과 같습니다.

정규식 경우 길이괄호와 연산자를 무시하고 그 안에있는 기호의 수 여야합니다. 예 :R|R||01|=|(01)|=2

추측 : 만약 및 은 모든 길이의 문자열이하이면 입니다.|R|>1L(R)|R|L(R)=Σ

즉, 이 의 길이 까지 '밀도' 이면 실제로 모든 것을 생성합니다.L(R)RR

관련이있는 것들 :

  1. 모든 문자열을 생성하려면 의 작은 부분 만 필요합니다. 예를 들어 이진수로 는 모든 대해 작동합니다 .RR=(01)SS
  2. 어느 시점 에 에는 Kleene 스타가 있어야합니다 . 없는 경우 보다 작은 크기의 문자열이 누락됩니다. .R|R|

증명이나 반례를 보는 것이 좋을 것입니다. 내가 놓친 것이 분명 잘못된 경우가 있습니까? 누구든지 전에 이것을 본 적이 있습니까?


하는 및 로 계산 또는 ? εsymbolsoperations
Ran G.

@Ran 나는 그것들을 상징으로 세고있었습니다.
Lucas Cook

답변:


34

Keith Ellul, Bryan Krawetz, Jeffrey Shallit, Ming-wei Wang의 논문 "정규 표현 : 새로운 결과와 공개 된 문제"에 대한 당신의 추측은 반증된다. 온라인으로 논문을 구할 수는 없지만 대화 가 가능합니다.

본 논문에서는 측정 값상기 심볼의 개수 이는 , 카운트되지 또는 . 그러나 빈 언어를 생성하지 않는 모든 표현식에서 을 제거 할 수 있으며 포함 된 의 수가 최대 되도록 표현식을 "정리"할 수 있습니다. (이야기의 10면에 나오는 정리).|alph(R)|Rϵϵ|alph(R)|

51 페이지에서 모든 대해 보다 크기가 인 정규 표현식을 구성하여 최대 크기의 모든 문자열을 생성하지만 생성하지는 않습니다 모든 줄. 여기에서 "크기"는 big-O 표기법을 사용하므로 의미와 의미가 모두 같습니다. 또한 두 매개 변수 사이의 최상의 의존성을 찾기 위해 열린 질문을 제기합니다.n3O(n){0,1}Ω(2nn)


매우 멋진 결과, 그리고 놀랍게도 :)
Alex ten Brink

정규 표현식은 어떻게 생겼습니까?
svick

@ svick : 와 Kleene 별을 합쳐서 일반적인 하위 문자열을 캡처하여 증거의 빠른 탈지로 판단합니다. 표현은 꽤 괴물이다 :)(a+b)(c+d)=ac+bc+ad+bd
Alex ten Brink

@Yuval 매우 시원합니다. 참조 주셔서 감사합니다!
Lucas Cook

2
@YuvalFilmus 지금 종이 가 온라인으로 제공 되는 것 같습니다 .
Anton Trunov
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.