모호한 문맥이없는 문법 (CFG)의 점근 밀도


9

모호한 CFG와 모든 CFG 의 비율은 무엇입니까 ?

두 세트 모두 셀 수없이 무한하기 때문에 비율이 잘 정의되어 있지 않습니다. 그러나 점근 밀도 는 어떻 습니까 ?

limn# ambiguous CFG of size<n# CFG of size<n

여기서 터미널 및 비 터미널 심볼은 고정 된 셀 수있는 세트에서 나옵니다.

문법의 크기는 문법에 대한 합리적인 크기 개념입니다.

  1. 생산 규칙에서 변수 및 터미널의 총 발생 횟수 또는
  2. 변수의 총 발생 횟수 또는
  3. 총 생산 규칙 수 또는
  4. 구별 변수의 수

(크기의 정의가 대답에 영향을 미치지 않는다고 가정합니다.)


3
그 외에도 다음과 같은 CFG 크기 개념이 문헌에서 고려되었다. (1) 문법에서 모든 생산의 양변에서 변수와 터미널의 총 발생 횟수. (2) 문법에서 모든 생산의 양변에서 발생하는 변수의 수. (3) 문법의 제작 횟수. (4) 문법에서 구별되는 변수의 수.
Martin Berger

1
예를 들어 S. Ginsburg, N. Lynch, 문맥이없는 문법 형태의 크기 복잡성을 참조하십시오. J. Gruska, 문맥이없는 문법의 크기. J. Gruska, 문맥이없는 문법과 언어의 복잡성 및 모호함. A. Kelemenova, 정규형 문법의 복잡성.
Martin Berger

1
@Martin, 조심하지 않으면 주어진 크기의 문법적으로 문법적으로 다른 문법이 무한히 많을 수 있으며 비율은 의미가 없습니다. 안전한 방법은 일부 고정 된 문법 인코딩의 비트 길이를 계산하는 것입니다.
Kaveh

1
점근 밀도를 각 수량의 로그 비율로 정의하려고 할 수 있습니다. 두 수량이 모두 기수에 따라 기수가 다르기 때문입니다.
mobius 교 자식

1
@MartinBerger 우리가 같은 것에 대해 이야기한다고 가정합니다. 영형이자형에스나는와이=영형(#미디엄나는영형에스에프에스)/영형(#에프에스)이것은 분명히 밀도에 영향을 미칩니다. 모호하지 않은 CFG의 수가1.5 CFG의 수는 2이면 로그 밀도는 영형1.52점근 밀도는 0입니다. 점근 밀도는 0 또는 1이 될 것입니다. 그러나 점근 로그 밀도는 흥미로운 숫자 일 것입니다.
mobius 교 자식

답변:


4

질문은 정확한 인코딩에 따라 다릅니다. 그러나 많은 합리적인 인코딩에서는 길이가 무한대에 가까워 질수록 생산 규칙 수에스 (시작 기호의 적절한 해석을 위해 에스 그리고 터미널 ) 확률이 높은 둘 이상이 될 것입니다. 여기서 나는 문자 그대로 같은 터미널을 의미합니다.. 이것을 모호한 것으로 생각하면 "가장 큰"문법이 모호 할 것으로 기대합니다. 규칙과 같은 유사한 상황을 조정할 수도 있습니다에스에스에스 각각 한 번 이상 나타납니다.

이 일반적인 가설을 가정 할 때, 길이가 무한대 인 경향이 있기 때문에 모든 (고정 된) 가능한 규칙이 높은 확률로 나타나야한다고 가정하면, "가장 큰"문법이 Σ 모호한 방식으로.

예를 들어 다음 문법에 대한 인코딩을 고려하십시오. Σ={0,1}. 문법 알파벳은 기호로 구성{0,1,;,.}. 비 터미널은 길이가 2 이상인 이진 문자열로 인덱싱됩니다. 규칙은 전체 중지로 구분됩니다. 각 규칙은 세미콜론으로 구분 된 이진 문자열 시퀀스입니다. 첫 번째 이진 문자열은 왼쪽의 비 터미널이고 나머지 (있는 경우)는 오른쪽을 구성합니다. 첫 번째 이진 문자열이 비 터미널이 아닌 경우 (즉,ϵ, 0,1)이되면 시작 비 터미널이 가정됩니다. 시작하는 비 터미널은 항상 00입니다.

이 인코딩에서 모든 문자열은 {0,1,;,.}문법을 설명합니다. 확률이 높은 임의의 문법에는 많은 사본이 포함됩니다..00;00..00;0.특히 모호 할 것입니다.


예, 다음과 같은 규칙을 고려합니다 에스에스에스문법에 유효한 것으로 두 번 이상 나타납니다. 실제로 이것은 문법을 사소하게 모호하게 만듭니다. 건배.
user18064

그러나 크기 (CFG)가 증가함에 따라 일반적으로 터미널 및 비 터미널의 수가 증가하므로이를 나타 내기 위해 더 많은 비트가 필요하므로 개별 규칙을 나타내는 데 더 많은 비트가 필요합니다. 따라서 사소한 이유로 모호하지 않은 CFG의 수도 증가합니다 (예 : 하나의 규칙 만 크기 제한에 맞음).
Martin Berger

@Martin 인코딩에 따라 다릅니다. 알파벳 크기가 문법 크기에 따라 커지는 경우와 같이 주장을 뒷받침하는 인코딩을 생각해 낼 수 있습니다. 내 인코딩은 일정한 알파벳 크기를 사용 하므로이 효과는 발생하지 않습니다.
Yuval Filmus 2016 년

@MartinBerger 문법 크기가 커짐에 따라 터미널 및 비 터미널 심볼의 수를 늘리는 데 유효한 포인트입니다. 프로그래밍 언어와 같은 사용 사례에 적합합니다.
user18064

@ user18064 프로그래밍 언어는 일반적으로 일정한 크기의 알파벳, 대부분의 경우 ASCII 하위 집합을 사용합니다. 무제한 알파벳 크기의 실제 언어는 알지 못하지만 쉽게 정의 할 수는 있습니다.
Yuval Filmus 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.