두 세트 모두 셀 수없이 무한하기 때문에 비율이 잘 정의되어 있지 않습니다. 그러나 점근 밀도 는 어떻 습니까 ?
여기서 터미널 및 비 터미널 심볼은 고정 된 셀 수있는 세트에서 나옵니다.
문법의 크기는 문법에 대한 합리적인 크기 개념입니다.
- 생산 규칙에서 변수 및 터미널의 총 발생 횟수 또는
- 변수의 총 발생 횟수 또는
- 총 생산 규칙 수 또는
- 구별 변수의 수
(크기의 정의가 대답에 영향을 미치지 않는다고 가정합니다.)
두 세트 모두 셀 수없이 무한하기 때문에 비율이 잘 정의되어 있지 않습니다. 그러나 점근 밀도 는 어떻 습니까 ?
여기서 터미널 및 비 터미널 심볼은 고정 된 셀 수있는 세트에서 나옵니다.
문법의 크기는 문법에 대한 합리적인 크기 개념입니다.
(크기의 정의가 대답에 영향을 미치지 않는다고 가정합니다.)
답변:
질문은 정확한 인코딩에 따라 다릅니다. 그러나 많은 합리적인 인코딩에서는 길이가 무한대에 가까워 질수록 생산 규칙 수 (시작 기호의 적절한 해석을 위해 그리고 터미널 ) 확률이 높은 둘 이상이 될 것입니다. 여기서 나는 문자 그대로 같은 터미널을 의미합니다.. 이것을 모호한 것으로 생각하면 "가장 큰"문법이 모호 할 것으로 기대합니다. 규칙과 같은 유사한 상황을 조정할 수도 있습니다 과 각각 한 번 이상 나타납니다.
이 일반적인 가설을 가정 할 때, 길이가 무한대 인 경향이 있기 때문에 모든 (고정 된) 가능한 규칙이 높은 확률로 나타나야한다고 가정하면, "가장 큰"문법이 모호한 방식으로.
예를 들어 다음 문법에 대한 인코딩을 고려하십시오. . 문법 알파벳은 기호로 구성. 비 터미널은 길이가 2 이상인 이진 문자열로 인덱싱됩니다. 규칙은 전체 중지로 구분됩니다. 각 규칙은 세미콜론으로 구분 된 이진 문자열 시퀀스입니다. 첫 번째 이진 문자열은 왼쪽의 비 터미널이고 나머지 (있는 경우)는 오른쪽을 구성합니다. 첫 번째 이진 문자열이 비 터미널이 아닌 경우 (즉,, 0,1)이되면 시작 비 터미널이 가정됩니다. 시작하는 비 터미널은 항상 00입니다.
이 인코딩에서 모든 문자열은 문법을 설명합니다. 확률이 높은 임의의 문법에는 많은 사본이 포함됩니다. 과 특히 모호 할 것입니다.