알파벳의 크기 (


9

허락하다 Σ알파벳, 즉 비어 있지 않은 유한 집합이어야합니다. 문자열은 다음에서 나오는 요소 (문자)의 유한 시퀀스입니다.Σ. 예로서,{0,1} 이진 알파벳이고 0110 이 알파벳의 문자열입니다.

일반적으로 Σ 하나 이상의 요소를 포함하며 요소의 정확한 수 Σ중요하지 않습니다. 기껏해야 다른 상수로 끝납니다. 즉, 이진 알파벳, 숫자, 라틴 알파벳 또는 유니 코드를 사용하더라도 실제로 중요하지 않습니다.

알파벳의 크기가 중요한 상황의 예가 있습니까?

내가 관심이있는 이유는 내가 그러한 예 중 하나를 발견했기 때문입니다.

모든 알파벳 Σ 우리는 무작위 오라클을 정의합니다 OΣ 무작위 요소를 반환하는 오라클이되어야합니다. Σ모든 요소에 대해 동일한 기회가 리턴되도록 모든 요소에 대한 기회는 1|Σ|).

일부 알파벳 Σ1Σ2 -크기가 다를 수 있습니다.-액세스 가능한 Oracle 머신 클래스를 고려하십시오. OΣ1. 우리는이 클래스의 오라클 머신에 관심이 있습니다.OΣ2. 즉, 오라클을 변환하고 싶습니다OΣ1 오라클로 OΣ2튜링 머신 사용. 우리는 그러한 Turing 기계를 변환 프로그램이라고 부를 것입니다.

허락하다 Σ1={0,1}Σ={0,1,2,3}. 변환 중OΣ1 오라클로 OΣ2 쉽다 : 우리는 질의한다 OΣ1 두 번, 결과를 다음과 같이 변환합니다. 000, 011, 102, 113. 분명히이 프로그램은O(1) 시각.

이제하자 Σ1={0,1}Σ={0,1,2}. 이 두 언어의 경우 모든 변환 프로그램은O() 시간, 즉 전환 프로그램이 없습니다 OΣ1OΣ2 그 실행 O(1) 시각.

이것은 모순에 의해 입증 될 수 있습니다 : 변환 프로그램이 있다고 가정하십시오. C ...에서 OΣ1OΣ2 에 실행 O(1)시각. 이것은dN 그런 C 최대한 활용 d 에 쿼리 Σ1.

C 보다 적게 만들 수있다 d특정 실행 경로의 쿼리. 변환 프로그램을 쉽게 만들 수 있습니다C 그 실행 C오라클 쿼리 횟수를 추적합니다. 허락하다k 오라클 쿼리 수입니다. C 그런 다음 dk 추가 오라클 쿼리, 결과를 버리고, 무엇을 반환 C 돌아 왔을 것이다.

이런 식으로 정확하게 |Σ1|d=2d 실행 경로 C. 바로 그거죠1|Σ2|=13 이 실행 경로 중 C 귀국 0. 하나,2d3정수가 아니므로 모순이 있습니다. 따라서 그러한 프로그램이 존재하지 않습니다.

더 일반적으로 알파벳이 있다면 Σ1Σ2|Σ1|=n|Σ2|=k에서 변환 프로그램이 존재합니다. OΣ1OΣ2 모든 소수가 소인수 분해에 나타나는 경우에만 n 또한의 주요 인수 분해에 나타납니다 k (따라서 인수 분해에서 소수의 지수는 중요하지 않습니다).

그 결과 우리가 길이의 이진 문자열을 생성하는 난수 생성기가 있다면 l, 난수 생성기를 사용하여 숫자를 생성 할 수 없습니다. {0,1,2} 정확히 같은 확률로.

나는 슈퍼마켓에 서서 저녁 식사를 위해 무엇을 먹을지 고민하면서 위의 문제를 생각해 냈습니다. 코인 토스를 사용하여 선택 A, B 및 C를 결정할 수 있는지 궁금했습니다. 결과적으로 불가능합니다.


5
PCP 정리에 대한 Dinur의 증명은 알파벳 크기의 조작, 특히 폭파 한 다음 PCP 구성을 통해 반복적으로 축소하는 것에 크게 의존합니다. 두 번째 단계가 없으면 (알파벳 크기를 줄이면) 증명이 작동하지 않습니다.
Daniel Apon

2
@Daniel Apon : 답변으로 다시 게시하지 않겠습니까?
Joshua Grochow

@Joshua, 죄송합니다. 확실한. :)
Daniel Apon

답변:


11

형식적 언어 이론에는 2 자 및 3 자 알파벳이 질적으로 다르게 동작하는 몇 가지 예가 있습니다. Kozen은 다음과 같은 좋은 예를 보여줍니다 (그림으로 표시).

알파벳을 보자 Σ= 표준 숫자 순서와 함께 {1, .., k}이고 sort (x)를 x의 문자가 정렬 된 순서로 나타나는 단어 x의 순열로 정의하십시오. 정렬 정렬 (A) = {sort (x) | 엑스 A}이며 다음 주장을 고려하십시오.

A에 컨텍스트가 없으면 sort (A)에 컨텍스트가 없습니다.

이 주장은 k = 2에 대해서는 사실이지만 k에 대해서는 거짓입니다. 삼.


11

PCP 정리에 대한 Dinur의 증거 는 알파벳 크기의 조작에 크게 의존합니다.

구체적으로, 증거의 전체 구조는 그래프 크기 횟수의 로그인 그래프 전력 기술의 반복 적용이다. 각 반복에서 그래프는 정규 확장 그래프로 사전 처리되고, 힘 (알파벳 크기를 날려 버림)에 의해 증폭 된 다음 PCP 구성이 적용됩니다 (각 알파벳 제약 조건은 큰 알파벳 제약 조건으로 전환됨). 작은 알파벳).

프로세스의 암시 적 목표는 UNSAT 값이 일정한 비율이 될 때까지 증폭 단계를 재사용하는 방법을 찾는 것입니다 (PCP 정리 증명). 요점은 알파벳 크기가 매번 되풀이되지 않는 한 결과 그래프가 최종 축소에 필요한 것이 아니라는 것입니다.


9

예제의 요구 사항은 매우 엄격합니다. 이완하면 전환이 작동하도록 요구하기 만합니다.O(1)기대 . 에서 균일하게 샘플링 할 수 있습니다{0,1,2} 일정한 수의 동전 던지기를 사용하여 기대.

나는 이것에 대한 전문가는 아니지만 한 가지 좋은 예는 알파벳의 크기가 코딩과 간결한 데이터 구조라는 것입니다. 알파벳을 통해 메시지를 나타내고 싶다고 상상해보십시오{0,1,2} 알파벳으로 {0,1}(예 : 바이너리 컴퓨터에 저장). 필요한 공간을 최소화하려고하지만 동시에 메시지의 개별 문자를 빠르게 읽고 쓸 수 있기를 원합니다 (O(1)). 이와 같은 문제는 현재 꽤 오랫동안 연구되어 왔습니다. Dodis, Patrascu, Thorup 의 최근 논문 과 그 참고 문헌은 시작하기에 좋은 시점이되어야합니다.


8

오류 수정 코드에서 오류의 일부를 수정하는 코드에 대한 Gilbert Varshamov 예제 (기본적으로 욕심 많거나 임의의 예제)는 다음과 같이 믿기 때문에 이진 코드와 큰 알파벳에 대한 코드 사이에는 근본적인 차이가있을 수 있습니다. 이진 경우에 단단하고 대수 기하학 코드를 통해 큰 알파벳에 대해 단단하지 않은 것으로 알려져 있습니다. 이로 인해 일부는 큰 알파벳에 대한 오류 수정 코드의 표준 정의가 이진 오류 수정 코드의 올바른 아날로그가 아니라고 추측했습니다.


5

나는 알파벳 크기의 작은 차이에 대한 내 자신의 연구에서 흥미로운 이론을 발견했습니다. 결과 이론에서 극적인 차이를 만듭니다. 거친 설명 학습자가 숨겨진 회로의 게이트를 무시하고 결과 출력을 관찰 할 수 있으며, 목표는 "기능적으로 동등한"회로를 생산하는 것입니다 : 확률 회로를 학습의 문제는 다음과 같다. 부울 회로의 경우 게이트가 출력에 "영향"을 줄 때마다 해당 게이트에서 회로의 출력으로 영향을 미치는 경로를 분리 할 수 ​​있습니다. 알파벳 크기의 회로이것은 더 이상 적용되지 않습니다. 즉, 출력 값에 큰 영향을 미치는 게이트가 있지만 출력에 대한 경로에는 영향을 미치지 않는 회로가 있습니다! 우리는이 결과가 놀랍다는 것을 알았습니다.

결과 는 다소 기술적이지만 관심이 있다면 관련 정리 진술에 대해 Lemma 8을 4.1과 대조 할 수 있습니다.


이것은 매우 흥미로운 것 같습니다. 부울 케이스와 비슷한 것을 얻을 수 있는지 확인하기 위해 영향의 정의를 수정하려고 했습니까?
Kaveh

영향에 대한 우리의 정의는 매우 자연 스럽습니다. 목표의 다른 설정이 주어지면 출력 노드의 확률 분포를 봅니다. 모든 설정이 동일한 정확한 확률 분포를 산출하면 목표는 영향을 미치지 않습니다. 관심이 있으시다면, 우리가 작업 한 모델을 VIQ 모델이라고합니다. 가장 흥미로운 회로 학습 모델이라고 생각합니다. 그것은 Angluin et al.에 의해 ( cs.yale.edu/homes/aspnes/… )에 정의되어 있다. STOC '06.
레프 레이 진
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.