L_k 구별을위한 가장 작은 NFA 크기의 경계


18

두 글자가 같지 않도록 Σ 위에있는 모든 k 문자 문자열 로 구성된 언어 L k - d i s t i n c t를 고려하십시오 .LkdistinctkΣ

L k - d i s t i n c t : = { w = σ 1 σ 2 . . . σ ki [ k ] : σ iΣ  및  j i : σ jσ i }  

Lkdistinct:={w=σ1σ2...σki[k]:σiΣ  and  ji:σjσi}

이 언어는 유한하며 규칙적입니다. 특히 | Σ | = n|Σ|=n 이면 | L k d i s t i n c t | = ( nk ) k!|Lkdistinct|=(nk)k!.

이 언어를 받아들이는 가장 작은 비 결정적 유한 오토 마톤은 무엇입니까?

현재 다음과 같은 느슨한 상한과 하한이 있습니다.

  • 구성 할 수있는 가장 작은 NFA는 4 k ( 1 + o ( 1 ) )p o l y l o g ( n )4k(1+o(1))polylog(n) 상태입니다.

  • 다음의 정리는 2 K2k 상태의 하한을 의미합니다 .

하자 L ΣLΣ 일반 언어합니다. i = j 인 경우에만 x_i \ cdot w_j \ in L 이되도록 nP = { ( x i , w i ) 1 i n }P={(xi,wi)1in} 있다고 가정 합니다. 그런 다음 L을 수락하는 NFA는 적어도 n 개의 상태를 갖습니다.xiwjLxiwjLi=ji=j

  • 또 다른 (사소한) 하한은 loglog(nk)(nk) . 이는 언어에 대한 가장 작은 DFA 크기의 로그입니다.

I는 (에만 고정 부분을 수용하는 NFA 쌍이에 관심 0<ϵ<10<ϵ<1 )의 LkdistinctLkdistinct , 오토 마톤의 크기보다 작은 경우 ϵ4k(1+o(1))polylog(n)ϵ4k(1+o(1))polylog(n) .


편집 : 나는 텍스트에 실수가있는 현상금을 시작했습니다.

k = O (log (n))을 쓰는 동안 k = polylog (n) 이라고 가정 할 수 있었습니다 .k=polylog(n)k=polylog(n)k=O(log(n))k=O(log(n))

편집 2 :

바운티가 곧 종료 될 것이므로 누구나 쉽게 얻을 수있는 방법에 관심이 있다면 다음 언어를 고려하십시오.

L(r,k)distinct:={w:wL(r,k)distinct:={w:w 포함 kk 구별 된 심볼들을 더 심볼 이상 나타나지 rr 시간 }} .

(예 : L(1,k)distinct=LkdistinctL(1,k)distinct=Lkdistinct ).

주석의 구성과 유사한 구조는 대해 크기의 오토 마톤을 제공합니다. .O(ek2klog(1+r)poly(n))O(ek2klog(1+r)poly(n))L(r,k)distinctL(r,k)distinct

이것을 개선 할 수 있습니까? 이 언어에 가장 적합한 하한은 무엇입니까?


2
상한 NFA를 설명 할 수 있습니까?
mjqxxxx

아직 작업을 진행 중이므로 아직 글을 쓸 수 없으며 증거를 완성하지 못했습니다. 대신, 크기가 훨씬 간단한 오토 마톤을 설명하겠습니다 . -완전한 해시 패밀리 . 이러한 모든 해시는 함수 입니다. 이것은 최대 의 크기 의 의 모든 서브셋에 대해, 서브셋의 모든 아이템을 상이한 수로 맵핑하도록 함수를 갖는다는 것을 의미한다. 해싱 후, 생성 된 알파벳을 갖는 문자 크기 때문에 autumaton 수락 할 언어. O((2e)k2O(log(k))log(n))O((2e)k2O(log(k))log(n))(n,k)(n,k)HHh:[n][k]h:[n][k][n][n]kkhHhHkk2k2kLkdistinctLkdistinct
RB

4
하한은 에 NFA가 정확히 단계 후에 올 수있는 상태 수를 계산 합니다. 난 그냥 한 후 무엇을보고하는 것보다 얻을 수있는 것보다 전체 크기가 훨씬 좋은 경계를 제공 증거 방법을 알고 있다고 생각하지 않는다 일부 단계 . 그러나 여기에는 모든 대해 정확히 상태 다음 에 상태 중 하나에 만있을 수있는 NFA가 있습니다 . (2o(1))k(2o(1))kk/2k/2tttttt(2+o(1))k(2+o(1))ktt
Noam

3
증명 (내 이전 주장의) : 가장 어려운 경우는 . 선택 다른 임의의 서브 세트 (의 정확하게 크기의 알파벳 문자) 각을 각각에 대한 상태를 갖는 NFA 구성 제 IFF에 그것에 이어지는 어떤 경로를 개의 심볼은 모두 상이하고 에 포함되며 , 다음의 심볼이 모두 상이하고 의 보수에 포함되는 경우 허용 경로를 갖습니다 . 계산 인수는 whp ( 의 임의 선택을 넘어서)를 보여줍니다t=k/2t=k/22kpoly(k,logn)2kpoly(k,logn)SiSinnttiittSiSiktktSiSiSiSi이 NFA는 실제로 원하는 모든 언어를 받아 들일 것입니다.
Noam

3
이전 구성에서 NFA를 작성하는 가장 간단한 방법은 길이 의 가능한 각 접두사 와 길이 의 가능한 접미사에 대한 상태를 갖습니다 . 대신, NFA의 접두사 부분과 접미사 부분은 동일한 무작위 구성을 사용하여 재귀 적으로 구축 할 수 있지만 ( 각각 S i 와 그 보완 요소 내에서만 ) k ( 4 + o ( 1 ) ) k 총 크기를 제공합니다. j<tj<tj>ktj>ktSi(4+o(1))k
Noam

답변:


2

이것은 대답이 아니라 개선 된 하한으로 떠날 것이라고 믿는 방법입니다. 후 우리가 문제를 잘라 보자 문자를 읽을 수 있습니다. 가족 나타낸다 의 요소 세트 [ N ] 에 의해 및 패밀리 B = K를 - 의 요소 세트 [ N ] 에 의해 B . 요소 읽은 후에 도달 될 수있는 상태를 의미 함으로써 (임의의 순서로) S 요소 읽은 후 수용성 상태에 도달 할 수있는 상기 상태 B 가 (임의의 순서로)를 T Baa[n]Ab=ka[n]BASABTB. A B = ∅ 인 경우에만 S AT B 가 필요합니다 . 이것은 이미 필요한 수의 상태에 대한 하한을 제공하며 사소한 것을 줄 수 있다고 생각합니다.SATBAB=

이 문제는 본질적으로 선 그래프가 (부분적으로) 알려진 하이퍼 그래프의 정점 수에 대한 하한을 요구합니다. 유사한 문제들이 예를 들어 Bollobas 에 의해 연구되었으며 유용 할 수있는 몇 가지 알려진 증명 방법이 있습니다.

업데이트 2014년 3월 24일은 : 사실 위의 하이퍼 그래프는에 실현 될 수있는 경우 정점, 우리는 또한 길이의 비 결정적 통신 복잡한 프로토콜을 얻을 로그 크기의 입력 세트와 세트 disjointness에 대한 와 B (사실 두 가지 문제를 동일합니다). 병목 현상은 물론 a = b = k / 2 일 때 Eyal 및 Noam의 책에서만 다음을 찾을 수 있습니다 .N 1 ( D I S J a ) log ( 2 k log e (slogsaba=b=k/2a ) )는 표준 확률 론적 주장에 의해 입증되었다. 불행히도 나는이 문제에 대해 충분한 하한을 찾을 수 없었지만 위의 내용이 예리하다고 가정하면언급 한 두 개의 하한을 통합하는하한Ω(2klogn)을줄 것입니다.N1(DISJa)log(2kloge(na))Ω(2klogn)


1
답변 해 주셔서 감사합니다 @domotorp. 이것은 원래의 질문에서 하한에 사용했던 렘마의 증거와 비슷하지만 실제 x iy i 를 지정 하지 않았으므로 계산 가능한 경계는 아닙니다. 위의 질문에 대한 귀하의 의견은 그 방법으로 2 k 바운드를 개선 할 수 없다는 것을 제안합니다. 이게 더 좋을 것이라고 생각하십니까? xiyi2k
RB

3
위의 나의 의견의 요점은 이러한 기술들이 ( 2 + o ( 1 ) ) k 보다 낮은 하한값을 줄 수 없다는 것이다 . 이것이 실제로이 문제를 흥미롭게 만드는 이유입니다. (2+o(1))k
Noam

@Noam : k = 2, a = b = 1이라고하자. 이미 모든 S A 가 달라야 하므로 log n 하한값을 얻습니다 . lognSA
domotorp

1
@domotorp 다음 O ( 1 ) 숨겨 O ( K의 로그 N ) 여기서 최악의 경우에 대한 분석이다 : 인자 = B = K / 2 : 고정 된 시작 및 B 및 임의 서브 세트에서 선택 Sn 개의 문자는 우리가 P의 R [ S를o(1)O(klogn)a=b=k/2ABSnN 개의 DB S c ] = 2 - k . 이제 선택 R 2 K 다음 랜덤 확률 같은 집합이 이런 그들 중 적어도 하나는 위해 1 - E (X) P ( - (R) ) . 우리가 선택하는 경우 R = O ( 로그 ( NPr[ASandBSc]=2kr2k1exp(r)k ) )=O(klogn)그러면 whp는 모든 분리 된 세트AB(크기k/2)에 해당합니다. 이러한 총 수S는"이 구성에 s의 것은O(2KK의로그N). r=O(log(nk))=O(klogn)ABk/2SO(2kklogn)
Noam

2
@Noam : 미안하지만 난 본 적이 없다 로그 N 에 숨겨진 O ( 1 ) 에 대한 문제가 흥미로운 이럴이기도 특히, K < < 로그 N . 그러나 당신은 RB가 k = p o l y l o g n에 대해 물었다는 것이 맞습니다 . logno(1)k<<lognk=polylogn
domotorp

0

진행중인 일부 작업 :

하한을 4 k 증명하려고합니다 . 여기에 그런 하한을 줄 것이라고 확신하는 질문 이 있습니다. 함수 f 가 존재 하도록 최소 t를 찾으십시오 . : { S [ n ] , | S | = k / 2 } { 0 , 1 } t 불연속성 을 유지, 즉 S 1S 2 = iff f ( S 1 ) f (4ktf:{S[n],|S|=k/2}{0,1}tS1S2=S 2 ) = . 나는 t 2 k 의 하한이 거의 즉시우리의 문제에 대해 2 2 k = 4 k 의 하한을 암시한다고확신합니다. F ( S는 ) 대략 제 읽은 후에는 NFA를 얻을 수있는 노드들의 세트에 대응하는 K / 2 이 세트되면, 입력 심볼들을 K / 2 심볼은 S .f(S1)f(S2)=t2k22k=4kf(S)k/2k/2S

나는이 질문에 대한 해결책이 의사 소통 복잡성 문헌 (특히 불연속성 문제를 다루는 논문에서, 아마도 일부 매트릭스 순위 인수가 도움이 될 것임)이나 인코딩에 관한 문헌 (예 : 이와 같은 ) 에서 이미 알려져 있다고 생각한다 .


2
위의 의견은이 접근 방식이 ( 2 + o ( 1 ) ) n(2+o(1))n
Noam
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.