poset에 대한 단조로운 술어를 배우는 데 필요한 최악의 질문


15

고려 (X,) 위에 한정된 poset n 항목 및 P 미지 단조 위에 술어 X (즉, 모든 대 x , yX , 만약 P(x)xy 다음 P(y) ). 하나의 노드 x X를 제공 하고 P ( x )가 유지 되는지 여부를 알아 냄으로써 P 를 평가할 수 있습니다 . 내 목표는 정확히 노드의 세트를 결정하는 XxXP(x)xX 되도록P(x) 의 몇 가지의 평가 지표로하여, 보유P 가능한. (모든 이전 쿼리의 답변에 따라 쿼리를 선택할 수 있습니다. 모든 쿼리를 미리 계획 할 필요는 없습니다.)

전략 S over (X,) 는 지금까지 실행 한 쿼리 및 응답에 대한 함수, 쿼리 할 노드 및 전략에 따라 모든 술어 에서이를 보장하는 함수입니다. 모든 노드 P에서 값을 알고있는 상태에 도달합니다 P. 실행중인 시간 r(S,P)S 술어에 P 쿼리의 수의 값을 알 필요가있다 P 모든 노드에 있습니다. 의 최악의 실행 시간 Swr(S)=maxPr(S,P) . 최적의 전략S 예하다wr(S)=minSwr(S) .

내 질문은 다음과 같습니다 : poset 를 입력 (X,)하면 최적 전략의 최악의 실행 시간을 어떻게 결정할 수 있습니까?

[빈 poset 쿼리가 필요하고 (각 단일 노드에 대해 질문해야 함), 약 log 2 n 쿼리 의 전체 순서 가 필요하다는 것이 분명 합니다 (이진 검색을 통해 프론티어 찾기) ). 보다 일반적인 결과는 다음과 같은 정보 이론적 하한입니다. 술어 P에 대해 가능한 선택 의 수 는 ( X , ) 의 안티 체인의 수 N X 입니다 ( 단조 술어와 일대일 술어 사이에 일대일 맵핑이 있기 때문입니다 ) P 의 최대 요소로 해석되는 안티 체인nlog2nPNX(X,)P) 따라서 각 쿼리는 하나의 정보를 제공하므로 이전의 두 가지 경우를 하여 적어도 log 2 N X 쿼리 가 필요합니다 . 이것이 밀접하게 묶여 있습니까, 아니면 학습이 안티 체인 수보다 무의식적으로 더 많은 쿼리를 요구할 수있는 구조를 가진 포즈가 있습니까?]log2NX


2
이 주제에 대한 이전 질문과 어떻게 다른가요? cstheory.stackexchange.com/questions/14772/…
Suresh Venkat

1
동의하지만 비슷하지만 전체 격자처럼 보이지 않는 작은 너비의 포즈를 포함하여 일반적인 포즈에 관심이 있습니다. 게다가, 나는 포셋의 선택의 함수로서 요구되는 쿼리의 수만큼, 점증적인 복잡성 또는 그 종류의 것에 대해서는 더 이상 신경 쓰지 않습니다. 이 설정에서 부울 함수 해석은 적용 할 수 없으며 실제로 해답은 포셋의 "구조"에 따라 달라지는 것처럼 보입니다 (제안한 안티 체인 수일 수도 있음). 바라건대 이것은 별도의 질문이 필요합니다. 잘못되면 닫으십시오.
a3nm

1
참고로 복잡한 문헌에서 정의한 전략은 일반적으로 "의사 결정 트리"라고하며 표준 높이 개념 (관심있는 측정 값)과 크기가 있습니다.
Joshua Grochow

고마워, 조슈아! 나는 이것을 거의 또는 잘 알고 있습니다. 게임 이론에서 어휘를 사용하는 것이 더 간단하다고 생각했지만, 전략이 나무로 보일 수 있다는 것을 알고 있습니다.
a3nm

1
(문제 없습니다. 그건 그렇고, 나는 그것이 나무로 보일 수 있다고 지적하지 않았습니다. 당신이 묘사 한 방법은 실제로 매우 간단하고 명확하지만, 당신에게 당신이 할 수있는 키워드 / 예술 용어를 제공했습니다 이 사이트를 자주 방문하는 많은 사람들에게 친숙한 용어 외에도 검색 할 수 있습니다. 건배!)
Joshua Grochow

답변:


7

이것은 완전한 대답은 아니지만 설명하기에는 너무 깁니다.

나는 바인딩 된 이 빡빡하지 않은 예를 발견했다고 생각 합니다.log2NX

다음 포즈를 고려하십시오. 접지 세트는 이며 a i 는 모든 i , j { 1 , 2 }에 대해 b j 보다 작습니다 . 다른 쌍은 비교할 수 없습니다. Hasse 도표는 4 주기입니다.X={a1,a2,b1,b2}aibji,j{1,2}4

포셋의 혼란으로 모노톤 속성을 식별하겠습니다. 이 포셋에는 , { b 1 } , { b 2 } , { b 1 , b 2 } , { a 1 , b 1 , b 2 } , { a 2 , b 1 , b 2 } , { a 1{b1}{b2}{b1,b2}{a1,b1,b2}{a2,b1,b2} ,이 포셋에는 7 개의 안티 체인이 있습니다. 따라서이 자세에 대한 ⌈ log 2 N X= log 2 7 = 3 입니다.{a1,a2,b1,b2}log2NX=log27=3

이제 적의 주장에 따르면 모든 전략에는 최소 4 개의 쿼리가 필요하므로 모든 요소를 ​​쿼리해야 함을 알 수 있습니다. 임의의 전략을 수정합시다.

전략은 첫째 쿼리 경우 후, 상대의 답변 " P를 ( 1 ) 보유하지 않습니다." 그런 다음, 우리는 다섯 가능성으로 남아 있습니다 : , { b를 1 } , { b를 2 } , { b를 1 , b를 2 } , { 2 , b를 1 , b를 2 } . 따라서 어떤 경우인지 결정하려면 적어도 가 필요합니다.a1P(a1){b1}{b2}{b1,b2}{a2,b1,b2}log25=3더 많은 쿼리. 총 4 개의 쿼리가 필요합니다. 첫 번째 쿼리 인 경우 같은 인수는 적용 2 .a2

전략이 먼저 쿼리 하면 공격자는 " P ( b 1 ) 보유 "라고 대답 합니다. 그리고 우리는 { b 1 } , { b 1 , b 2 } , { a 1 , b 1 , b 2 } , { a 2 , b 1 , b 2 } , { a 1 , b 2 }b1P(b1){b1}{b1,b2}{a1,b1,b2}{a2,b1,b2}{a1,a2,b1,b2} . 따라서 이전과 같이 최소 3 개의 쿼리가 더 필요합니다. 총 4 개의 쿼리가 필요합니다. 첫 번째 쿼리가 경우에도 동일한 인수가 적용됩니다 .b2

우리가 걸리는 경우 이 poset 병렬 복사본을 가지고 다음이 7 개 K 반 사슬을 따라서 결합이 제안 된 것은 로그 2 7 K= 3 케이 . 사본의 각 네 개의 쿼리를 필요로하기 때문에 그러나, 우리는 적어도 필요한 4 개 k 개의 쿼리를.k7klog27k=3k4k

아마도 더 큰 간격을 가진 더 큰 자세가있을 수 있습니다. 그러나이 주장은 계수를 향상시킬뿐입니다.

여기서 문제는 쿼리가 검색 공간을 균등하게 분할하지 않는 상황으로 보입니다. 그러한 경우, 상대방은 더 큰 반을 강제로 유지할 수 있습니다.


1
아, 흥미 롭습니다. 귀하의 예를 일반화 , 답이 i , ¬ P ( a i )i , P ( b i ) 이면 모든 2 n 노드가 쿼리 될 때까지 확실하게 알 수 없음이 분명 합니다. 그러나 2 n이 있습니다X={a1,...,an,b1,...,bn}i,¬P(ai)i,P(bi)2n 반 사슬 ( 2 N - 1 의 비어 있지 않은 서브 세트 I '에 대한 S, IDEM B I 의 한 공집합), 바인딩이, 예를 들면 2 감사 배 단단한되지 않도록. 그러나 격차가 곱셈 요소 이상일 수 있는지 또는 사소한 상한을 찾을 수있는 경우 정확한 답을위한 알고리즘은 물론 실제로는 알 수 없습니다. 2n+112n1aibi
a3nm

7

논문에서 모든 Poset은 중심 요소를 가지고 있으며 , Linial and Saks는 poset 에서 이상적인 식별 문제를 해결하는 데 필요한 쿼리 수가 최대 K 0 log 2 i ( X ) 임을 나타냅니다 ( 여기서 K 0 = 1 / ( 2 - 로그 2 ( 1 +가 로그인 2 5 ) )I ( X가 ) 의 수 이상이고 X . 그들이 "이상적"이라고 부르는 것은 실제로 하위 집합입니다XK0log2i(X)K0=1/(2log2(1+log25))i(X)X단조로운 술어와 그들이 보유하지 않은 하위 지점 사이에는 일대일 대응 관계가 분명합니다. "식별 문제"는 제 설정과 마찬가지로 노드를 쿼리하여 식별하는 것입니다. 내가 관심있는 문제를 다루고 i(X)=NX 입니다.

따라서 결과에 따르면 정보 이론적 하한은 상대적으로 작은 곱셈 상수까지 엄격합니다. 따라서 이것은 기본적으로 필요한 질문 수에 대한 문제를 의 함수로 곱셈 상수까지 정합니다. log 2 N XK 0 log 2 N X 사이 입니다.NXlog2NXK0log2NX

Linial과 Saks는 Shearer 가 K 0 보다 약간 작은 K 1에 대해 의 하한을 증명할 수있는 알려진 명령이 있다고 개인적 커뮤니케이션을 인용합니다 (이것은 의 작은 값에 대한 이러한 접근 시도 요시오 오카모토의 대답 K 1 ).K1log2NXK1K0K1

이것은 완전히에서 필요한 질문의 수를 계산하는 내 질문에 대답하지 않는 이후, 그러나를 계산 N X를 에서 X 것은 # P-완료 , 나는 작은 희망이 있다는 느낌이 듭니다. (이 시점에 대한 의견은 환영합니다.) 여전히 Linial과 Saks의 결과는 밝아지고 있습니다.XNXX


5

부울 n- 큐브 (또는 n- 요소 집합의 모든 부분 집합의 poset ( 2 S , )) 의 경우 Korobkov와 Hansel의 정리가 답을 제공합니다. (각각 1963 년과 1966 년부터). 헨젤의 정리 [1]에 따르면 알 수없는 모노톤 부울 함수 (즉,이 포즈에서 알 수없는 모노톤 술어)는 최대 ϕ ( n ) = ( n({0,1}n,)(2S,) 쿼리 (즉, 최악의 경우ϕ(n)질문). 이 알고리즘은 Korobkov 정리의 하한과 일치합니다 [2]. 이것은ϕ(n)-1개의쿼리로는 충분하지 않다고말합니다. (그래서 Hansel의 알고리즘은 최악의 경우에 최적입니다.) 두 명령문의 알고리즘은 결정 론적 결정 트리로 이해됩니다.ϕ(n)=(nn/2)+(nn/2+1)ϕ(n)ϕ(n)1

반 사슬의 수의 대수 점근 동일하다 ( N({0,1}n,) 이므로 사이에 일정한 갭 인자가로그NX와 최적 알고리즘 성능φ(N)~2 ( N(nn/2)2n/πn/2logNX .ϕ(n)2(nn/2)

불행히도, 웹에서 영어로 된 Hansel의 알고리즘에 대한 훌륭한 치료법을 찾지 못했습니다. n- 큐브를 ϕ ( n ) 으로 분할하는 것은 보조 정리를 기반으로합니다. ϕ(n) 특별한 특성을 가진 체인 합니다. 일부 설명은 [3]에서 찾을 수 있습니다. 하한에 대해서는 영어로 된 설명에 대한 언급이 없습니다.

이 결과에 익숙하기 때문에 Kovalerchuk의 논문에서 치료가 충분하지 않으면 arXiv에 대한 설명을 게시 할 수 있습니다.

별로 잘못하지 않은 경우, 적어도 poset 대한 Hansel의 접근 방식을 일반화하려는 시도가 있었으며 , 여기서 ( E k , ) 는 체인 0 < 1 < < k - 1 이지만 바로 참조 할 수 없습니다. 부울 경우의 사람들은이 문제에 대해 최악의 경우가 아닌 복잡성에 대한 개념도 조사했습니다.(Ekn,)(Ek,)0<1<<k1

[1] G. Hansel, Sur le nombre des fonctions booléennes monotones de n 변수. CR Acad. 공상 과학 파리, 262 (20), 1088-1090 (1966)

[2] VK 코 로브 코프. 논리 대수의 단조 함수 수와 논리 대수의 임의 단조 함수에 대한 리졸 브 세트를 찾기위한 알고리즘의 복잡도 추정. 소비에트 수학. Doklady 4, 753-756 (1963) (러시아어 번역)

B. Kovalerchuk, E. Triantaphyllou, AS Deshpande, E. Vityaev. 모노톤 부울 함수의 대화식 학습. 정보 과학 94 (1), 87-118 (1996) ( 링크 )


이 자세한 답변을 주셔서 감사합니다! 부울 큐브의 경우 cf < cstheory.stackexchange.com/q/14772 >. 프랑스어를 읽을 수는 있지만 Hansel의 논문을 찾을 수 없었습니다 (Gallica에서 사용 가능해야하지만이 문제가 누락 된 것 같습니다). 소련 컴퓨팅 수학 수학 물리, Vol 22, No 2, 207-220 (영어 번역이 존재 함). 심판을 찾을 수 있다면 다른 DAG에 대한 일반화에 관심이 있습니다. 길이 제한에 문제가 있으면 주저하지 말고 이메일 (a3nm AT a3nm DOT net)로 회신하십시오. 다시 감사합니다! n
a3nm

아니에요! 불행히도, 나는 출력 크기 측면에서 알고리즘 실행 시간을 바인딩하는 방법을 모른다. 예를 들어 Korobkov의 하한에 대한 증거는 그 질문에 대한 답변을 제공하지 않습니다. 그러나 약간 관련성이 있다고 생각합니다. 주말 동안 시간을 ​​찾아서 일반화도 찾아 볼 것입니다. 동시에, 부울 경우에 대한 닫힌 영어 설명 (이 두 가지 이론)을 쓸 가치가 있는지 확실하지 않습니다.
dd1

@ a3nm 아마도 DAG 사건이 문헌에서 고려되지 않았을까요? 포함하여 주문한 부울 n- 큐브보다 어려울 수 있습니까?
vzn

@ vzn 나는 여기에있는 질문 중 적어도 일부가 공개되어야한다고 생각합니다. 체인의 경우에도 헨젤 알고리즘을 일반화하는 방법이 명확하지 않습니다.
dd1

@ a3nm 그것은 모두 하한 / 최소 모노톤 회로 (크기)를 찾는 것과 비슷해 보이지만 지금까지 명확하게 연결된 것을 보지
못했습니다

0

[ 참고 : 다음 주장은 효과가없는 것 같지만 다른 사람이 같은 실수를하지 않도록 누군가가 해결할 수 있도록 여기에 남겨두고 있습니다. 문제는 아래와 같이 모노톤 함수 학습 / 식별에 대한 지수 하한이 문제에 대한 증분 다항식 알고리즘과 반드시 모순되는 것은 아닙니다 . 폴리 타임에서 두 개의 모노톤 함수의 상호 이중성을 검사하는 것과 동등한 것은 후자입니다.]

나는 에 대한 당신의 추측 이 일반적으로 거짓 이라고 생각합니다 . 실제로 log N X 쿼리가 필요한 경우 멤버쉽 쿼리를 사용하여 모노톤 함수 학습 에 대한 하한이 상당히 높다는 것을 의미 합니다 . 특히, poset의하자 X는 (만약 당신이 좋아하면, 보통의 순서와 부울 큐브 수 X가 의 파워 셋이다 { 1 , . . . , N } 으로 그 부분 순서로). 숫자 M 의 최대의 반 사슬의 X를 만족하는 기록 M =logNXlogNXXX{1,...,n}MXlogM=(1+o(1))(n1n/2)logNX is correct, then there is some monotone predicate on X that requires essentially (n1n/2)2n queries. In particular, this implies a lower bound of essentially 2n for the complexity of any algorithm solving this problem.

However, if I've understood correctly [which I now know I hadn't], your problem is equivalent to checking the mutual duality of two monotone functions, which can be done in quasi-polynomial time (see the intro of this paper by Bioch and Ibaraki, which cites Fredman and Khachiyan), contradicting anything close to a 2n lower bound.

[1] Liviu Ilinca and Jeff Kahn. Counting maximal antichains and independent sets. arXiv:1202.4427


Josh, I don't see a problem with the logNX argument. my understanding is that it is open whether a monotone function can be learned in time polynomial in n and the number of minimal elements. the Bioch-Ibaraki paper is about incrementally polynomial algorithm
Sasho Nikolov

Ah, okay. I wasn't aware of that. (Like I said, I'm not an expert in this area - my answer was just based on looking up a few things and putting them together.) I'll leave it here so other people can see it and at least not make the same mistake / at best turn it into something useful.
Joshua Grochow
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.