내쉬 평형의 계산 한계 버전?


14

내쉬 평형 개념의 계산적으로 제한된 버전이 다음 줄을 따라 있는지 궁금합니다.

보드에서 재생되고 최적의 플레이가 EXPTIME-hard라는 점에서 복잡한 일종의 2 인용 완벽한 정보 게임을 상상해보십시오 . 간단하게 그리는 것이 불가능하다고 가정하십시오. 무작위로 다항식 튜링 머신 한 쌍 ( A , B ) 이 서로이 게임을 하고 있다고 상상해보십시오 . 각 n 에 대해 p A , B ( n )을 order- n 게임 에서 AB 를 이길 확률 로하자 . (콘크리트를 위해 A×(,),()확률 0.5 먼저 재생 얻을 수 있습니다.) 나는 한 쌍의 존재를 증명할 수 있다면 멋진이있을 거라고 생각 무엇 결코 기계 튜링 다항식 시간을 무작위로하는 속성 ' 지배 (여기서 " ' 지배 "수단 (P)의 ' , B ( N ) > P는 , B ( N ) 모두를위한 충분히 큰 N은 )와 마찬가지로 어떤 기계 튜링 다항식 시간을 랜덤 화 없음 B를 '(,)' '',()>,()'지배 ( " B는 ' 지배 B 수단" P의 , B ' ( N ) < (P)의 , B ( N ) 모두를위한 충분히 큰 N ).','()<,()

어쨌든, 나는 이것이 희망하기에 너무 많다고 생각하지만, 제한된 등급의 게임에 대해 이와 같은 것이 사실에 대한 희망이 있습니까?

이 질문에 대한 한 가지 동기는 주어진 체스 위치가 "화이트에게 유리하다"는 개념을 공식화 할 방법을 찾고 있다는 것입니다. 고전적으로, 포지션은 화이트에게 승리이거나 그렇지 않습니다. 그러나 인간과 컴퓨터의 체스 플레이어는 White가 이점을 갖는 것이 무엇을 의미하는지 직관적으로 이해합니다. 플레이어가 계산적으로 묶여 있고 최선의 움직임을 추측해야한다는 점을 감안할 때 White가 이길 확률과 관련이있는 것 같습니다. 무작위 알고리즘의 특정 쌍에 대해 물론 White가 이길 확률에 대해 이야기 할 수 있지만, 궁금한 점은 어떤 의미에서 정식 승리 확률이 플레이어 자신의 특질이 아닌 게임 자체에만 의존하는 위치에 대한 가치를 산출하는 계산적으로 제한된 플레이어 쌍.


내가 알고있는 계산적으로 제한된 균형 개념은 2014 년 민속 정리의 신화 뒤에 진실 에서와 같은 Halpern, Pass 및 Seeman을 생각하는 풍미가 다릅니다 . 우리는 주어진 게임에 대한 균형 전략을 찾는 것으로 가정하지 않습니다. 어렵습니다 (주어진 게임 때문에, 아닐 수도 있습니다). 오히려 플레이어가 수익성있는 편차를 계산하기 어려운 경우 모든 전략 세트가 균형이되도록합니다. (이것은 지수 전략 공간을 가정합니다. 그렇지 않으면 모든 편차를 확인할 수 있습니다.)
usul

답변:


1

나는이 질문에 대한 쉽고 완전하고 우아하며 만족스러운 답변이있을 수 있다고 생각할 수 없다. 특히 결말 지불은 계산하기가 어렵 기 때문이다. 그러나 의견으로 게시하기에는 생각이 너무 깁니다.

내가 가진 가장 좋은 아이디어는 이것입니다 : 체스의 경우, 정확한 양의 위치를 ​​무작위로 선택하여 주어진 위치에 대한 화이트의 재료 이점 (예 : 여분의 폰, 기사 등)을 기반으로 화이트가 이길 확률을 근사하십시오 재료 구성. 아마도 "모든 루크 체스"의 경우에, 우리는 "화이트가 블랙의 17 루크에 8 루크와 이길 가능성은 얼마나 될까요?"라고 말할 수 있습니다. 아마도이 확률은 4 % 일 것입니다. 그것을 계산하기 위해, 우리는 8 개의 흰색 루크와 17 개의 검은 루크가있는 무작위로 생성 된 1000 개의 서로 다른 체스 위치를 조사한 다음 모든 경우에 10 개의 딥을 예측하고 새로운 재료 구성이 무엇인지 확인해야합니다. . 그런 다음 마지막 재료 구성에 따라 예상되는 확률을 취하십시오.

물론, M 화이트 루크에서 N 블랙 루크 까지 의 모든 관련 가능성 ( M , N )에 대한 재료 구성을 찾아야합니다 . 아마도 가장 낮은 순서의 쌍 ( M = 1, N = 1)에서 시작하여 작동합니다. 거기에서

원래 위치의 경우 통계를 그대로 사용하지 마십시오 (예 : 원래 위치에 ( M = 6, N = 7) 루크가있는 경우 White가 25 %의 이길 확률이 있다고 가정하지 마십시오) (6,7)에 대한 예상 승리 확률); 대신, 더 정확할 수 있기 때문에이 한 위치만으로 평소와 같이 10 개의 움직임을보고 가능한 모든 끝 위치를 찾으십시오. 그런 다음 10-moves-deep 구성에 대한 올바른 경로 (양쪽의 최적 플레이 포함)를 찾아이 경로의 예상 확률을 원래 위치의 예상 확률로 선택하십시오.

이 과정은 다항식 시간으로 수행 할 수 있다고 생각합니다. 상대 유전율 깊은 고정을 위해 이동 K 체스 것은 기판의 크기 다항식이고, 그 수는 기판의 크기보다 작아야하기 때문에 흰색과 검은 루크의 총 수는 (어떤 의미에서) 단항 표현된다.

이것이 복잡하고 설명하기 어려운 것처럼 들리기 때문입니다. 내가 묘사하는 것에 대한 간결한 요약은 다음과 같습니다. 재귀와 기본 통계를 사용 하여 보드에 M 흰색 루크와 N 검은 루크가 주어진 흰색의 승리 확률을 계산하십시오 . 그런 다음이 값을 사용하여 k 가 깊게 이동하고 White가 원래 위치에서 이길 확률을 확인하십시오.

최종 의견 : 나는이 문제가 위키 백과에 따르면 PSPACE-complete 인 tic-tac-toe와 같은 비 EXPTIME 완료 게임에도 흥미 있다고 생각합니다. 또한, 나는 위에서 설명한 것과 같은 프로세스가 거기에서도 유용 할 수 있다고 생각하지만, 틱택 토에서 "소재"의 이점을 갖는 것은 불가능할 것입니다. X 또는 O의 우월성을 판단하기위한 다른 근거가 있어야 할 것이다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.