유한 상태 부분 정보 게임의 복잡성

가능한 결과가 각각 [-1,0, + 1] 인 [lose, draw, win] 인 극도로 많은 상태를 가진 결정 론적 부분 정보 제로섬 게임을 감안할 때 ,
그러한 가치의 근사치의 복잡성은 무엇입니까? 내의 부가 적으로 게임 ? $\epsilon$

특히, 나는 그것을하는 어떤 알고리즘도 만들 수 없습니다 .
이 게시물의 나머지 부분은 전적으로
문제에 대한 자세한 설명을 제공하기 위해 작성되었으므로이
게시물 맨 위에있는 질문의 의미를 이미 파악할 수 있으면 이 게시물의 나머지 부분을 읽을 이유가 없습니다.

상태의 심판 기계가 주어 지정된 초기 상태와, , 상태 그 점수 쌍은 , 상태 그 점수 쌍 형태의, 그리고 미국 $\{1,2,3,...,S\}$ $s_0$ $s_a$ $[-1,+1]$ $s_b$ $[+1,-1]$

여기서, $[\mbox{p1_info,p2_info,num_of_choices,player_to_move,next_state_table}]$

$\mbox{player_to_move} \in \{1,2\}$
은 의 함수입니다 $\mbox{next_state_table}$ $\{1,2,3,...,\mbox{num_of_choices}\} \to \{1,2,3,...,S\}$
$\mbox{p1_info},\mbox{p2_info}, \mbox{num_of_choices} \geq 1$

기계가 해당 형식의 상태 인 경우 :

전송 Player_1에 보냅니다 , Player_2에 $\mbox{p1_info}$ $\mbox{p2_info}$
$\mbox{num_of_choices}$ $\{1,2,3,...,\mbox{num_of_choices}\}$
다음 의해 표시된 상태로 이동 $\mbox{next_state_table}$

$s_a$ $s_b$

해당 상태의 점수 쌍을 출력으로 중지

$s_0 = 1$

다음 문제의 복잡성은 무엇입니까?
그러한 심판 기계와 양의 정수 N이 주어지면,
플레이어 1에 대한 자연 게임의 값의 1 / N 내에 있는 합리적 숫자 를 출력하십시오 .

이 질문의 앞부분에서 언급했듯이, 그
일을하는 알고리즘을 생각해 낼 수는 없습니다 .

cc.complexity-theory gt.game-theory

— 마르 치오 데 비아시
소스

플레이어는 내부 구조를 알고 있습니까? 추가 정보가 있으면 더 많은 이동이 가능합니까?

— domotorp 2016 년

예.

$\:$ 현재 상태가 무엇인지 더 잘 알 수 있습니다.

$\;\;\;$

미안하지만 여전히 이해가되지 않습니다. 그런 다음 내부 구조를 알고 있지만 현재 어디에 있는지 모릅니다. 설명을 명확하게 작성하십시오. 문제를 이해할 수없는 유일한 사람은 아닙니다.

— domotorp

모델이 "부분 정보가 포함 된 제로섬 턴제 확률 적 게임"과 동일합니까?

— Kristoffer Arnsfelt Hansen은

@ 크리스토퍼 :

$\:$ 내 모델이 코딩을 허용한다는 것은 분명하지 않습니다 (적어도 나에게는)

$\hspace{.8 in}$ 내 모델이 다른 모델과 동일하지만 비이성적 확률.

$\;\;\;\;$

답변:

참고 : 내 의도 알고리즘이 잘못되었습니다. 삭제했습니다.

$p$ $p$

A는 복잡성에 하한를 들어, 값에 근접의 질문 간단한 확률 게임 입니다 P에있는 것으로 알 수 없습니다 . 위에서 언급 한 무작위 배정 기법을 사용하면 다항식 크기의 조회 테이블이있는 참조 게임으로 간단한 확률 적 게임을 쉽게 작성할 수 있습니다.

— 피터 쇼어
소스

그 무작위 화 아이디어는 (적어도 설명대로) 합리적인 확률만을 줄 수 있습니다.

$\:$ 또한, 처음 두 논문에서 사용 된 정의는 게임에 유한 게임 트리가 있다는 것을 의미하지만, 유한 상태 공간 만 필요합니다 ( "상태"에 게임 기록이 포함되지 않음).

당신 말이 맞아 ... 내 대답의 첫 부분이 잘못되었습니다. 삭제하겠습니다. 모든 동전 뒤집기가 확률이 1/2 인 경우에도 간단한 확률 적 게임의 가치를 근사화하는 것이 P로 알려진 것은 아니라고 확신합니다.

— Peter Shor

$\epsilon$ $0<\epsilon$

입력 : 내 질문에 설명 된 게임은 다음과 같은
경우 예를 출력해야합니다 .1 플레이어의 게임 값이 1보다 큰 경우 $\hspace{.025 in}\epsilon$
$\epsilon$

때에도 RE 하드 유지

player_to_move는 항상 1 (즉, 1 명의 플레이어 만 필요)
이고
s ₀ ≠ s _a 및 s _a 는 Range (next_state_table)에 있지 않습니다
(즉, 플레이어가 잃을 수는 없습니다)
및
p1_info 및 p2_info 및 number_of_choices 상태와 무관합니다
(즉, 플레이어의 유일한 피드백은 그냥 이겼는지 여부입니다)