유한 상태 부분 정보 게임의 복잡성


12


가능한 결과가 각각 [-1,0, + 1] 인 [lose, draw, win] 인 극도로 많은 상태를 가진 결정 론적 부분 정보 제로섬 게임을 감안할 때 ,
그러한 가치의 근사치의 복잡성은 무엇입니까? 내의 부가 적으로 게임 ?ϵ

특히, 나는 그것을하는 어떤 알고리즘도 만들 수 없습니다 .
이 게시물의 나머지 부분은 전적으로
문제에 대한 자세한 설명을 제공하기 위해 작성되었으므로이
게시물 맨 위에있는 질문의 의미를 이미 파악할 수 있으면 이 게시물의 나머지 부분을 읽을 이유가 없습니다.

상태의 심판 기계가 주어 졌습니다. . . , S } 지정된 초기 상태와, S 0 , 상태 S 그 점수 쌍은 [ - 1 , + 1 ] , 상태 S B 그 점수 쌍 [ + 1 , - 1 ] 형태의, 그리고 미국{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

여기서,[p1_info,p2_info,num_of_choices,player_to_move,next_state_table]

  • player_to_move{1,2}
  • { 1 , 2 , 3 , 의 함수입니다 . . . , num_of_choices } { 1 , 2 , 3 , . . . , S }next_state_table{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

기계가 해당 형식의 상태 인 경우 :

  • 전송 Player_1에 보냅니다 p2_info , Player_2에p1_infop2_info
  • num_of_choices{1,2,3,...,num_of_choices}
  • 다음 의해 표시된 상태로 이동next_state_table

sasb

  • 해당 상태의 점수 쌍을 출력으로 중지

s0=1





다음 문제의 복잡성은 무엇입니까?
그러한 심판 기계와 양의 정수 N이 주어지면,
플레이어 1에 대한 자연 게임의 값의 1 / N 내에 있는 합리적 숫자 를 출력하십시오 .

이 질문의 앞부분에서 언급했듯이, 그
일을하는 알고리즘을 생각해 낼 수는 없습니다 .


플레이어는 내부 구조를 알고 있습니까? 추가 정보가 있으면 더 많은 이동이 가능합니까?
domotorp 2016 년

예. 현재 상태가 무엇인지 더 잘 알 수 있습니다.

미안하지만 여전히 이해가되지 않습니다. 그런 다음 내부 구조를 알고 있지만 현재 어디에 있는지 모릅니다. 설명을 명확하게 작성하십시오. 문제를 이해할 수없는 유일한 사람은 아닙니다.
domotorp

3
모델이 "부분 정보가 포함 된 제로섬 턴제 확률 적 게임"과 동일합니까?
Kristoffer Arnsfelt Hansen은

1
@ 크리스토퍼 : 내 모델이 코딩을 허용한다는 것은 분명하지 않습니다 (적어도 나에게는) 내 모델이 다른 모델과 동일하지만 비이성적 확률.

답변:


6

참고 : 내 의도 알고리즘이 잘못되었습니다. 삭제했습니다.

pp

A는 복잡성에 하한를 들어, 값에 근접의 질문 간단한 확률 게임 입니다 P에있는 것으로 알 수 없습니다 . 위에서 언급 한 무작위 배정 기법을 사용하면 다항식 크기의 조회 테이블이있는 참조 게임으로 간단한 확률 적 게임을 쉽게 작성할 수 있습니다.


그 무작위 화 아이디어는 (적어도 설명대로) 합리적인 확률만을 줄 수 있습니다. 또한, 처음 두 논문에서 사용 된 정의는 게임에 유한 게임 트리가 있다는 것을 의미하지만, 유한 상태 공간 만 필요합니다 ( "상태"에 게임 기록이 포함되지 않음).

당신 말이 맞아 ... 내 대답의 첫 부분이 잘못되었습니다. 삭제하겠습니다. 모든 동전 뒤집기가 확률이 1/2 인 경우에도 간단한 확률 적 게임의 가치를 근사화하는 것이 P로 알려진 것은 아니라고 확신합니다.
Peter Shor

1


ϵ0<ϵ

입력 : 내 질문에 설명 된 게임은 다음과 같은
경우 예를 출력해야합니다 .1 플레이어의 게임 값이 1보다 큰 경우ϵ
ϵ

때에도 RE 하드 유지

player_to_move는 항상 1 (즉, 1 명의 플레이어 만 필요)
이고
s 0 ≠ s a 및 s a 는 Range (next_state_table)에 있지 않습니다
(즉, 플레이어가 잃을 수는 없습니다)

p1_info 및 p2_info 및 number_of_choices 상태와 무관합니다
(즉, 플레이어의 유일한 피드백은 그냥 이겼는지 여부입니다)

.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.