다목적 'Markov'게임에 대한 평형?

다음 형식의 제로섬 대칭 게임에 관심이 있습니다. 각 플레이어는 0부터 시작하는 카운터를 가지고 있습니다. 각 턴마다 플레이어는 고정 된 행동 세트 중에서 선택할 수 있습니다. 선택한 행동의 비용에 따라 플레이어의 카운터가 올라가거나 내려갑니다. (이것이 플레이어의 카운터를 0 아래로 떨어 뜨리면 잃게됩니다.) 그렇지 않으면, 페이 오프 매트릭스에서 각각의 행동을 찾아서 어느 쪽이이기는지 결정하십시오. 그렇다면 게임은 선택된 승자로 끝납니다. 어느 쪽도 이기지 않으면 게임은 다시 진행되지만 카운터는 유지합니다.

카운터가 라운드간에 재설정되지 않고 게임 수가 고정되지 않지만 플레이어의 행동에 달려 있다는 점을 제외하고는 반복되는 게임과 같습니다. 그런 식으로 셀 수없이 무한한 상태 공간을 가진 Markov 체인과 비슷합니다.

다음은 세 가지 동작이있는 장난감 예입니다.

A : 카운터에 1을 추가하십시오.
B : 카운터에서 1을 빼십시오. 상대방이 B 또는 C를 선택하지 않으면 승리합니다.
C : 카운터에서 2를 빼십시오. 상대방이 C를 선택하지 않으면 승리합니다.

이 유형의 게임에 대한 혼합 전략의 존재와 이들이 존재하는 경우이를 찾는 방법에 관심이 있습니다. 또한이 유형의 게임에 대한 이름이 있다면 알고 싶습니다 (정보를 훨씬 쉽게 찾을 수 있어야 함).

— 찰스
소스

라는 것이있다 제로섬 마르코프 게임 당신이 설명하는지에 관한 것 같다. Bewley and Kolhberg (1976) 와 Mertens, Neuve, Neyman (1982) 은 그러한 게임이 가치 기능을 인정한다는 것을 증명했습니다. 귀하의 질문에 대한 직접적인 대답은 아니지만 찾아 볼 가치가 있습니다.

— Herr K.