반복 게임에서 평형 보상이 아닌 실행 가능한 합리적인 보상


5

현재 읽고있는 교과서는 할인이있는 무한 반복 게임에서 실현 가능하고 개별적으로 합리적인 지불 벡터가있을 수 있지만 반복 게임의 평형 지불 벡터는 아니라고 주장합니다. 예는 3 명의 플레이어를위한 다음 기본 게임입니다.

     L       R
T  0,2,5    0,0,0
M  0,1,0    2,0,5
B  1,1,0    1,1,0

세 번째 플레이어는 단 하나의 가능한 액션을 가진 더미 플레이어입니다.

이 게임에서 :

  • 플레이어의 최소값은 1,1,0입니다.
  • 지불 벡터 1,1,5는 개별적으로 합리적이고 실현 가능합니다 (예 : TL과 MR을 동일한 주파수로 혼합)

이 책은 평형에서 유일한 보수 벡터는 1,1,0이라고 주장합니다! 왜?

반복되는 게임에서 평형으로 하자 . E 에서 행 및 열 플레이어의 대가는 1이어야합니다.EE

  • 최소값이므로 최소 1이어야합니다.
  • 모든 결과에서 이러한 플레이어의 유틸리티 합계는 최대 2이므로 최대 1이어야합니다.

TR 및 ML 셀에서 행 및 열 플레이어의 유틸리티 합계는 2 미만입니다. 그러므로,이 세포들은 전혀 평형 상태로 재생되지 않습니다.

따라서 평형에서 양의 빈도로 재생 될 수있는 유일한 세포는 TL, MR, BL, BR입니다.

이제 저자들은 TL과 MR이 전혀 균형을 이루지 못한다고 주장합니다. 이것으로부터 그들은 더미 플레이어의 보수가 0이라는 결론을 내립니다. 나는이 부분을 이해하지 못했습니다. TL과 MR이 평형 상태에서 재생되지 않는다는 것이 사실입니까? 왜?

답변:


5

δ=11,1,5δ<1

U1=0+2δ+0δ2+2δ3+...
U1=1+1δ+1δ2+1δ3+...
U1

이것은 책의 설명보다 훨씬 명확합니다. 감사!
Erel Segal-Halevi

1
그러나 당신은 선수들이 확실하게 TL과 MR을하지 않는다는 것을 증명했습니다. 또한 그들이 긍정적 인 확률로 TL과 MR을하지 않는다는 것도 증명해야합니다. 생각은 다음과 같습니다. 플레이어가 긍정적 인 확률로 TL을 플레이하면 TR과 ML을 플레이하지 않기 때문에 열 플레이어가 L을 확실하게 재생하고 행 플레이어가 T와 B를 혼합하는 경우에만 발생할 수 있습니다. 그러나 이러한 혼합은 행 플레이어에게 첫 번째 단계에서 1 미만을 엄격하게 부여합니다. 따라서 행 플레이어는 당신이 말한 것처럼 확률 1로 B로 벗어날 인센티브를 가지고 있습니다.
Erel Segal-Halevi 5
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.