하면 할 -Nash 균형 전략 내쉬 균형 전략으로 수렴?


9

내쉬 평형은 일반적으로 계산할 수 없습니다. -Nash 평형 내에 상대편의 전략, 각 플레이어 얻 주어 전략의 집합 가능한 최대의 기대 보수. 과 게임에서 -Nash 평형을 찾는 것은 -완료입니다.ϵϵϵϵPPAD

정의에 의해 엄격하게 살펴보면 주어진 -Nash 평형 전략이 Nash 평형 전략과 가까운 곳에 있다고 믿는 특별한 이유는없는 것 같습니다 . 그러나 우리는 종종 문헌이 "근사 내쉬 평형 계산"이라는 의미에서 "내쉬 평형 계산"과 같은 문구를 다소 간결하게 사용하는 것을 볼 수 있습니다.ϵ

그래서 두 번째가 첫 번째를 암시하는 것이 궁금합니다. 즉, 어떤 게임에서 -Nash equilibria가 Nash equilibria와 "가까운" 것으로 예상 됩니까?ϵ


더 공식적으로, 내가 명의 플레이어와 일련의 전략 프로필 입니다.n(s1(1),,sn(1)),(s1(2),,sn(2)),(s1(3),,sn(3)),

각 은 -Nash 평형이며, 시퀀스 는 0으로 수렴됩니다.(s1(i),,sn(i))ϵiϵ1,ϵ2,ϵ3,

내 질문 :

  1. 언제 (어떤 조건 / 가정에서) 모든 전략이 수렴됩니까? 각 플레이어에 대한 것임을 , 반드시 수렴한다.jsj(1),sj(2),sj(3),

  2. 어떤 추가 조건 하에서이 시퀀스의 한계는 실제로 게임의 내쉬 균형입니까? (추가 전략 이 필요하지 않은 것 같습니다. , 모든 전략이 수렴되면 한계는 NE 여야합니다.)

  3. -Nash 평형 을 계산하기위한 알고리즘이 반드시 Nash 평형의 대략적인 계산 전략을위한 알고리즘을 의미하는 것은 언제입니까? 위의 조건이 충분합니까?ϵ

매우 감사합니다!


2014-03-19 수정

Rahul의 답변에서 참조를 읽은 후 수렴 시퀀스가 ​​아닌 분포 사이의 거리 를 로 생각하는 것이 더 합리적 입니다. 그래서 나는 질문을 바꾸고 최근의 생각을하려고 노력할 것입니다.1

  1. (이것은 실제로 알고리즘에 의존하기 때문에 너무 답을 구할 수 있습니다. 알고리즘에 대한 제한없이 두 개의 고유 한 내쉬 평형을 가질 수 있으며, 더 작고 작은 을 알고리즘에 연결함에 따라 연속적인 사이 의 거리 출력이 평형 사이에서 진동하므로 출력이 여전히 클 수 있습니다.)ϵ1

  2. 가 전략 프로파일, 즉 플레이어 전략에 대한 제품 분포 라고 가정 합니다. 어떤 게임에서 가 -Nash equilibrium 이라고 말할 수 있습니까? 일부 Nash 평형 대해 를 . 여기서 은 입니까? (대가가 으로 제한되면 대화가 유지됩니다 .)ppϵpq1δqδ0ϵ01

    우리가 "게임"이라고 부르는 복잡한 설정에서 실제로는 순수한 전략의 수 ( "동작") 인 매개 변수화 된 일련의 게임이기 때문에 이것은 실제로 까다 롭습니다 . 따라서 과 같이 이고 상대 비율이 중요합니다. 다음은 답변이 "모든 게임"이 아님을 보여주는 간단한 반례입니다. 감소하는 시퀀스를 수정한다고 가정 합니다. 그런 다음, 각 에 대해 플레이어가 첫 번째 액션을 플레이하는 경우 다른 플레이어의 플레이 내용에 관계없이 의 보상을받는 액션 에 2 인용 게임을 구성하십시오 . 플레이어가 두 번째 행동을하면 의 대가를받습니다nnϵ0ϵ1,ϵ2,ϵnn11ϵn다른 플레이어가 무엇을하는지에 관계없이; 플레이어가 다른 행동을 하면 다른 플레이어의 행동에 관계없이 의 보상을받습니다 .0

    따라서 각 게임 에는 -equilibrium (둘 다 두 번째 동작)이 있으며 유일한 내쉬 균형 에서 거리에 있습니다 (둘 다 첫 번째 동작).nϵn1

    따라서 두 가지 흥미로운 하위 질문이 있습니다.

    1. 고정 게임 및 고정 , "충분히 작은" 여부에 관계없이 위의 조건이 유지됩니다 (모든 -equilibria는 Nash equilibria에 가깝습니다).nϵϵ
    2. 아마도 본질적으로 동일한 질문이지만, 지불금 차이가 상수에 의해 제한되는 경우 조건이 유지되는지 여부 입니다.n
  3. (2)와 같은 질문이지만 알고리즘에 의해 계산 된 실제 평형과 관련이 있습니다. 아마도 우리는 알고리즘 / 건설 답변을 얻거나 전혀 얻지 못할 것이므로 구별은 중요하지 않습니다.


이 한계 지점 항상 되는 서브 순서 엡실론 - 평형의 수렴은,이 제한은 정확한 내쉬 균형이 될 것입니다. 이것은 혼합 전략 프로파일의 공간이 간결하고 유틸리티의 연속성이 혼합 전략 확률의 함수로서 기능한다는 것을 의미합니다. (s1...sn)
Noam

답변:


5

다음 논문은 근사 평형에 대한 개념을 적어도 정확한 평형에 가깝게 공식화하고, 일부 관련 구조적 결과를 입증합니다.

Pranjal Awasthi, Maria-Florina Balcan, Avrim Blum, 또는 Sheffet 및 Santosh Vempala (2010). 근사 안정 게임의 내쉬 평형. 알고리즘 게임 이론에 관한 제 3 차 국제 회의 (SAGT'10), 78-89에서 발췌.

특히,이 논문은 질문 3을위한 게임 클래스의 예를 제공합니다.


감사! 나는 이것이 최첨단이라고 생각합니다. 내 질문에 몇 가지 생각을 추가 할 것입니다.
usul
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.