내쉬 평형은 일반적으로 계산할 수 없습니다. -Nash 평형 내에 상대편의 전략, 각 플레이어 얻 주어 전략의 집합 가능한 최대의 기대 보수. 과 게임에서 -Nash 평형을 찾는 것은 -완료입니다.
정의에 의해 엄격하게 살펴보면 주어진 -Nash 평형 전략이 Nash 평형 전략과 가까운 곳에 있다고 믿는 특별한 이유는없는 것 같습니다 . 그러나 우리는 종종 문헌이 "근사 내쉬 평형 계산"이라는 의미에서 "내쉬 평형 계산"과 같은 문구를 다소 간결하게 사용하는 것을 볼 수 있습니다.
그래서 두 번째가 첫 번째를 암시하는 것이 궁금합니다. 즉, 어떤 게임에서 -Nash equilibria가 Nash equilibria와 "가까운" 것으로 예상 됩니까?
더 공식적으로, 내가 명의 플레이어와 일련의 전략 프로필 입니다.
각 은 -Nash 평형이며, 시퀀스 는 0으로 수렴됩니다.
내 질문 :
언제 (어떤 조건 / 가정에서) 모든 전략이 수렴됩니까? 각 플레이어에 대한 것임을 , 반드시 수렴한다.
어떤 추가 조건 하에서이 시퀀스의 한계는 실제로 게임의 내쉬 균형입니까? (추가 전략 이 필요하지 않은 것 같습니다. 즉 , 모든 전략이 수렴되면 한계는 NE 여야합니다.)
-Nash 평형 을 계산하기위한 알고리즘이 반드시 Nash 평형의 대략적인 계산 전략을위한 알고리즘을 의미하는 것은 언제입니까? 위의 조건이 충분합니까?
매우 감사합니다!
2014-03-19 수정
Rahul의 답변에서 참조를 읽은 후 수렴 시퀀스가 아닌 분포 사이의 거리 를 로 생각하는 것이 더 합리적 입니다. 그래서 나는 질문을 바꾸고 최근의 생각을하려고 노력할 것입니다.
(이것은 실제로 알고리즘에 의존하기 때문에 너무 답을 구할 수 있습니다. 알고리즘에 대한 제한없이 두 개의 고유 한 내쉬 평형을 가질 수 있으며, 더 작고 작은 을 알고리즘에 연결함에 따라 연속적인 사이 의 거리 출력이 평형 사이에서 진동하므로 출력이 여전히 클 수 있습니다.)
가 전략 프로파일, 즉 플레이어 전략에 대한 제품 분포 라고 가정 합니다. 어떤 게임에서 가 -Nash equilibrium 이라고 말할 수 있습니까? 일부 Nash 평형 대해 를 . 여기서 은 입니까? (대가가 으로 제한되면 대화가 유지됩니다 .)
우리가 "게임"이라고 부르는 복잡한 설정에서 실제로는 순수한 전략의 수 ( "동작") 인 매개 변수화 된 일련의 게임이기 때문에 이것은 실제로 까다 롭습니다 . 따라서 과 같이 이고 상대 비율이 중요합니다. 다음은 답변이 "모든 게임"이 아님을 보여주는 간단한 반례입니다. 감소하는 시퀀스를 수정한다고 가정 합니다. 그런 다음, 각 에 대해 플레이어가 첫 번째 액션을 플레이하는 경우 다른 플레이어의 플레이 내용에 관계없이 의 보상을받는 액션 에 2 인용 게임을 구성하십시오 . 플레이어가 두 번째 행동을하면 의 대가를받습니다다른 플레이어가 무엇을하는지에 관계없이; 플레이어가 다른 행동을 하면 다른 플레이어의 행동에 관계없이 의 보상을받습니다 .
따라서 각 게임 에는 -equilibrium (둘 다 두 번째 동작)이 있으며 유일한 내쉬 균형 에서 거리에 있습니다 (둘 다 첫 번째 동작).
따라서 두 가지 흥미로운 하위 질문이 있습니다.
- 고정 게임 및 고정 , "충분히 작은" 여부에 관계없이 위의 조건이 유지됩니다 (모든 -equilibria는 Nash equilibria에 가깝습니다).
- 아마도 본질적으로 동일한 질문이지만, 지불금 차이가 상수에 의해 제한되는 경우 조건이 유지되는지 여부 입니다.
(2)와 같은 질문이지만 알고리즘에 의해 계산 된 실제 평형과 관련이 있습니다. 아마도 우리는 알고리즘 / 건설 답변을 얻거나 전혀 얻지 못할 것이므로 구별은 중요하지 않습니다.