내쉬 평형 계산을위한 알고리즘.


10

포럼을 검색하여 이전에 요청되었는지 확인했으며 알고리즘 게임 이론을 논의하는 동안이 특정 문제를 찾을 수 없었습니다. 유한 한 n 인 게임에서 근사 (혼합 전략) 내쉬 평형을 계산하기위한 가장 잘 알려진 알고리즘이 무엇인지 알아 내려고합니다. 물론이 알고리즘은 PPAD입니다. 알고리즘의 완벽한 정확성보다 속도 / 효율에 더 관심이 있습니다.

고마워, 필립


자세한 내용을 알려 주시면 더 잘 도와 드리겠습니다. 예를 들어 어떤 값을 염두에두고 있습니까? 지불 기능의 특별한 구조를 염두에두고 있습니까? 당신은 정말로 내쉬 균형이 필요합니까, 아니면 상관 균형이 충분할까요? 당신은 좋은 입증 가능한 범위 또는 좋은 실제 성능을 가진 무언가를 찾고 있습니까?
워렌 슈디

답변:


7

짧은 대답은 근사한 내쉬 평형을 찾을 수있는 다항식 시간 알고리즘이 있지만 모두 상대적으로 열악한 근사값을 발견한다는 것입니다. 실제로 게임을 할 알고리즘을 찾으려고하면 충분하지 않을 것입니다. n 플레이어 게임보다 2 플레이어 게임이 더 많이 알려져 있습니다.

실제로 (근사한) 내쉬 평형을 찾는 것이라면 코딩하기 쉬운 방법 중 하나는 무작위 가중치 알고리즘을 사용하여 각 플레이어와 게임 플레이를 시뮬레이션하는 것입니다 (http://en.wikipedia.org/ wiki / Randomized_weighted_majority_algorithm). 이것은 작동하지 않을 수도 있지만 대부분의 경우 작동합니다 (제로섬 게임과 같은 특정 클래스의 게임에서 보장됨). 특히이 과정이 전혀 수렴하면 내쉬 평형으로 수렴됩니다. 위험은 그것이 수렴하지 않고 영원히 순환한다는 것입니다. 그러나이 경우에도 게임 플레이의 경험적 역사는 일련의 거친 상관 평형으로 수렴됩니다.


위의 답변에 언급 된 논문을 살펴보기 시작했습니다. 나는 그 모든 것을 이해하지 못했다. 또한 "거친 상관 평형"이 무엇인지 간단히 설명 할 수 있습니까? 나는 상관 평형이 무엇인지 알고 있지만, 그러한 방정식의 의미는 무엇인지 알고 있습니다. 거칠다. 마지막으로, "게임 플레이의 경험적 역사가 수렴 될 것입니다 ..."등의 의미는 무엇입니까? 결코 수렴하지 않는 것이 어떻게 CCE 집합에 수렴 할 수 있습니까? 답변 주셔서 감사합니다. 지금 Wikipedia 기사를 찾고 있습니다.
Philip White

상관 상관 평형 또는 상관 평형으로 수렴되는 분포를 생성하는 알고리즘에 대한 배경 지식은 다음과 같습니다. cs.cmu.edu/~avrim/Papers/regret-chapter.pdf
Aaron Roth

거친 상관 평형이 아닌 상관 평형을 원하면 내부 후회없는 학습자를 사용할 수 있습니다. 예를 들어 (shameless plug) cs.brown.edu/~ws/papers/regret.pdf 입니다. 다항식 시간으로 직접 상관 평형을 계산하는 알고리즘도 있습니다.
워렌 슈디


4

실제로 소프트웨어로 구현되는 알고리즘에 관심이 있다면, 내가 아는 몇 가지가 있습니다.

  1. GAMBIT 패키지 (http://www.gambit-project.org/doc/index.html)는 2- 플레이어 및 n- 플레이어 일반 형식 및 경우에 따라 광범위한 형식 게임에 대해 여러 개의 내쉬 평형 알고리즘을 구현합니다.

  2. GameTracer (http://dags.stanford.edu/Games/gametracer.html)는 n 플레이어 노멀 폼 게임을위한 Govindan & Wilson의 GNM 및 IPA 알고리즘을 구현합니다.

  3. 대형 게임의 경우, 플레이어 수에 따라 크기가 기하 급수적으로 증가함에 따라 일반적인 형식 표현은 문제가됩니다. 대신 게임의 유틸리티 기능에 특정 종류의 구조가있는 경우 "간결한 표현"(예 : 그래픽 게임, 대칭 게임, 액션 그래프 게임)을 사용하여 훨씬 적은 공간을 사용하여 표현할 수 있습니다. 또한, 구조는 종종 계산 속도 향상을 위해 이용 될 수있다. 소프트웨어 측면에서 AGG Solver (http://agg.cs.ubc.ca)는 GameTracer의 GNM 알고리즘과 GAMBIT의 simpdiv 알고리즘을 AGG (Action-Graph Game) 표현에 맞게 조정합니다. (면책 조항 : 나는이 소프트웨어 pacakge의 개발에 참여하고 있습니다.)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.