오스본, 내쉬 평형 및 신념의 정확성


12

Osborne의 게임 이론 소개 내쉬 평형은 다음과 같이 설명됩니다 (21-22 페이지).

먼저, 각 플레이어는 다른 플레이어의 행동에 대한 신념을 감안할 때 합리적인 선택 모델에 따라 자신의 행동을 선택합니다. 둘째, 다른 플레이어의 행동에 대한 모든 플레이어의 믿음은 정확합니다.

이 정의는 각 플레이어의 전략이 다른 사람들의 전략에 가장 잘 반응하는 전략 프로필로서 내쉬 평형의 일반적인 정의와 완전히 동일하지 않은 것 같습니다.

일반적인 정의는 신념에 대해 아무 말도하지 않으므로 신념이 잘못되었을 가능성을 허용합니다.

사소한 가능성을 감수하려면 죄수의 딜레마를 고려하십시오. 각 플레이어가 다른 플레이어가 고백하지 않을 것이라고 생각한다고 가정하자. 고백은 지배적 인 전략이므로 각 플레이어는 여전히 고백합니다. 따라서 플레이어의 신념이 실제 평형 행동과 완전히 반대이지만 행동은 내쉬 평형을 구성합니다.

오스본의 정의가 내쉬의 평형 이외의 다른 것을 특징으로한다는 것을 이해하는 데 맞습니까?


하지 않습니다 "일반적인 정의는 믿음에 대해 아무것도 말하지 않는다, 따라서 믿음이 잘못 될 수있는 가능성을 허용합니다." 이러한 정의에서 항상 기본 합리성 가정이 있다는 사실에 간단하게 얽매이지 않습니까?
Thorst

답변:


9

신념이 게임 이론의 다른 부분에서 매우 특정한 의미를 가지고 있다는 점에서 신념 언어를 여기에 소개하는 것은 약간 이상합니다.

aii1ai

i{aj}jiai1i


i

  • 게임이 자주 재생되는 게임이라면 (반복 된 게임에서 유지 될 수있는 다른 결과의 문제를 제쳐두고) 내쉬는 우리가 수렴하면 사람들이 계속하는 표준을 개발할 수 있다는 의미에서 평형이라고 생각할 수 있습니다 그 평형을 무기한으로 재생하고 다른 사람들도 똑같이 할 것으로 기대합니다.
  • 게임이 실제로 일회성이라면 일반적으로 플레이어가 다른 사람들이 무엇을할지 예측하려고한다는 생각을 불러 일으 킵니다. 우리의 균형 개념에는 이러한 예측이 정확해야한다는 생각이 담겨 있습니다.

두 번째 요점의 예측은 오스본이 불러 온 "믿음"에 해당하는 것으로 보인다. 그러나 이러한 예측 / 신념은 평형 상태에서 일어나는 일을 개념화하는 데 도움이되는 비공식적 / 직관적 인 도구 일 뿐이며 이러한 평형 정의의 일부가 아니라는 점을 강조하는 것이 중요합니다. 내쉬 균형 자체의 개념은 오스본가에 갈 때 이유이다, (당신이 코멘트에주의로, 그것은 단지 행동을 통해 정의된다) 믿음의 개념에 완전히 무관하다 공식적으로 내쉬 균형을 정의, 그가를 호출하지 않고 그렇게 신념에 대한 아이디어.


4

신념을 도입하면 NE의 개념은 PBE 및 순차적 평형과 같은 다른 정제 개념과 비교할 수 있지만 NE의 의미는 바뀌지 않습니다.

Mas-Colell, Whinston 및 Green (MWG)의 대학원 용 마이크로 교과서 결과

σΓEμ

  1. σμ HPr(H|σ)>0
  2. 신념 체계 ( 는 가능할 때마다 베이 즈의 규칙을 통해 전략 프로파일 ( 로부터 도출된다 .μσ

따라서 죄수의 딜레마 예제는 플레이어가 상대방의 실제 전략과 반대되는 믿음이 두 번째 조건에 실패한다고 믿는 경우에 가능합니다. 실제로 이것은 Osborne 정의의 두 번째 요구 사항과 수학적으로 동일합니다. 다른 플레이어의 행동에 대한 플레이어의 신념이 정확하다는 것입니다.


MWG와 Osborne에는 차이가 있다고 생각합니다. MWG는 내쉬 평형에 대해 그것이 존재하는 신념 체계를 "존재하고있다"고 말하고있다. 우리는 플레이어들이 실제로 가지고있는 믿음에 대해 침묵합니다. 오스본은 선수들이 실제로 신념을 가지고 있으며 그들이 옳다고 말합니다. 나는 일반적인 정의가 전혀 신념을 언급하지 않고 죄수의 딜레마 사례가 전략이 신념을 독특하게 결정하지 않는다는 것을 보여주기 때문에 후자가 NE의 개념적 의미를 변경한다고 생각했다.
Jyotirmoy Bhattacharya

@JyotirmoyBhattacharya : MWG가 "있는 경우 플레이어가 실제로 가지고있는 믿음에 대해 침묵"한다고 생각하지 않습니다. 제안의 조건 2는 실제로이 신념이 가능할 때마다 Bayes의 규칙을 사용하여 균형 전략 프로파일에서 도출되어야한다고 요구합니다. 따라서, PD 예에서, 하나의 플레이어가 확률 1을 갖는 결함을 선택할 때, 다른 플레이어의 신념은 또한 행동 결함에 대한 확률 1을두고 그러한 신념에 따라 최선의 응답을해야한다 (그는 또한 결함을 선택하게한다).
Herr K.

@JyotirmoyBhattacharya : NE에 대한 믿음은 독특 할 필요는 없습니다. 주어진 평형에 대해 게임 트리의 경로가 확률 0으로 취해지면 Bayes의 규칙이 적용되지 않으므로 해당 경로에 대한 믿음은 NE에서 "정확한"것으로 간주되기 때문입니다. 이것이 또한 평형 경로에서 불합리한 신념을 배제하기 위해 순차 평형과 같은 개선이 도입되는 이유입니다.
Herr K.

@JyotirmoyBhattacharya : 또한 저학년 교과서이기 때문에 오스본은 교육 학적 이유로 수학적으로 엄격한 언어보다 직관적 인 언어를 선택했을 수도 있습니다. 저에게 Osborne의 정의에서 두 가지 조건은 MWG 제안의 정확한 조건입니다.
Herr K.

3

죄수의 딜레마 예는 지배적 인 전략을 가진 게임이기 때문에 효과가 있습니다. 오스본이 맞습니다.

당신이 준 정의에서와 같이 다른 플레이어의 전략에 가장 잘 반응하려면, 나는 그들의 전략을 알아야합니다. 다시 말해, 나는 그들이하는 일에 대한 믿음을 가져야하며, 그러한 믿음은 정확해야합니다. 이것은 합리성 개념의 강화입니다.

당신은 지배적 인 전략을 가진 게임에서 어떻게 이상한 "평형"을 얻을 수 있는지에 대해 흥미로운 지적을합니다. 가 잘못되어 비 전략에 긍정적 인 가중치를 부여 하는 결과 동등 및 에 해당 합니다. 그러나 나는 믿음을 포함한 내쉬 균형을 본 적이 없다. " 의 전략 프로필 경우 내쉬 평형입니다.(σ,μ1)(σ,μ2)μ2σΣσiBi(σi)... "나는 이것이 신념이 전략 프로파일의 정확한 평가이기 때문에 신념을 정의하는 것이 불필요하다는 것을 의미한다고 믿는다. 내 책 중 하나를 참조하면 내쉬 (1950) 인용과 함께 일반적인 정의를 제공한다. 하나는 올바른 신념이고 다른 하나는 올바른 신념을 감안할 때 합리적 행동입니다.


그러나 무언가를 반증하는 것은 하나의 countrexample로 충분합니다. Osborne을 그의 정의가 Nash와 동일하다고 주장한다면, 죄수의 딜레마 대응 사례를 어떻게 다루는가? 나는 Osborne의 정의가 합리성의 강화라는 것을 이해합니다. 나는 여기서 평형이 행동과 신념에 대해 정의되는 단순한 이유 때문에 내쉬 평형이 아니라고 주장합니다. 반면에 내쉬 평형은 신념에 대해 완전히 침묵합니다.
Jyotirmoy Bhattacharya

1
증거가 아니라 정의입니다.
Pburg

그럴 수 있지. 그러나 이미 잘 받아 들여진 또 다른 정의가있는 개념의 정의입니다. 따라서 저자가 달리 언급하지 않으면 두 정의가 동일하다고 주장합니다.
Jyotirmoy Bhattacharya

명확하게 말하면, 그는 그 의견을 정의 나 토론에 포함 시키는가? 추신 내 답변을 편집
Pburg

내가 인용 한 부분은 토론입니다. 그 후 즉시 그는 (p.22) "이러한 두 가지 구성 요소는 다음과 같은 정의로 구현된다"고 말하고 전혀 신념이 언급되지 않은 전략에 대한 최선의 대응 측면에서 표준 정의를 제공합니다. 그렇다면 정의에서 신념은 어디에 구현되어 있습니까? 그리고 문제는 지배적 인 전략을 가진 게임에서만이 아닙니다. 지배적 인 전략은 없지만 내쉬 균형 전략은 균형 놀이와 다른 신념에 가장 잘 반응하는 사례를 구축하는 것이 가능하다.
Jyotirmoy Bhattacharya

2

나는 이전에 말한 것을 반복하고 있을지 모르지만 여기에 내가 취해야 할 것이 있습니다.

두 가지 모델을 비교할 때 일반적인 문제에 직면한다고 생각합니다. "동등성"이 의미하는 것은 두 정의가 다른 세계 또는 다른 모델에 있기 때문에 완전히 명확하지 않습니다. 그러나 "동등성"이 적절하게 정의된다면 Osborne 정의를 이해하고 그것이 NE와 "동등"하다는 것을 보여줄 수 있다고 생각합니다.

인용 된 섹션의 기초가되는 솔루션 개념은 다음과 같습니다.

믿음 평형 (BE) :> 전략 프로파일 및 신념 프로파일 모든 플레이어sbi

B * = * - I

ui(si | si=bi)ui(s | si=bi) for all sSi
bi=si

우리가 "동등한"진술에 도달 할 경우의 문제는, 한편으로는, 우리는 ... 신념과 함께 세계에서 "살아있는"BE가 있고 다른 한편으로는 세계에 사는 NE 개념이 있다는 것입니다 ... 신념의 면제. "NE BE" 와 같은 내용은 무엇을 의미할까요?

1) BE NE

우리가 더 복잡한 모델에서 더 간단한 모델로 이동하기 때문에 이러한 의미의 방향은 논란의 여지가 없습니다. "모든 BE는 NE"는 BE의 균형 전략 프로파일을 보면 (즉,지지 믿음 프로파일 가없는 경우) NE 여야한다는 것을 의미 해야합니다. 이것이 사실인지 확인할 수 있습니다.p

2) NE BE

이것은 까다로운 부분입니다. "모든 NE가 BE"라는 것은 무엇을 의미합니까? OP가 그의 반례와 함께 보여준 것처럼 " NE와 모든 믿음의 프로필 은 BE" 라는 것은 확실하지 않습니다 . 그러나 "모든 NE는 어떤 신념 프로파일에 대한 BE가 될 수있다"는 경우이다 . 이런 의미에서 오스본의 "동등성"주장을 이해해야한다고 생각합니다

우리는 또한 다음과 같은 "등가와 같은"진술을 가지고 있음에 주목하십시오. " 게임 의 결과 는 BE 결과 인 경우에만 NE 결과입니다."


그러나 BE 개념은 우리가 NE보다 엄격하게 약한 합리성의 약화 때문에 모든 BE가 NE가 아닙니다.
Jyotirmoy Bhattacharya

내가 썼던 것처럼, 나는 BE가 다른 모델에 살고있는 것처럼 보이기 때문에 BE가 "하지 않는"것이 무엇을 의미하는지 이해하는 데 어려움을 겪고있다. BE에서 진행된 일부 전략이 NE가 아님을 의미합니까? 나는 그것이 틀렸다고 생각했지만 뭔가를 놓쳤을 수도 있습니다. 그것이 당신이 의미하는 바라면, 반대의 예를 향해 나를 지적 할 수 있습니까? 매우 도움이 될 것입니다.
Martin Van der Linden

BE가 합리성의 약화인지는 확실하지 않습니다. 내 이해에서 BE는 추측이 올바른 조건과 함께 합리성입니까? 그것이 맞다면 우리는 합리성보다 강하지 않습니까? (그것의 물론 "약한 / 강한"솔루션 개념 소위에 따라 수)
마틴 밴 린든 데르
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.