리시버는 언제 신호 게임에서 액션을 무작위로 배정해야합니까?


10

유한 메시지 공간 M , 유한 액션 공간 A 및 유한 타입 공간 갖는 시그널링 게임이 있다고 가정하자 T. 더 간단하게도, 모든 발신자 유형은 동일한 기본 설정을 갖습니다 (수신기는 다른 유형에 따라 다른 작업을 선호합니다). 응답을 무작위로 랜덤 화하여 수신자가 엄격하게 더 잘 할 수 있습니까? 수신기가 순수한 행동만을 취하는 평형이 존재할 때?

유비쿼터스는 내 질문을 훌륭하게 요약했다. "최고의 수신자 지불금을 가진 평형이 반드시 혼합 전략과 관련이 있는가?"

순차적 평형으로가 봅시다. 어떤 표기법으로 시작하고 싶다면.

σt(m)m M을tT 보낼확률입니다.mM

σRm(a) 확률을 수신 응답하는지m. μ mΔ T m 을 관찰 한 후 수신자의 신념을 알려줍니다.aA. μmΔTm

순차 평형 필요 σt 주어진주고 최적 반응 σR , σR 최적 주어진다 μμ 베이지안 주어진다 σ . 이것은 실제로 약한 순차의 정의이지만 신호 게임에는 차이가 없습니다.

수신자가 순수한 행동만을하는 평형이있을 때 나의 직감은 '아니오'라고 말하지만, 나는 항상 이런 종류의 것들에 끔찍했습니다. 어쩌면 우리는 그것이 제로섬 게임이 아니라고 규정해야하지만, 나는 그 게임에서 무작위 화하는 능력으로 플레이어가 더 나아 졌음을 기억하기 때문입니다. 아마도 이것은 종이 어딘가에 각주입니까?

발신자 환경 설정이 동일하지 않은 아래 게임을 고려하십시오. 품질이 낮아서 죄송합니다. 세 가지 발신자 유형이 있으며 각 유형은 동일하게 가능합니다. 메시지 1을 받자 마자 무작위로받는 경우에만 수신자 (플레이어 2) 최적 평형이라고 생각하는 것을 만들 수 있습니다. 그러면 유형 1과 3은 를 재생 하여 분리 평형을 만듭니다. 수신기가 m 1 에 응답하여 순수한 전략을 사용하는 경우, 유형 1 또는 2가 벗어나 수신기를 악화시킬 수 있습니다.m2m1

σRm1(a)=.5=σRm1(r)=.5

여기에 이미지 설명을 입력하십시오


유형에 따라 수신자가 취한 조치가 발신자가 보낸 메시지에 영향을 미치거나 독립적입니까?
Martin Van der Linden

무슨 말인지 정확히 모르겠습니다. 하나의 리시버 유형이 있습니다. 이들의 전략은 메시지를 조치에 대한 분배로 맵핑합니다. 발신자가 최상의 응답을하는 한 메시지에만 영향을 미칩니다.
Pburg

2
수신기가 일련의 동작 에 대해 랜덤 화하는 평형이 있다고 가정하자 . 이는 정의에 따라 α에 대한 두 확률 분포 사이에 무관심해야한다는 것을 의미합니다. 모든 가중치가 단일 조치에 적용되는 것을 포함하여 (순수한 전략). 따라서 혼합 전략이 최고의 순수 전략보다 절대적으로 나을 수는 없습니다. 아니면 질문을 잘못 이해 했습니까? αα
유비쿼터스

@ 유비쿼터스 그것은 나에게 의미가 있지만, 이상한 병리학 적 사례가 있는지 궁금합니다. 예를 들어, 나는 완벽한 리콜을 가진 유한 한 광범위한 형태의 게임에서 일반적인 지불 방식을 선택할 때, 연속적인 균형의 각 연결된 구성 요소에 대해 지 불량이 일정하다는 이론을 찾을 수있었습니다. 일반적인 경고는 나를 놀라게했다.
Pburg

1
@Pburg 네, 알겠습니다. 우리는 다른 질문을 염두에 둔 것 같습니다. 나는 " 지정된 발신자 전략에 대한 수신자의 고유 한 최선의 반응이 혼합 된 전략 일까?"라고 생각했지만, 실제로는 가장 높은 수신자 지불금을 갖는 평형이 혼합 전략? "
유비쿼터스

답변:


3

아마도 나는 반례가 있습니다!

세 개의 메시지가하자 m 3 , 3 개 발신자 타입 t (1) , t (2) , t (3) 여기서 ( t = t (3) ) = 1m1,m2,m3t1,t2,t3,및. 보내면발신자에게을합니다. 게임을 종료 한 것으로 생각할 수 있습니다.Pr(t=t3)=12ϵ Pr(t=t1)=1Pr(t=t2)=14m30Pr(t=t1)=14+ϵm30

메시지 대한 수신자 응답 세트 는 { a , r }m=m1,m2{a,r}

ut(a,m1)=1>ut(a,m2)=β>ut(r,)=0

u R ( t 3 , m i , a ) = 1uR(t1,m1,a)=uR(t2,m2,a)=2 , ,uR(t3,mi,a)=1

u R ( t 3 , m i , r ) = 2uR(t2,m1,a)=uR(t2,m1,a)=0 , ,uR(t3,mi,r)=2

uR(t1,mi,r)=uR(t2,mi,r)=1 입니다.

그런 다음 평형 상태에서 모든 발신자는 동일한 유틸리티를 사용해야합니다. 그렇지 않으면, 하나는 다른 사람의 전략을 모방 할 것입니다.

따라서 유일한 전략 균형은 모든 발신자가 을 선택하는 입니다. 또는 의 풀링 평형에서 가장 좋은 반응은 을 선택하는 것 입니다. 과 가 전송 하고 수신자가 응답하는 경우를 제외하고는 균형을 분리하는 순수한 전략이 없습니다 . 그런 다음 은 모든 메시지 사이에 무관심합니다. 왜냐하면 그는 반드시 payoff 충족하기 때문 입니다. 이 모든 것은 수신자에게m 1 m 2 r t 1 t 2 m 2 r t 3 0 3m3m1m2rt1t2m2rt3032ϵ

그런 다음 및 σ m 2 R ( a ) = 1 인 경우를 고려하십시오. 이제 발신자는 두 메시지를 보내는 데 무관심합니다. 그런 다음 σ t 3σRm1(a)=βσRm2(a)=1.σt3(m1)=ϵ+1/4ϵ+1/2=1σt3(m1) 위한. 그런 다음 수신자 전략이 합리적입니다.σti(mi)=1i=1,2

또는 이 주어지면 에서 수신자의 예상 유틸리티 는 1.5입니다. 의 예상 유틸리티는을 감안 1.5보다 약간 높습니다 . 따라서 예상되는 대가는 이상이며 위에서 설명한 순수한 평형보다 낫습니다. 또한,이 분리는 혼합에 의해서만 유지된다. 수신자가 취한 다른 순수한 전략은 발신자 풀링을 유발할 것 입니다. 이는 수신자가 선택할 때의 순수한 전략 평형뿐입니다 . a r m 2 a 3m1arm2ar32ϵr

왼쪽 발신자 대금을 지불하려면 아래 그림에 가 있어야 . 이 핵심 요소 라고 생각합니다 .a β < 1βaβ<1

여기에 이미지 설명을 입력하십시오


3

위험 회피 발송 인, 위험 중립 수신자 및 부자 에게는 이것이 불가능하다고 생각합니다 .A

예를 들어, 표준 신호 모델을 고수하기 위해 u a aA 긍정적 인 실제 라인과 보낸 사람의 유틸리티입니다 증가하고 수신기의 선형 유틸리티 감소있는 동안 .uaa

(이것은 프레임 워크가 귀하의 질문에 대한 프레임 워크보다 훨씬 덜 일반적이므로 귀하에게 만족스럽지 않을 수 있기 때문에 이것은 부분적인 대답 일뿐입니다.이 가정에 만족하는 경우 여전히 논쟁을 제기합니다)

모순을 도출하기 위해 평형 상태에서 σ m R ( " ) > 0 '"σRm(a)>0 위해 및 . 허락하다σRm(a)>0aaA

aσRm(a)σRm(a)+σRm(a)a+σRm(a)σRm(a)+σRm(a)a.

위험 회피

[σ m R (a')+σ m R (a' ')]u(a)>σ m R (a')u(a')+σ m R (

u[a]>σRm(a)σRm(a)+σRm(a)u(a)+σRm(a)σRm(a)+σRm(a)u(a).
[σRm(a)+σRm(a)]u(a)>σRm(a)u(a)+σRm(a)u(a).

일부 연속성 가정 하에서도 존재해야합니다

a<a

그런

[σRm(a)+σRm(a)]u(a)=σRm(a)u(a)+σRm(a)u(a).

따라서 다음과 같이 구성된 고려 하십시오.σRm

  • σRm(a)=σRm(a)=0 ,
  • σRm(a)=σRm(a)+[σRm(a)+σRm(a)]
  • 다른 모든 경우 σ m Ra~σRm(a~)=σRm(a~)

수신기는 선호 이상 경우 는 발신자가 보낸 신호를 변경하지 않았다가 낮은 것으로 보상을 포함하기 때문에. 그러나 건설함으로써 발신자 사이 무관심 및 그들과 동일한 신호를 전송해야하므로, . 따라서 은 평형이 될 수 없으며, 평형에서 양의 확률로 두 가지 다른 행동을 할 수 없다는 것을 보여줍니다. σ m R σ m RσRmσRm σ m R σ m R σ m RσRmσRmσRmσRm


이 모델에서는 수신자가 항상 선택하지는 않습니다 . a=0
Pburg

나는 이것이 반드시 그런 것은 아니다. 수신기가 항상 choses하지 않으면 어떤 신호를 중요, 그녀는 인센티브 "높은"종류는 "높은"신호 저점 자신의 유형을 표시하지 않습니다. 이는 풀링 평형에서는 최적 일 수 있지만 분리 평형에서는 그렇지 않을 수 있습니다. 설치가 당신의 조금 다른 다시 있지만, 마스 - Colell, Whinston 및 녹색의 인스턴스 섹션 13.C를 참조하십시오 (예를 들어, 거기에 두 개의 서로 다른 유형의 근로자에 대해 경쟁 기업)a
마틴 밴 린든 데르

"수신자에 선형 유틸리티 감소가 있음"은 무엇을 의미합니까?
Pburg

미안하지만 명확하지 않았습니다. 내가 생각하고있는 Spence 신호 모델에서, 수신자가 취하는 행동은 발신자에게 임금을 지불하는 것입니다. 수신자 유틸리티는 발신자 t의 유형에서 임금 tw를 뺀 값에 따라 다릅니다. 기본적으로, 수취인은 위험 중립적입니다 : 그녀는 지불해야 할 예상 임금과 그녀가 고용 할 예상 유형에 대해서만 관심이 있습니다.
Martin Van der Linden

좋아, 나는 이것을 2 차 손실, 로 보았다고 가정한다좀 더 일반적이지만 별도의 조치를 취하고 있지만 제안에 감사드립니다. (tw)2.
Pburg
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.