게임 이론을 사용하여 연구 주제 선택


19

최근의 게임 이론 질문 은 제가 생각하게 만들었습니다 (물론 이것은 탄젠트입니다) : 게임 이론을 사용하여 연구 할 연구 질문을 선택하기위한 개인 전략을 효율적으로 최적화 할 수 있습니까?

질문을 공식화하기 위해 다음과 같은 (비공식적으로) 가정합니다.

  • 나는 "당신이 좋아하는 것을하십시오!"의 "부드럽고 (정확한!) 답변을 피하기 위해 내가 할 수있는 특정 문제를 똑같이"즐긴다 ".
  • 내가 선택한 특정 문제에 대한 답을 찾는 데 성공하거나 성공하지 못할 수 있습니다. 주어진 문제에 대해, 나는 (문제에 시간을 투자 한 후) 문제를 얼마나 잘 해결할 수 있을지에 대한 추정치를 가지고 있습니다.
  • 저의 목표는 선까지 평가 될 때 (직업 신청, 임기 신청, 친목 신청 등)에 따른 보수를 극대화하는 것입니다. 이는 내가 해결하는 문제의 수와 문제의 중요성 또는 어려움에 대한 함수입니다. . 문제당 정확한 지불액에 대한 명확한 아이디어는 없지만 합리적인 견적을 내릴 수 있습니다.
  • 문제 보수와 문제 난이도 사이에는 느슨한 관계가 있습니다. 나의 목표에 대한 또 다른 진술은 차이점을 "게임"하는 것이다 (즉, "낮은 과일"을 찾는 것).
  • 이 전체 문제의 사례는 연구 질문 목록 (수에 제한이 없음)에 의해 지정되며, 여기에는 질문의 가치와 질문의 어려움에 대한 추정치 (계산 비용없이 입력으로 제공됨)를 단단히 첨부합니다. 나는이 게임을 상대 (나를 평가하는 사람)와 대결하고있다. 자연은 주어진 문제를 해결할 확률을 고려하여 내가 그것을 선택한 후에 성공적으로 해결할지 여부를 결정합니다.

실제로 무슨 일이 일어나고 있는지 (그리고 흥미롭지 않거나 논증 적 / 토론 유형의 반응을 회피하기 위해) 공식화하려는 노력으로,이 문제 는 무한한 행동 세트를 가진 불완전한 정보를 가진 광범위한 형태의 게임 으로 볼 것 입니다 .


질문 :이 유형의 게임은 효율적으로 계산할 수 없다고 가정합니다. 그러나 대가를 대략적으로 극대화하는 다항식 시간 알고리즘이 있습니까? PTAS는 어떻습니까?

또는이 문제에 대해보다 정확한 게임 이론적 모델이 있습니까? 그렇다면, 같은 질문이 있습니다 : 나는 (대략적으로) 내 대가를 효율적으로 극대화 할 수 있습니까? 그렇다면 어떻게?


4
이것을 게임으로 공식화하는데있어 한 가지 잠재적 인 문제는 당신을 평가하는 사람이 반드시 당신과 대결하는 것이 아니라는 것입니다. 실제로 그들은 종종 당신 편에 있고, 최소한의 요구 사항을 통과하지 못한 경우에만 당신이 실패하는 것을보고 싶어합니다. 또 다른 가능한 대적은 다른 모든 연구자들입니다 . 그들이 같은 문제에 대해 (협업 적으로) 협력하고 있고, 따라서 당신이하기 전에 결과를 얻으려고 노력함으로써 성공을 거두는 데 반대하고 있습니다.
Dave Clarke

이 질문의 목적을 위해 (가능한 한 많은 토론을 피하고 이것이 좋은 질문입니다 ...), 나를 평가하는 사람이 정말로 하나의 최고의 개인을 선택하라는 심각한 압력을 받고 있다고 가정합시다 특별한 보상으로 적대적입니다. 또한 "정말 독창적 인 것은 그저 독창적 일 것"이라고 가정하여 다른 연구자들은 심각한 관심사가되지 않습니다. 나는 (물론!) 개인적으로 다른 가능성에 관심이 있지만, 열린 상태로두면 나쁜 답변을 얻을 수 있다고 생각합니다. :)
Daniel Apon

다른 모델에 영향을 줄 수있는 문제의 한 가지 요소 : 내가 작업하기로 선택한 문제당 성공 / 보상 구조의 가능성 평가.
Daniel Apon

2
게임을 모델링하는 한 가지 방법은 다음과 같습니다 . T 시간에 임기 시계가 만료되기 전에 조사 지점 을 수집하려고합니다 . 당신이 작동하지 않을 수 있습니다 각각의 질문은 가치가 R 점을 연구하고, 각 질문하는 기능이있다RTri 는 시간 보낼 경우 해결의 가능성이 있습니다 t을 그것에는. 시계가 다 떨어지기 전에 충분한 포인트를 수집 할 수있는 기회를 최대한 활용하십시오. 이 게임에 가장 적합한 전략에 대해 이야기 할 수 있습니다. Pi(t)
피터 쇼어

2
물론, 실제로, 당신이 대답하는 각 질문은 더 많은 질문을 열어줍니다. 사전에 예측할 수는 없지만 시작한 질문보다 훨씬 쉽고 가치가 있지만 전략 트리를 만들기 시작하면 이와 같이 게임에 대해 흥미로운 것을 찾을 수있는 기회는 크게 줄어 듭니다.
피터 쇼어

답변:


4

질문에 대한 대체 모델을 제안하여 질문에 대답하려고합니다. 나는 일반적으로 여기에 대답하는 것보다 더 많은 질문을하므로 최선을 다하고 있지만 내 대답이 최적이 아닌 경우 용서하기를 바랍니다.

게임 이론을 유용하게 사용하기에 가장 적합한 질문을 표현하는 방법은보다 경쟁적인 시나리오를 가정하는 것이라고 생각합니다. 즉, 다양한 배우들 사이에 경쟁이 필요합니다. 따라서 다음을 가정합니다.

  • 여러분이 관심을 갖고있는 Q 라고 부르는 동일한 가능한 일련의 연구 질문을 추구하려고 시도하는 수많은 n 명의 다른 연구자들이 있습니다 .
  • 각 연구 문제는 다음과 같은 특성으로 정의됩니다.
    • 문제를 해결할 수 있는지 여부에 대한 가시성을 얻기 위해 시간 투자 또는 I 필요
    • 문제를 해결할 때 의 성공 가능성 또는 S 일단 "진실의 순간"에 도달하고 충분한 시간을 투자하면 자연은 문제를 해결할 수 있는지 여부를 무작위로 결정합니다.
    • 성공이 달성되면 경력 또는 U (유틸리티와 동일) 에 대한 혜택
  • 이 연구원들은 각각 다음과 같은 양이 다릅니다.
    • 연구에 투자 할 수있는 시간, t
    • 연구에 재능, r
    • 대인 관계 기술 및 기타 경력 지원 자질, l (적절한), 연구원이 경력 발전을 위해 연구 성공을 얼마나 잘 활용할 수 있는지 결정합니다.

이제 어떤 문제에 대해서도 협력이 불가능하다고 가정 할 때, "동적 반복 게임"이라고하는 것을 고려하십시오. 이 게임은 반복적으로 재생되지만 재생 될 때마다 약간 변경됩니다.

하자 M이 게임에서 이동 또는 회전 수, 수. 게임의 초기 표현은 각 행위자와 관련된 모든 값과 위에 나열된 각 문제 외에 모든 행위자 (연구자)와 그들이 할 수있는 모든 문제를 포함하는 목록으로 표현할 수 있습니다. (물론 모든 연구원이 현재 모든 문제와 다른 모든 연구원에 대해 알려진 모든 것을 알고 있다고해서이를 완벽한 정보의 게임으로 만들고 있습니다.)

게임을 반복 할 때마다 주어진 액터가 연구 할 질문을 선택합니다. 각 배우는 언제든지 질문을 전환 할 수 있으며 문제가 해결되면 커리어 U에 대한 혜택은 다른 모든 플레이어에게 0으로 떨어집니다. 플레이어가 충분한 시간을 투자하여 문제를 해결하지 못하면 특정 플레이어는 해당 문제를 다시 해결하지 못합니다. 다른 플레이어는 계속 문제를 해결하도록 허용되지만 다른 행위자는이를 해결할 수 있습니다 성공적으로. 모든 M 턴이 끝나면 게임이 종료됩니다 .

연구원이 문제를 선택했을 때마다 플레이어는 "진실의 순간"에 도달하고 문제를 해결할 수있게됩니다. 자연이 허락합니다. 한 번 해결 된 문제는 l에 근거하여 연구원의 경력에 ​​일정한 이점을 추가합니다 . 연구 재능은 성공 가능성을 증폭시키는 반면 자유 시간은 주어진 차례에 진전을 이룰 수있는 능력을 증폭시킵니다.

이 문제를 해결하기 위해 다항식 시간 알고리즘이 있는지 의심합니다. 나는 연구원들이 순수 전략 내쉬 평형을하는 것으로 제한되어야하는 이유를 알지 못하므로, 문제가 혼합 전략 내쉬 평형을 수반하므로 "문제 해결"을 의미하는 "내쉬 찾기" 문제에 대한 균형. " (당신이 주변에서 가장 능동적 인 연구자라면, 가장 좋아하는 내쉬 평형을 계산 한 다음 다른 모든 플레이어에게 신호를 보낼 수 있다고 상상할 수 있습니다. 신호를 보냈습니다.)

어쨌든 이것은 내가 게시 한 가장 관련성 높은 답변입니다. 나는 그것이 적어도 가치가 있기를 바랍니다. 누구든지 응답이 있거나 개선에 대한 권고 사항이 있으면 알려주십시오.


1
필립, 답변 주셔서 감사합니다! 이것은 문제에 대한 큰 관점입니다. 궁금합니다 : PPAD- 완전 상태를 유지하기 위해 문제에 "부분 정보"개념을 추가하는 방법을 생각할 수 있습니까? 이 게임의 플레이어로서 모든 적들이 무엇을하고 있는지 반드시 알 필요는 없습니다 (즉, 그들이 어떤 질문을하고 있는지, 그들이 어떤 힘을 가지고 있는지에 대한 완벽한 지식이 없습니다) 각 질문에 대답)? 이것을 추가하면 내쉬 평형 계산의 복잡성에 영향을 줍니까? (모릅니다)
Daniel Apon

1
@Daniel Apon : 댓글 주셔서 감사합니다! 나는 당신이 단순히 당신의 적들이 무엇을하고 있는지 또는 그들의 특성이 무엇인지 알지 못하도록 조건을 바꾸기가 어렵다고 생각하지 않습니다. 유일한주의 사항은, 당신이 불완전한 정보 게임을 다룰 때 내쉬 균형의 존재에 대한 보장이 사라진다고 생각합니다. "Stackelberg 게임"에 대해 잘 모르지만 제안 된 변경과 관련이 있다고 생각합니다. 나는 불완전한 정보 게임에서 최고의 솔루션 개념이 무엇인지 궁금해했다 ... 나는 그것에 대해 약간의 생각을 할 것이다.
Philip White

나는 이것에 대해 조금 더 읽었습니다 ... 베이지 게임은 불완전한 정보를 가진 게임을 다루기 때문에 여기에서 관련이 있다고 생각합니다. 다음은 내가 본 Wikipedia 페이지의 링크입니다. en.wikipedia.org/wiki/Bayesian_game
Philip White
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.