봉투 역설


8

봉투가 두 개 있습니다. 하나는 돈을 포함 하고 다른 하나는 돈을 포함합니다. 정확한 양 " "는 나에게 알려져 있지 않지만, 나는 위를 알고 있습니다. 봉투 하나를 골라서 엽니 다. 내가 볼 , 그 돈을 분명히 어디 .x2xxyy{x,2x}

이제 봉투를 보관하거나 전환하라는 제안을 받았습니다.

전환 예상 값은 입니다. 봉투를 유지하는 데 필요한 값은 입니다.(122y+1212y)=54yy

항상 봉투를 바꿔야 할 것 같습니다. 내 두 가지 질문 :

이 추론이 맞습니까?

봉투를 열고 금액을 볼 수 없다면 무기한으로 전환 할 수있는 옵션이 제공됩니까?y



1
당신은 단지 기대를 가질 수 없으며, 베이 즈의 규칙에 따라 x에 대한 믿음으로 시작하여 믿음을 업데이트해야합니다. y를 본 후에는 어떤 봉투를 열 었는지에 대한 믿음이 바뀌 었습니다.
HRSE

x가 0과 사이에 균일하게 분포되어 . 그리고 뭐?
Kitsune 기병대

@KitsuneCavalry 그러한 배포는 없습니다. (분포를 생성하는 프로그램을 보내 주시기 바랍니다.) 사실 모든 값에 대해 귀하의 질문에 주어진 선의의 신념을 생성하는 해결책은 없습니다 . Herr K의 링크에서이 내용은 en.wikipedia.org/wiki/에 설명되어 있습니다.y
Giskard

3
@Kitsune 기병 절반 라인 (또는 전체 라인)에 걸쳐 균일 한 분포는 맛에 대한 참조 베이지안 통계에서 잘 알려진 부적절한 사전입니다 stats.stackexchange.com/a/97790/28746 또는 stats.stackexchange.com/a/ 35794/28746
Alecos Papadopoulos

답변:


5

다음은이 문제에 대한 "예상 유틸리티 최대화 / 게임 이론적"접근 방식입니다 (대시적인 이론적 확률로). 그러한 틀에서 답은 분명해 보인다.

가옥

우리는 들어 있음을 절대 정직 말된다 엄격하게 긍정적 인 금액, 다음과 같은 두 가지 티켓 상자에 넣고 : 할당 된 식별 번호가 과 할당 된 식별 번호 . 그런 다음 Bernoulli 랜덤 변수 에서 추첨을 실행하고 결과와 발생한 이벤트를 기반으로 및 의 양 을 봉투 와 에 넣었습니다 . 우리는 의 가치가 무엇인지, 또는 어느 봉투에 어떤 금액이 들어 갔는지 알 수 없습니다.x{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x2xABx

첫 번째 사례 : 봉투를 열지 않고 전환 할 수있는 옵션이있는 봉투를 선택하십시오.

첫 번째 문제는 봉투를 어떻게 선택 합니까? 이것은 환경 설정과 관련이 있습니다. 따라서 유틸리티 함수 하여 유틸리티 최대화가 예상 된다고 가정하십시오 .u()

여기서는 봉투를 나타내는 두 개의 이분법 무작위 변수 인 와 와 그 양을 고려하여 확률 적 구조를 모델링 할 수 있습니다. 각각의 지원은 입니다. 그러나 그들은 독립적이지 않습니다. 따라서 공동 분포부터 시작해야합니다. 표 형식에서 관절 분포와 해당 한계 분포는 다음과 같습니다.AB{x,2x}

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

이것은 와 가 동일한 한계 분포를 가지고 있음을 알려줍니다 .AB

그러나 이것은 봉투를 선택하는 방법이 중요하지 않다는 것을 의미합니다. 항상 동일한 예상 유틸리티를 얻을 수 있기 때문입니다 .

0.5u(x)+0.5u(2x)

여기서 직면하고있는 것은 두 개의 동일한 도박 (각 봉투)에 대한 복합 도박 (봉투 선택 방법)입니다. 확률 , 또는 그 사이에있는 (및 대해 보완 적으로 ) 를 선택할 수 있습니다 . 중요하지 않습니다. 우리는 항상 동일한 기대 유틸리티를 얻을 것입니다. 위험에 대한 우리의 태도는 여기서 중요한 역할을하지 않습니다.A10B

우리는 봉투를 선택하고 라고 말하고 있습니다. 이제 우리가 기대하는 유틸리티는 무엇입니까? 를 선택하기 전과 정확히 동일 합니다. 어떤 방식 으로든 봉투를 고르더라도 내부의 확률에는 영향을 미치지 않습니다.A

우리는 전환 할 수 있습니다. 우리가 해보면 봉투 들고 있습니다. 이제 유틸리티는 무엇입니까? 이전과 동일합니다 .B

이것은 우리에게 세계에서 가능한 두 가지 상태입니다 . 선택하거나 선택하십시오 . 어떤 선택을하든, 세계의 두 주 모두 우리가 선택한 / 가정 한 추진력과 동일한 가치를 의미합니다 (예 : 기대되는 유용성을 최대화).AB

따라서 여기서는 전환에 무관심합니다. 실제로 무작위화할 수도 있습니다.

2 차 사례 : 이후 전환 옵션으로 봉투 열기

이제 골라서 열어서 안에있는 것으로 가정하자 . 이것으로 변화가 있습니까? Ay{x,2x}

보자 궁금하다

P(A=xA{x,2x})=?

그런데, 랜덤 변수되는 샘플 공간 정의한다. 전체 샘플 공간, 즉 사소한 시그마 대수에 대한 컨디셔닝은 확률이나 예상 값에 영향을 미치지 않습니다. " 가능한 모든 값이 실현 될 수 있다는 것을 알고 있다면 의 가치는 무엇 입니까?" 효과적인 지식을 얻지 못 했으므로 우리는 여전히 원래 확률 론적 구조에 있습니다. {x,2x}AA

그러나 나는 또한 궁금합니다.

P(B=xA{x,2x})=?

이벤트 의해 생성 된 시그마 대수로 올바르게 표시되는 조건문 은 무작위 벡터 가있는 전체 제품 샘플 공간입니다. 정의되었습니다. 위의 관절 분포 표에서 관절의 확률 할당은 한계 값의 확률 할당과 동일하다는 것을 알 수 있습니다 (측정 값 0의 두 이벤트가 존재하기 때문에 "거의 확실하게"자격). 따라서 여기서도 전체 표본 공간 에서 의 확률을 기본적으로 조정합니다 . 봉투를 여는 우리의 행동은 의 확률 적 구조 에도 영향을 미치지 않았다 .{A{x,2x}}(A,B)BB

의사 결정과 함께 게임 이론을 입력하십시오. 봉투를 열었으며 전환 여부를 결정해야합니다. 전환하지 않으면 유틸리티 . 전환하면 다음 두 가지 가능한 상태에있게됩니다.u(y)

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

실제로 어떤 상태를 유지하는지는 알지 못하지만 위의 설명에 따르면 각 상태의 확률은 입니다. p=0.5

우리는 우리의 상대가 "성격"인 게임으로이 문제를 모델링 할 수 있습니다 우리가 확실하게 무작위 전략을 그 자연 재생을 알고있는 경우 에 : 와 함께 , . 그러나 우리는 또한 우리가 전환하지 않으면 보상이 확실하다는 것을 알았습니다. 여기에 일반적인 형태의 게임이 있습니다.p=0.5 y=xp=0.5y=2x

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

우리는 대체하도록 유혹을한다 및 위해 . 는 알려져 있고 확실한 대가입니다. "Switch"전략의 대가는 실제로 알려져 있지 않습니다 ( 의 값을 모르기 때문에 ). 따라서 대체를 반대로해야합니다 . 만약 후 , 그리고 만약 후 . 여기 다시 게임이 있습니다 :u(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y)y=2xu(x)=u(y/2)

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

이제 행렬의 모든 대가가 알려져 있습니다. 순수한 지배적 전략이 있습니까?

"Switch"전략의 예상 보수는

E(VS)=0.5u(2y)+0.5u(y/2)

"Do n't Switch"전략의 예상 결과는

E(VDS)=u(y)

우리는 경우 전환해야

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

그리고 지금 은 위험에 대한 태도가 중요합니다. 위험을 감수하고 중립적 인 행동을 취해야한다고 추론하는 것은 어렵지 않습니다 .

위험 회피 행동 과 관련 하여 우아한 결과를 얻습니다 .

대수 (예를 들어, 제곱근)보다 "요철이 적은"(엄격히 위) 유틸리티 기능의 경우 여전히 전환해야합니다.

로그 유틸리티 경우 전환 여부에 무관합니다.u(y)=lny

대수 유틸리티 함수 (보다 엄격하게 아래)보다 "더 오목한"경우 스위치를 전환 해서는 안됩니다 .

나는 대수 사례의 다이어그램으로 닫습니다.

여기에 이미지 설명을 입력하십시오

가정하십시오 . 그런 다음 입니다. 선 "스위치"에서 기대 효용 거짓말의 대상이되는 라인입니다. 자연은 전략을 수행하기 때문에 실제로는 일 것입니다. 이는 의 중간 점입니다 . 이 시점에서 로그 유틸리티를 사용하면 "Do n't Switch"에서 정확히 동일한 유틸리티를 얻을 수 있습니다 예 : 이 숫자 예제의 경우 .y=4y/2=2,2y=8ΓΔΕ5050ΔΓΔΕln(4)


로그 유틸리티 기능을 통해 "위험 회피"를 호출해도 역설이 해결되지 않습니다. @HRSE가 지적한 것처럼 베이 즈 정리를 사용 하여 첫 번째 봉투의 금액을 본 후 지불액이 이고 는 0.5 가 아님 의 확률은 이전에 매우 의심스러운 균일 한 부적절한 경우에만 유지됩니다. (위한 ).에 적합한 종래 이용하면 (약 하나의 믿음 반사 ) 용액 경우 전환된다 충분히 작은 경우로 제 엔벨로프를 유지하는 충분히 크다. 참조 jstor.org/을 안정 / 2,685,310 .u(2y)u(y/2xx>0xxyy
Jarle Tufto

@JarleTufto 내가 본대로, 균일 한 사전은 올바른 사전입니다. 게임 주최자가 베르누이 추첨 후 돈을 벌었다고 말하면 게임 주최자를 믿기로 결정한 경우 입니다. 의심스러워지기를 원하고 주최자를 믿지 않고 다른 사전 신념을 형성하는 것은 당연히 그의 권리이지만, a) 주최자가 거짓말을하는 이유와 b) 어떻게 확신하는지에 대한 몇 가지 논증이 필요합니다. 그는 자신이 선택한 다른 선택을합니다. 내 대답은 우리가 그 문제에 대한 조직자들을 믿는다 고 전제합니다. p=0.5
Alecos Papadopoulos

물론 와 양 이 같은 확률로 1/2의 각 봉투에 제공되는 것에 동의합니다 . 내가 말하는 것은 모든 대해 사용 하는 이전의 암시 적 부적절한 유니폼 , 즉 은 역설로 이어지고 베이 즈 정리는 여기서 는 첫 번째 엔벨로프에서 관찰 된 양입니다. 적절한 사전 대신 사용하면 이러한 조건부 확률이 다르고 최적의 결정은 (물론 유틸리티 함수) 에 따라 다릅니다 . X2XXπ(x)=1x>0P(X=y|Y=y)=P(X=y/2|Y=y)=1/2yπ(x)y
Jarle Tufto

@JarleTufto 언급하기 전에이 부적절한 내용은 무엇과 관련된 확률을 반영합니까?
Alecos Papadopoulos

두 봉투의 금액은 와 입니다. 사전 확률 분포는 봉투를 열기 전에 에 대한 믿음을 나타냅니다 . 이전에이 특정 목적을 암시 적으로 사용하거나 역 조건부 확률을 동일시하는 오류를 범하고 있습니다. X2XX
Jarle Tufto

0

봉투 E1 을 열고 해당 값이 E1 = Y 이면 다른 봉투 E2 의 값이 {E2 = Y / 2, E2 = 2Y}에있는 것이 사실 입니다.

해당 엔벨로프의 예상 값이 (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y)이기도합니다 .

오류는 Y 가 무엇이든 Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 이라고 가정합니다 . 이것을 보여주는 간단한 방법은 각 봉투에 다양한 명칭의 미국 지폐가 포함되어 있다고 가정하는 것입니다. 경우 Y는 $ 1 = 위해, 그것은 불가능하다 E2가Y / 2 .

좀 더 엄격한 증거가 여기에 제공하기에는 너무 상세하지만, 그 요약은 먼저 모든 값 Z 에 대해 Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z)라고 가정해야 합니다. 이것은 본질적으로 마지막 단락에서와 동일한 가정이며 값의 범위로 확장되었습니다. 이 어떤 값에 해당하는 경우하지만 Z , 그 의미 잠을 (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) 의 각 값에 대한 상수 N -INF 내지, inf. 불가능하기 때문에 가정은 정확하지 않습니다.

+++++

약간 혼란 스러울 수 있으므로 예제를 사용해 보겠습니다. 두 개의 봉투 두 세트가 제공됩니다. 한 세트에는 10 달러와 20 달러가 들어 있습니다. 다른 세트에는 20과 40이 들어 있습니다. 세트를 선택한 다음 해당 세트에서 봉투 하나를 열어 20을 찾으십시오. 그런 다음 해당 세트의 다른 봉투로 전환 할 수있는 기회가 제공됩니다. 당신은해야합니까?

예, 전환해야합니다. 다른 엔벨로프로 전환하여 예상되는 이득은 [(20-10) + (20-40)] / 2 = +5입니다.

, 즉 10 또는 40이 아닌 20을 찾았다는 것은 질문에 설명 된 조건에 맞는다는 점에 유의하십시오. 따라서 솔루션이 작동합니다. 그러나 실험 자체는 그 설명에 맞지 않습니다. 10을 찾거나 40을 찾은 경우 다른 봉투가 20 일 확률은 100 %입니다. 기대 이익은 각각 +10과 -20입니다. 그리고 확률에 대해 세 가지 가능한 이득을 평균하면 세 가지 값을 얻을 수 있습니다. 10/4 + 5/2-20/4 = 0입니다.


봉투에 50 센트를 넣을 수없는 이유는 무엇입니까? 또한 질문은 구체적으로 가능한 양을 알 수없는 시간, 가능한 상대적인 양을 묻는 것이므로 실제로 이것을 따르지 않습니다.
Kitsune 기병대

나는 그것이 단순한 접근법이라고 말했다. '각 봉투에는 미국 지폐가 들어 있다고 가정합니다.' 미국 지폐에는 50 센트를 사용할 수 없으므로 Pr (E2 = 1) = 1입니다. 요점은 Y를 모르는 경우 Y / 2와 2Y를 똑같이 가정 할 수 있다는 것은 달성 할 수없는 Y에 대한 사실상의 분포를 가정한다는 것입니다. 2|E1=
JeffJo

0

전체 실험의 무작위 화 절차를 지정하지 않았기 때문에 일반적으로 문제를 해결할 수 없습니다.

그러나 Y는 선택한 봉투의 값이고 X는 다른 봉투의 값입니다. 정답은 - 조건부 기대 값 입니다. 그러나 가장 일반적인 Y 분포를 가정하면 Y는 모든 에서 균일하게 도출됩니다 . 그러나 이고, Borel–Kolmogorov 역설에 의해 기대는 해결할 수 없습니다.E[X|Y=y]RPr(Y=y)=0


@JeffJo, 평판이 충분하지 않아서 게시물에 댓글을 달 수 없습니다. 귀하의 게시물과 관련이 있다고 생각 하여이 답변을 추가했습니다.
John Rambo
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.