블랙웰의 내기


12

Futility closet 에서 Blackwell의 내기 역설에 대해 읽었습니다 . 다음은 요약입니다. 두 개의 봉투 ( E y)가 제공 됩니다. 봉투에는 임의의 금액의 돈이 포함되어 있지만 돈에 대한 분포에 대해서는 아무것도 모릅니다. 하나를 열고 돈이 얼마나 있는지 확인하고 ( x ) 선택해야합니다 : 봉투 E x 또는 E y ?ExEyxExEy

Futility Closet는 Leonard Wapner라고하는 수학자를 말합니다.

나에게 잘못된 것처럼 보이는 아이디어는 다음과 같습니다. 난수를 선택하십시오 . d < x 인 경우 E x를 취하십시오 . 경우 D > X 선택 E Y를 .dd<xExd>xEy

Wapner :“d가 x와 y 사이에 있으면 예측 (d로 표시)이 올바른 것으로 보장됩니다. 이것이 확률 p로 발생한다고 가정하십시오. d가 x와 y보다 작 으면 선택한 숫자 x가 2보다 큰 경우에만 예측이 정확합니다. 이 확률은 50 %입니다. 마찬가지로 d가 두 숫자보다 큰 경우 선택한 숫자가 두 숫자보다 작은 경우에만 예측이 정확합니다. 이는 50 % 확률로도 발생합니다.”

[ x , y ] 에 있을 확률 이 0보다 크면이 방법의 평균 성공은 1입니다.d[x,y] . 이것은 관련없는 임의의 변수를 관찰함으로써 추가 정보를 제공한다는 것을 의미합니다.12+p2

나는 이것이 모두 잘못되었다고 생각하며 문제는 임의의 정수를 선택하는 데 있습니다. 무슨 뜻인가요? 어떤 정수? 그 경우에, 확률 것을 D 사이에있는 XY는 제로, 양쪽 때문에 , XY는 유한하다.pdxyxy

최대 금액에 한계가 있다고 말 하거나 이라고 말 하거나 적어도 1 에서 M을 선택 하면 레시피는 x < M / 2 인 경우 E y 를 선택하는 사소한 조언으로 요약됩니다. x > M / 2 인 경우 E x를 선택하십시오 .M1...MEyx<M/2Exx>M/2

내가 여기서 뭔가를 그리워합니까?

편집하다

자, 이제 나는 명백한 역설이 어디에서 오는지보기 시작합니다. 관련이없는 임의의 변수가 추가 정보를 제공 할 수는 없었습니다.

그러나 우리는 d 의 분포를 의식적으로 선택해야합니다 . 예를 들어, 균일 분포의 경계 또는 Poissionian 분포의 등을 선택하십시오. 땅콩을 가지고 놀 때, 우리는 [ 10 9 , 2 10 9 ] 달러에서 d 의 분포를 균일하게 선택했습니다. P ( d ( x , y ) ) = 0 입니다. 이 마지막 가능성은 무엇보다도 봉투 안에있을 있는 것에 대한 우리의 판단에 달려 있습니다 .λ[109,2109]P(d(x,y))=0

즉, 기술이 작동하면 봉투에 돈이 어떻게 분포되어 있는지 (봉투에 대한 금액이 어떻게 선택되었는지) 모른다는 가정이 위반됩니다. 그러나 봉투에 무엇이 들어 있는지 모르는 경우 최악의 시나리오에서는 적용하여 아무것도 풀지 않습니다.

편집 2

또 다른 생각. 주어지면 , d 를 그리기 위해 P ( d < x ) = P ( d > x ) 가되도록 연속적인 음이 아닌 분포를 선택합시다 . 우리는 그렇게 할 수 있습니다. 맞습니까? 지시대로 진행하십시오 -d < x 인 경우 봉투를 유지하고 d > x 인 경우 봉투를 변경합니다. 분포를 선택하는 방법에 따라 추론은 변경되지 않습니다. P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0 (또는 내가 착각하고 있습니까?).

그러나 우리가 어떻게 분포를 선택했는지를 고려할 때, 우리가 지금하는 일은 동전 던지기와 같습니다. 우리는 동전을 던지고 그것이 머리라면 봉투를 바꾸고 꼬리라면 봉투를 붙입니다. 내가 어디 틀렸어?

편집 3 :

알았어, 이제 알겠다 만약 우리가 의 확률 함수 를 x 에 기초한다면 (예를 들어, 우리는 ( 1 , 2 x ) 범위의 균일 분포로부터 d 를 샘플링 한다면, 확률 P ( d ( x , y ) )P ( 정확한 결정)와 무관하다 | D ( X , Y ) ) .dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

따라서 (확률 p )이면 추측은 항상 이전과 동일합니다. 경우 X는 하부 수 있지만, 및 D ( X , Y ) 보다, d는 보다 낮게 높은 확률 갖는 X 보다 높은 것보다 X를 우리가 잘못된 결정 편중되도록이. x 가 두 수보다 높은 경우에도 같은 추론이 적용됩니다 .d(x,y)pxd(x,y)dxxx

즉 , x와 독립적으로 를 그리는 과정을 선택해야합니다 . 다시 말해, 우리는 xy 가 그려지 는 분포의 매개 변수에 대해 추측해야합니다 . 최악의 상황은 우리가 여전히 무작위로 추측한다는 것입니다. 그러나 가장 좋은 일은 우리의 추측이 정확하다는 것입니다. 어떻게 이런 일이 더 추측보다 더해야한다 "x와 y는, 내 생각, 적어도 1이됩니다 $ 하지만, 대부분 10 $ , 그렇다면 X > (5) , 우리가 그것을 유지하고, 그렇지 않으면, 우리는 그것을 교환"나는 아직까지입니다 보다.dxxyx>5

나는 Wapner의 책에있는 문제의 팝업 공상 과학 제제 (에 의해 오도 된 : 수학 크리스탈 볼의 호기심 예기치 않은 기대 하는 상태)

"어쨌든 임의의 양의 정수를 선택하십시오."(Wapner는 기하 분포를 제안합니다-첫 번째 머리가 나올 때까지 동전을 던지고 경우 프로세스를 반복합니다 ) " d > x가 더 높게 추측하고 d < x 추측 이면 (...) d 는 시간의 50 % 이상을 정확하게 가리 키기 때문에 시간의 50 % 이상을 정확하게 추측 할 것입니다 ! "d=xd>xd<xd


1

2
이것은 다음과 같은 점에서 두 봉투 문제와는 상당히 다릅니다. 블랙웰의 베팅에 대해 Wapner가 제공 한 것이 맞습니다.
Matthew Gunn

봉투의 금액이 일련의 숫자 S의 임의의 요소 인 경우 Wapner의 전략이 작동하기에 충분하고 필요한 조건은 S에서 엄격하게 증가
시키기로

그래, 나는 여전히 뭔가를 놓치고있다-EDIT 2를 참조하십시오. 그러나 우리가 동전을 던질 수 있고 추론에 따라 여전히 작동 해야하는 것처럼 보입니다. 내가 어디 틀렸어?
1 월

답변:


8

A2A

일부 요점 :

  1. 임의의 정수를 균일하게 선택할 수 는 없지만 인용 된 부분은 균일하지 않아도됩니다. 유한 값을 초과 할 확률이있는 한 분포를 선택하십시오 (인수에 대한 것이 중요하지 않음).

  2. d d=x

  3. d

* (균일하게 임의의 음이 아닌 정수 또는 균일하게 임의의 양의 정수를 선택할 수 없음)


Md1...MEyx<M/2Exx>M/2

xM/2

그러나 내가 처음으로 본이 게임의 버전은 게임에서 발생하는 수입을 최소화하고자하는 사람이 봉투를 제시한다는 것입니다. 배포를 사용하여 다른 엔벨로프로 전환할지 여부를 결정하는 전략은 해당 인스턴스에서 계속 작동합니다.


dP(d<x)=P(d>x)

P(d<x)=P(d>x)

d

전략을 x의 함수로 만들면 d가 x와 y 사이에있을 때 올바른 선택을 할 수 있다는 이점을 얻지 못합니다. 게임에서 승리하는 방법을 정의하고 있습니다. 만약 당신이 링크가 그러한 전략이 효과가 있다고 주장한다면, 그것은 틀렸을 것입니다
Glen_b-복지국 Monica

dxP(d(x,y))>0x(1,2x)d(x,y)
1 월

7

와프 너의 주장은 맞습니다!

일부 의견 :

  • x<dd
  • d
  • 특정 상황 (예 : 관찰 범위가 넓을수록 큰 범위를 가질 가능성이 높음)에서 차단 전략이 최적입니다.
  • 보다 일반적인 베이지안 설정에서는 여러 이전의 단순한 컷오프 전략보다 더 잘 수행 할 수 있습니다.

관련이 있지만 다른 문제 :

여러 @Glen_b 및 @whuber가 언급 한 것처럼,로 알려진 관련 퍼즐 거기에 두 봉투 문제 그릇된 인수가 오버 이전에 믿음을 베이지안 접근 방식을 취하고 추가하여 볼 수 있습니다 항상 전환 봉투 인수의 결함에 대한 주어진다 두 봉투의 내용물.

그러나 어떤 의미에서는 여기에 설명 된 퍼즐이 다소 다릅니다. 와프 너의 주장은 맞습니다!


1
이제 역설이 어디에서 왔는지 봅니다. 또는 추가 정보가 시스템으로 흘러 들어가는 곳입니다. d 의 분포를 의식적으로 선택함으로써 , 우리는 두 봉투의 돈이 어느 정도 있어야하는지에 대한 사전 지식을 사용합니다. 최악의 시나리오, 우리의 지식은 쓸모가 없지만,이 방법을 사용하면 불리하지 않을 것입니다.
1 월

약간의 생각 후에도, 나는 그것을 얻지 못한다-편집 2를보십시오.
1 월

1020dP(x<d)=P(x>d)

d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9

xyxdd

0

나는 이것에 흥미가 있었고 Excel에서 그것을 가지고 노는 실용적인 접근 방식을 취했습니다.

1-100 범위에서 x, y 및 d에 대해 3 개의 난수를 생성했습니다. 그런 다음 d와 x와 x와 y를 비교하고 결과를 옳고 그름으로 보았습니다.

나는이 500 번을하고 여러 번 반복하고 예측대로 500에서 정답 arounf 330을 정기적으로 얻었습니다.

그런 다음 d의 범위를 1 ~ 10000으로 늘리고 정답은 500 회 실행에서 약 260으로 떨어졌습니다.

예, d의 선택은 x와 y의 예상 값에 따라 다릅니다.

단발


0

나는 방정식 p + (1-p) / 2의 Wapner 확장으로 명백한 역설이 (1-p) / 2> 0이라고 가정한다고 생각합니다. d의 많은 범위에서이 값은 0입니다.

예를 들어, 열린 엔벨로프의 값을 중심으로 대칭 분포에서 선택한 d는 1/2과 올바른 1/2의 확률을 제공합니다.

비대칭 적으로 선택된 분포는 선택을 시간의 1/2 잘못된 방향으로 편향시키는 것으로 보입니다.

이 방정식이 유지되도록 d에 대한 범위와 분포를 선택하는 방법이 있습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.