1. 불필요한 확률.
이 노트의 다음 두 섹션은 표준 의사 결정 도구를 사용하여 "더 큰 추측"과 "두 봉투"문제를 분석합니다 (2). 이 방법은 간단하지만 새로운 방법으로 보입니다. 특히, "항상 스위치"또는 "절대 스위치"절차보다 명백히 우수한 두 엔벌 로프 문제에 대한 일련의 결정 절차를 식별합니다.
섹션 2에서는 (표준) 용어, 개념 및 표기법을 소개합니다. "더 큰 문제인 추측"에 대해 가능한 모든 결정 절차를 분석합니다. 이 자료에 익숙한 독자는이 섹션을 건너 뛰어도됩니다. 섹션 3은 두 엔벨로프 문제에 유사한 분석을 적용합니다. 4 장 결론은 요점을 요약 한 것입니다.
이 퍼즐에 대한 모든 출판 된 분석은 가능한 자연 상태를 지배하는 확률 분포가 있다고 가정합니다. 그러나이 가정은 퍼즐 진술의 일부가 아닙니다. 이러한 분석의 핵심 아이디어는이 (보증되지 않은) 가정을 삭제하면 이러한 퍼즐의 명백한 역설을 간단히 해결할 수 있다는 것입니다.
2.“더 큰 것”문제.
실험자는 다른 실수 과 x 2 가 있다고 들었습니다.x1x2 가 두 장의 종이에 쓰여졌다 . 그녀는 무작위로 선택한 전표의 숫자를 봅니다. 이 하나의 관찰만을 기반으로, 두 숫자 중 더 작은 지 큰지를 결정해야합니다.
확률에 대한 이와 같은 단순하지만 개방형 문제는 혼란스럽고 반 직관적 인 것으로 악명이 높습니다. 특히, 확률이 그림에 들어가는 적어도 세 가지 뚜렷한 방법이 있습니다. 이를 명확히하기 위해 공식적인 실험 관점 (2)을 채택하자.
손실 함수 를 지정하여 시작하십시오 . 우리의 목표는 아래에 정의 된 의미에서 기대치를 최소화하는 것입니다. 실험자가 올바르게 추측하면 손실을 , 그렇지 않으면 0을 선택하는 것이 좋습니다 . 이 손실 함수의 기대치는 잘못 추측 할 확률입니다. 일반적으로 다양한 추측을 잘못된 추측에 할당함으로써 손실 함수는 올바르게 추측하는 목표를 포착합니다. 확실히, 손실 함수를 채택하는 것은 x 1 과 x 2 에 대한 사전 확률 분포를 가정하는 것만 큼 임의적입니다. 10x1x2더 자연스럽고 근본적입니다. 우리가 결정을 내릴 때 자연스럽게 옳고 그른 결과를 고려합니다. 어느 쪽도 결과가 없다면 왜 걱정해야합니까? 우리는 (이론적) 결정을 내릴 때마다 잠재적 손실에 대해 암묵적으로 수행하므로 손실에 대한 명시적인 고려를 통해 이익을 얻는 반면, 용지 명세서에 가능한 값을 설명 할 확률을 사용하는 것은 불필요하고 인공적이며 우리는 유용한 해결책을 얻지 못하게 할 수 있습니다.
의사 결정 이론은 관찰 결과와 그에 대한 분석을 모델링합니다. 샘플 공간, "자연 상태"및 결정 절차의 세 가지 추가 수학적 객체를 사용합니다.
샘플 공간 는 가능한 모든 관측치로 구성됩니다. 여기서 R (실수 집합) 로 식별 할 수 있습니다 . SR
자연 상태 은 실험 결과를 지배하는 가능한 확률 분포입니다. (이것은 사건의“확률”에 대해 이야기 할 수있는 첫 번째 의미입니다.)“더 큰 추측”문제에서, 이들은 동일한 확률 로 고유 한 실수 x 1 및 x 2 에서 값을 취하는 이산 분포입니다. 의 1Ωx1x2각 값에서 2 입니다. Ω가 매개 변수화 될 수있다{ω=(X1,X2)∈R×R| x1>x2}.12Ω{ω=(x1,x2)∈R×R | x1>x2}.
결정 공간은 이진 세트이다 가능한 결정.Δ={smaller,larger}
이 용어에서 손실 함수는 Ω × Δ 에 정의 된 실제 값 함수입니다.Ω×Δ 입니다. 그것은 현실 (첫 번째 주장)과 비교하여 결정이 얼마나 나쁜지 (두 번째 주장)를 알려줍니다.
실험자가 이용할 수 있는 가장 일반적인 결정 절차 는 무작위 로 결정됩니다 . 실험 결과에 대한 값은 Δ 의 확률 분포입니다 . 즉, 결과 x 를 관찰 할 때의 결정 은 반드시 명확한 것이 아니라 분포 δ ( x ) 에 따라 무작위로 선택되어야한다 . (이는 확률과 관련된 두 번째 방법입니다.)δΔxδ(x)
때 두 요소를 가지고, 어떤 무작위 절차는 우리가 가지고 콘크리트로 할 수는 미리 지정된 결정에 할당 확률로 식별 할 수 있습니다 "더." Δ
물리적 스피너 구현 등의 바이너리 무작위 절차를 : 자유롭게 - 회전 포인터가 하나 개의 의사 결정에 해당하는 상단 영역에 정지합니다 확률로, δ 확률로 왼쪽 하단에 중지 그렇지 않으면 및 1 - δ ( x ) . 스피너 완전히 값 지정에 의해 결정되는 δ ( X를 ) ∈ [ 0 , 1 ] .Δδ1−δ(x)δ(x)∈[0,1]
따라서 결정 절차는 기능으로 생각할 수 있습니다
δ′:S→[0,1],
어디
Prδ(x)(larger)=δ′(x) and Prδ(x)(smaller)=1−δ′(x).
반대로, 그러한 기능 는 무작위 결정 절차를 결정한다. 무작위 결정은 특별한 경우에 결정적 의사 결정을 포함하는 경우의 범위 δ ' 에서 거짓말 { 0 , 1 } .δ′δ′{0,1}
결과 x에 대한 결정 절차 δ 의 비용 은 δ ( x ) 의 예상 손실 이라고 가정하자 . 결정 공간 Δ 에 대한 확률 분포 δ ( x ) 에 대한 기대가있다 . 각각의 자연 상태 ( ω) (샘플 공간 ( S ) 상의 이항 확률 분포 )는 임의의 절차 ( δ )의 예상 비용을 결정하고 ; 이것은 ω 에 대한 δ 의 위험 이며 , 위험 δ ( ω )δxδ(x)δ(x)ΔωSδδωRiskδ(ω). Here, the expectation is taken with respect to the state of nature ω.
Decision procedures are compared in terms of their risk functions. When the state of nature is truly unknown, ε and δ are two procedures, and Riskε(ω)≥Riskδ(ω) for all ω, then there is no sense in using procedure ε, because procedure δ is never any worse (and might be better in some cases). Such a procedure ε is inadmissible; otherwise, it is admissible. Often many admissible procedures exist. We shall consider any of them “good” because none of them can be consistently out-performed by some other procedure.
( (1)의 용어에서 " C에 대한 혼합 전략") 에는 사전 분배가 도입되지 않습니다 . 이것이 확률이 문제 설정의 일부일 수있는 세 번째 방법입니다. 이를 사용하면 현재 분석이 (1) 및 그 참조보다 더 일반적이면서도 단순 해집니다.ΩC
표 1 평가하여 자연의 실제 상태가 주어진다 위험 리콜 X 1 > X 2 .ω=(x1,x2).x1>x2.
1 번 테이블.
Decision:Outcomex1x2Probability1/21/2LargerProbabilityδ′(x1)δ′(x2)LargerLoss01SmallerProbability1−δ′(x1)1−δ′(x2)SmallerLoss10Cost1−δ′(x1)1−δ′(x2)
Risk(x1,x2): (1−δ′(x1)+δ′(x2))/2.
In these terms the “guess which is larger” problem becomes
x1x2δ[1–δ′(max(x1,x2))+δ′(min(x1,x2))]/2 is surely less than 12?
이 문장은 를 요구하는 것과 같습니다. δ′(x)>δ′(y) whenever x>y. Whence, it is necessary and sufficient for the experimenter's decision procedure to be specified by some strictly increasing function δ′:S→[0,1]. This set of procedures includes, but is larger than, all the “mixed strategies Q” of 1. There are lots of randomized decision procedures that are better than any unrandomized procedure!
3. THE “TWO ENVELOPE” PROBLEM.
It is encouraging that this straightforward analysis disclosed a large set of solutions to the “guess which is larger” problem, including good ones that have not been identified before. Let us see what the same approach can reveal about the other problem before us, the “two envelope” problem (or “box problem,” as it is sometimes called). This concerns a game played by randomly selecting one of two envelopes, one of which is known to have twice as much money in it as the other. After opening the envelope and observing the amount x of money in it, the player decides whether to keep the money in the unopened envelope (to “switch”) or to keep the money in the opened envelope. One would think that switching and not switching would be equally acceptable strategies, because the player is equally uncertain as to which envelope contains the larger amount. The paradox is that switching seems to be the superior option, because it offers “equally probable” alternatives between payoffs of 2x and x/2, whose expected value of 5x/4 exceeds the value in the opened envelope. Note that both these strategies are deterministic and constant.
In this situation, we may formally write
SΩΔ={x∈R | x>0},={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},and={Switch,Do not switch}.
As before, any decision procedure δ can be considered a function from S to [0,1], this time by associating it with the probability of not switching, which again can be written δ′(x). The probability of switching must of course be the complementary value 1–δ′(x).
The loss, shown in Table 2, is the negative of the game's payoff. It is a function of the true state of nature ω, the outcome x (which can be either ω or 2ω), and the decision, which depends on the outcome.
Table 2.
Outcome(x)ω2ωLossSwitch−2ω−ωLossDo not switch−ω−2ωCost−ω[2(1−δ′(ω))+δ′(ω)]−ω[1−δ′(2ω)+2δ′(2ω)]
In addition to displaying the loss function, Table 2 also computes the cost of an arbitrary decision procedure δ. Because the game produces the two outcomes with equal probabilities of 12, the risk when ω is the true state of nature is
Riskδ(ω)=−ω[2(1−δ′(ω))+δ′(ω)]/2+−ω[1−δ′(2ω)+2δ′(2ω)]/2=(−ω/2)[3+δ′(2ω)−δ′(ω)].
A constant procedure, which means always switching (δ′(x)=0) or always standing pat (δ′(x)=1), will have risk −3ω/2. Any strictly increasing function, or more generally, any function δ′ with range in [0,1] for which δ′(2x)>δ′(x) for all positive real x, determines a procedure δ having a risk function that is always strictly less than −3ω/2 and thus is superior to either constant procedure, regardless of the true state of nature ω! The constant procedures therefore are inadmissible because there exist procedures with risks that are sometimes lower, and never higher, regardless of the state of nature.
Comparing this to the preceding solution of the “guess which is larger” problem shows the close connection between the two. In both cases, an appropriately chosen randomized procedure is demonstrably superior to the “obvious” constant strategies.
These randomized strategies have some notable properties:
There are no bad situations for the randomized strategies: no matter how the amount of money in the envelope is chosen, in the long run these strategies will be no worse than a constant strategy.
No randomized strategy with limiting values of 0 and 1 dominates any of the others: if the expectation for δ when (ω,2ω) is in the envelopes exceeds the expectation for ε, then there exists some other possible state with (η,2η) in the envelopes and the expectation of ε exceeds that of δ .
The δ strategies include, as special cases, strategies equivalent to many of the Bayesian strategies. Any strategy that says “switch if x is less than some threshold T and stay otherwise” corresponds to δ(x)=1 when x≥T,δ(x)=0 otherwise.
What, then, is the fallacy in the argument that favors always switching? It lies in the implicit assumption that there is any probability distribution at all for the alternatives. Specifically, having observed x in the opened envelope, the intuitive argument for switching is based on the conditional probabilities Prob(Amount in unopened envelope | x was observed), which are probabilities defined on the set of underlying states of nature. But these are not computable from the data. The decision-theoretic framework does not require a probability distribution on Ω in order to solve the problem, nor does the problem specify one.
This result differs from the ones obtained by (1) and its references in a subtle but important way. The other solutions all assume (even though it is irrelevant) there is a prior probability distribution on Ω and then show, essentially, that it must be uniform over S. That, in turn, is impossible. However, the solutions to the two-envelope problem given here do not arise as the best decision procedures for some given prior distribution and thereby are overlooked by such an analysis. In the present treatment, it simply does not matter whether a prior probability distribution can exist or not. We might characterize this as a contrast between being uncertain what the envelopes contain (as described by a prior distribution) and being completely ignorant of their contents (so that no prior distribution is relevant).
4. CONCLUSIONS.
In the “guess which is larger” problem, a good procedure is to decide randomly that the observed value is the larger of the two, with a probability that increases as the observed value increases. There is no single best procedure. In the “two envelope” problem, a good procedure is again to decide randomly that the observed amount of money is worth keeping (that is, that it is the larger of the two), with a probability that increases as the observed value increases. Again there is no single best procedure. In both cases, if many players used such a procedure and independently played games for a given ω, then (regardless of the value of ω) on the whole they would win more than they lose, because their decision procedures favor selecting the larger amounts.
In both problems, making an additional assumption-—a prior distribution on the states of nature—-that is not part of the problem gives rise to an apparent paradox. By focusing on what is specified in each problem, this assumption is altogether avoided (tempting as it may be to make), allowing the paradoxes to disappear and straightforward solutions to emerge.
REFERENCES
(1) D. Samet, I. Samet, and D. Schmeidler, One Observation behind Two-Envelope Puzzles. American Mathematical Monthly 111 (April 2004) 347-351.
(2) J. Kiefer, Introduction to Statistical Inference. Springer-Verlag, New York, 1987.
sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = X
F (X)이 큰 상기 제 1 포락선의 확률이며, 주어진 임의의 특정 X.