한 번의 관측으로 분산에 대한 신뢰 구간


25

이것은 "확률 이론의 일곱 번째 콜로 모고 로프 학생 올림피아드"의 문제입니다.

두 모수를 모두 알 수없는 분포 에서 하나의 관측치 가 주어지면 신뢰 수준이 99 % 이상인 대한 신뢰 구간을 제공하십시오 .정규 ( μ , σ 2 ) σ 2XNormal(μ,σ2)σ2

이것이 불가능한 것 같습니다. 해결책이 있지만 아직 읽지 않았습니다. 이견있는 사람?

며칠 안에 솔루션을 게시 할 것입니다.

[후속 수정 : 공식 솔루션은 아래에 게시되었습니다. 카디널의 해는 길지만 신뢰 구간이 더 좋습니다. Max와 Glen_b의 의견에 감사드립니다.]


1
나에게도 불가능 해 보인다. 나는 대답을 기다린다
Peter Flom-Monica Monica

1
이 사이트를 확인하십시오 .
가정 정상

3
다음은 더 나은 형식의 용지 입니다. paper .
가정 정상

허. 몇 년 전에이 자료 (한 번의 관찰 간격)에 대한 논문을 읽은 것을 기억합니다. 이게 되었을 수도 있습니다 .
Glen_b-복지 모니카

1
@Max, 링크 주셔서 감사합니다! 아직 자세히 살펴볼 시간이 없었지만 그럴 것입니다. 아래에 "공식"답변을 게시했습니다.
Jonathan Christensen

답변:


17

확률 불균형과 다중 관측 사례와의 연결을 통해 볼 때이 결과는 그렇게 불가능 해 보이지 않거나 적어도 그럴듯 해 보일 수 있습니다.

μσ 2를 알 수없는 XN(μ,σ2) 으로 하자 Z N ( 0 , 1 )에 대해 X = σ Z + μ 라고 쓸 수 있습니다 .μσ2X=σZ+μZN(0,1)

주요 주장 : [0,X2/qα)σ 2에 대한 (1α) 신뢰 구간 이며, 여기서 q α 는 자유도가 1 인 카이 제곱 분포 의 α 수준 분위수입니다. 또한,이 간격을 가지므로 정확하게 ( 1 - α ) 에 따르면 μ = 0 , 그 폼의 가능한 좁은 간격 [ 0 , B X 2 )σ2qαα (1α)μ=0[0,bX2)일부 .bR

낙관적 인 이유

을 불러에서 해당 와 경우, T = Σ N I = 1 ( X I - ˉ X ) 2일반적인 ( 1 - α ) 에 대한 신뢰 구간 σ (2)가 된다 ( Tn2T=i=1n(XiX¯)2 (1α)σ2 여기서, Q의 k는 , A는 은 IS의 분위수 - 레벨은 카이 제곱으로 k 개의 자유도. 물론 이것은 어떤 μ에도 적용 됩니다. 이것이가장 인기있는간격 (명확한 이유로 등꼬리 간격이라고도 함)이지만 폭이 가장 작은 것도 아니고 가장 작은 것도 아닙니다! 명백한 바와 같이, 다른 유효한 선택은 ( 0 , T

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

따라서 이므로 ( 0 , n i = 1 X 2 iTi=1nXi2 또한 적어도 커버리지 갖는다 ( 1 - α를 ) .

(0,i=1nXi2qn1,α),
(1α)

이러한 관점에서 볼 때, 우리는 기본 청구의 구간이 대해 참이라는 낙관적 일 수 있습니다. 가장 큰 차이점은 단일 관측의 경우 자유도 카이 제곱 분포가 없으므로 자유도 1 분위수를 사용하면 효과가 있기를 바랍니다.n=1

목적지를 향한 반 걸음 ( 오른쪽 꼬리를 악용 )

주요 주장의 증거로 뛰어 들기 전에 먼저 강력하거나 통계적으로 만족스럽지 않지만 진행 상황에 대한 추가 통찰력을 제공하는 예비 주장을 살펴 보겠습니다. 많은 손실이 없다면 아래 주요 주장의 증거로 건너 뛸 수 있습니다. 이 섹션과 다음 섹션에서 약간의 미묘한 증거는 기본 사실, 즉 확률의 단일성, 정규 분포의 대칭성 및 단일성만을 기반으로합니다.

보조 제 : A는 ( 1 - α ) 에 대한 신뢰 구간 σ 2 길이만큼 α > 1 / 2 . 여기서 z α 는 표준 법선 의 α 수준 분위수입니다.[0,X2/zα2)(1α)σ2α>1/2zαα

증거 . | σ Z + μ | d = | σ Z + μ | 대칭성에 의해, 다음에 나오는 것은 일반성의 손실없이 μ 0 을 취할 수 있습니다 . 이제 θ 0μ 0의 경우 P ( | X | > θ ) P ( X > θ )|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0 등으로 θ = Z α σ , 우리는 참조하는 P ( 0 σ 2 < X 2 / Z 2 α ) 1 - α

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασ 이것은 단지 작동 α > (1) / 2, 즉 필요한 무엇 때문에, Z α > 0 .
P(0σ2<X2/zα2)1α.
α>1/2zα>0

이것은 보조 주장을 증명합니다. 예시 적이지만, 작동 하기 위해서는 터무니없이 큰 가 필요하기 때문에 통계적 관점에서 불만족 스럽 습니다.α

주요 주장 입증

위의 주장을 구체화하면 임의의 신뢰 수준에 효과가있는 결과가 도출됩니다. 먼저 집합 = μ / σ 0 B = θ / σ 0 . 그런 다음 P ( | Z + a | > b ) = Φ ( a b ) + Φ ( a b )

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0고정 된 b 마다 오른쪽에서 a 가증가 함을 보여줄 수 있다면이전 인수와 비슷한 인수를 사용할 수 있습니다. 평균이 증가하면 b 를 초과하는 계수를 가진 값을 볼 가능성이 높아지기 때문에 이것은 아마도 그럴듯합니다. (그러나 왼쪽 꼬리에서 질량이 얼마나 빨리 감소하는지주의해야합니다!)
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb

fb(a)=Φ(ab)+Φ(ab)

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
fb(0)=0uφ(u)ua(0,2b)φ(ab)φ(b)=φ(b)
fb(a)0
for all a0 and any fixed b0.

Hence, we have shown that for a0 and b0,

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Unraveling all of this, if we take θ=qασ, we get

P(X2>qασ2)P(Z2>qα)=1α,
which establishes the main claim.

Closing remark: A careful reading of the above argument shows that it uses only the symmetric and unimodal properties of the normal distribution. Hence, the approach works analogously for obtaining confidence intervals from a single observation from any symmetric unimodal location-scale family, e.g., Cauchy or Laplace distributions.


Wow! and students are expected to come up with this type of argument in the short time of an Olympiad exam?
Dilip Sarwate

1
@Dilip : 모르겠다! 이 올림피아드의 형식이나 솔루션 측면에서 예상되는 것에 익숙하지 않습니다. 문자 그대로 읽었을 때, 나는 Scortchi의 대답이 받아 들여질 것이라고 생각합니다. 나는 "사소하지 않은"솔루션으로 얼마나 멀리 갈 수 있는지 알아내는 데 더 관심이있었습니다. 내 자신의 (정말 최소한의) 탐구는 답변에 묘사 된 것과 같은 생각의 기차를 따라 갔다 (한 번의 우회). 더 나은 솔루션이있을 가능성이 큽니다. :-)
추기경

이것은 "공식"솔루션보다 상당히 길지만 분산에 더 잘 묶여 있으므로 "올바른"답으로 표시하고 있습니다. 아래에 "공식"답변과 시뮬레이션 결과 및 토론을 게시했습니다. 감사합니다, @cardinal!
조나단 크리스텐슨

2
@Jonathan: Thanks. Yes, I could have made the proof quite a bit more terse. Due to the wide range of backgrounds of the participants here, I often tend to indulge in extra (or, perhaps, excessive) detail. :-)
cardinal

12

Time to follow up! Here's the solution I was given:

We will construct a confidence interval of the form [0,T(X)), where T() is some statistic. By definition this will be a confidence interval with confidence level at least 99% if

(μR)(σ>0)Pμ,σ2(σ2>T(X))<0.01.
We note that the density of the N(μ,σ2) distribution does not exceed 1/σ2π. Therefore, P(|X|a)a/σ for every a0. It follows that
tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2).
Plugging in t=0.01 we obtain that the appropriate statistic is T(X)=10000X2.

The confidence interval (which is very wide) is slightly conservative in simulation, with no empirical coverage (in 100,000 simulations) lower than 99.15% as I varied the CV over many orders of magnitude.

For comparison, I also simulated cardinal's confidence interval. I should note that cardinal's interval is quite a bit narrower--in the 99% case, his ends up being up to about 6300X2, as opposed to the 10000X2 in the provided solution. Empirical coverage is right at the nominal level, again over many orders of magnitude for the CV. So his interval definitely wins.

I haven't had time to look carefully at the paper Max posted, but I do plan to look at that and may add some comments regarding it later (i.e., no sooner than a week). That paper claims a 99% confidence interval of (0,4900X2), which has empirical coverage slightly lower (about 98.85%) than the nominal coverage for large CVs in my brief simulations.


1
(+1) That's a nice solution. Should you have t instead of t in the display equation?
cardinal

2
A couple more points: Your solution can be made to be very close to mine without any change in the argument. Note that you can claim that P(|X|a)2a/σ2π. Then the interval becomes (0,2X2/πα2) for any α. Using α=0.01 yields T(X)6366.198X2 versus the 1/q0.016365.864 in my answer. The higher the confidence level (i.e., the smaller the α), the closer your method compares to mine (though your interval will always be wider).
cardinal

1
Second, I have not looked at that paper, but I have strong doubts that (0,4900X2) can be a valid 99% confidence interval. Indeed, consider all confidence intervals of the form (0,bX2) for some b. Then, when μ=0, we have that X2/σ2 is exactly chi-squared with one degree of freedom and so the smallest b we could select in this instance is b=1/qα. In other words, the interval given in my answer is the narrowest possible of the stated form.
cardinal

1
나는 오타 수정을 의심했다. 또한, pchisq(1/4900,1,lower.tail=F)R반환 0.9886, 아주 가까이 시뮬레이션 결과에 대한(0,4900엑스2) 간격.
추기경

1
모든 의견에 감사드립니다, @cardinal. 원래 솔루션과 같은 방식으로 입력했지만 변경 사항이 정확하다고 생각합니다.
Jonathan Christensen

5

The CI's (0,) presumably.


1
I think it would be helpful for you to say why you can't get a finite length confidence interval.
assumednormal

1
@Max I'm not smart enough - but the question didn't ask for one.
Scortchi - Reinstate Monica

4
+1 for this. Question didn't say a CI with minimal coverage, and in fact implies that this might be acceptable through its curious wording, "a confidence interval with a confidence level of at least 99%."
Ari B. Friedman
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.