확률 불균형과 다중 관측 사례와의 연결을 통해 볼 때이 결과는 그렇게 불가능 해 보이지 않거나 적어도 그럴듯 해 보일 수 있습니다.
μ 및 σ 2를 알 수없는 X∼N(μ,σ2) 으로 하자 Z ∼ N ( 0 , 1 )에 대해 X = σ Z + μ 라고 쓸 수 있습니다 .μσ2X=σZ+μZ∼N(0,1)
주요 주장 : [0,X2/qα) 는 σ 2에 대한 (1−α) 신뢰 구간 이며, 여기서 q α 는 자유도가 1 인 카이 제곱 분포 의 α 수준 분위수입니다. 또한,이 간격을 가지므로 정확하게 ( 1 - α ) 에 따르면 μ = 0 , 그 폼의 가능한 좁은 간격 [ 0 , B X 2 )σ2qαα (1−α)μ=0[0,bX2)일부 .b∈R
낙관적 인 이유
을 불러에서 해당 와 경우, T = Σ N I = 1 ( X I - ˉ X ) 2 는 일반적인 ( 1 - α ) 에 대한 신뢰 구간 σ (2)가 된다
( Tn≥2T=∑ni=1(Xi−X¯)2 (1−α)σ2
여기서, Q의 k는 , A는 은 IS의 분위수 - 레벨은 카이 제곱으로 k 개의 자유도. 물론 이것은 어떤 μ에도 적용 됩니다. 이것이가장 인기있는간격 (명확한 이유로 등꼬리 간격이라고도 함)이지만 폭이 가장 작은 것도 아니고 가장 작은 것도 아닙니다! 명백한 바와 같이, 다른 유효한 선택은
( 0 , T
(Tqn−1,(1−α)/2,Tqn−1,α/2),
qk,aakμ(0,Tqn−1,α).
따라서 이므로
( 0 , ∑ n i = 1 X 2 iT≤∑ni=1X2i
또한 적어도 커버리지 갖는다 ( 1 - α를 ) .
(0,∑ni=1X2iqn−1,α),
(1−α)
이러한 관점에서 볼 때, 우리는 기본 청구의 구간이 대해 참이라는 낙관적 일 수 있습니다. 가장 큰 차이점은 단일 관측의 경우 자유도 카이 제곱 분포가 없으므로 자유도 1 분위수를 사용하면 효과가 있기를 바랍니다.n=1
목적지를 향한 반 걸음 ( 오른쪽 꼬리를 악용 )
주요 주장의 증거로 뛰어 들기 전에 먼저 강력하거나 통계적으로 만족스럽지 않지만 진행 상황에 대한 추가 통찰력을 제공하는 예비 주장을 살펴 보겠습니다. 많은 손실이 없다면 아래 주요 주장의 증거로 건너 뛸 수 있습니다. 이 섹션과 다음 섹션에서 약간의 미묘한 증거는 기본 사실, 즉 확률의 단일성, 정규 분포의 대칭성 및 단일성만을 기반으로합니다.
보조 제 : A는 ( 1 - α ) 에 대한 신뢰 구간 σ 2 길이만큼 α > 1 / 2 . 여기서 z α 는 표준 법선 의 α 수준 분위수입니다.[0,X2/z2α)(1−α)σ2α>1/2zαα
증거 . 와 | σ Z + μ | d = | − σ Z + μ | 대칭성에 의해, 다음에 나오는 것은 일반성의 손실없이 μ ≥ 0 을 취할 수 있습니다 . 이제 θ ≥ 0 및 μ ≥ 0의 경우
P ( | X | > θ ) ≥ P ( X > θ )|X|=|−X||σZ+μ|=d|−σZ+μ|μ≥0θ≥0μ≥0
등으로 θ = Z α σ , 우리는 참조하는
P ( 0 ≤ σ 2 < X 2 / Z 2 α ) ≥ 1 - α
P(|X|>θ)≥P(X>θ)=P(σZ+μ>θ)≥P(Z>θ/σ),
θ=zασ
이것은 단지 작동
α > (1) / 2, 즉 필요한 무엇 때문에,
Z α > 0 .
P(0≤σ2<X2/z2α)≥1−α.
α>1/2zα>0
이것은 보조 주장을 증명합니다. 예시 적이지만, 작동 하기 위해서는 터무니없이 큰 가 필요하기 때문에 통계적 관점에서 불만족 스럽 습니다.α
주요 주장 입증
위의 주장을 구체화하면 임의의 신뢰 수준에 효과가있는 결과가 도출됩니다. 먼저
집합 = μ / σ ≥ 0 및 B = θ / σ ≥ 0 . 그런 다음
P ( | Z + a | > b ) = Φ ( a − b ) + Φ ( − a − b )
P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ≥0b=θ/σ≥0고정 된
b 마다
오른쪽에서
a 가증가 함을 보여줄 수 있다면이전 인수와 비슷한 인수를 사용할 수 있습니다. 평균이 증가하면
b 를 초과하는 계수를 가진 값을 볼 가능성이 높아지기 때문에 이것은 아마도 그럴듯합니다. (그러나 왼쪽 꼬리에서 질량이 얼마나 빨리 감소하는지주의해야합니다!)
P(|Z+a|>b)=Φ(a−b)+Φ(−a−b).
abb
fb(a)=Φ(a−b)+Φ(−a−b)
f′b(a)=φ(a−b)−φ(−a−b)=φ(a−b)−φ(a+b).
f′b(0)=0uφ(u)ua∈(0,2b)φ(a−b)≥φ(−b)=φ(b)f′b(a)≥0
for all
a≥0 and any fixed
b≥0.
Hence, we have shown that for a≥0 and b≥0,
P(|Z+a|>b)≥P(|Z|>b)=2Φ(−b).
Unraveling all of this, if we take θ=qα−−√σ, we get
P(X2>qασ2)≥P(Z2>qα)=1−α,
which establishes the main claim.
Closing remark: A careful reading of the above argument shows that it uses only the symmetric and unimodal properties of the normal distribution. Hence, the approach works analogously for obtaining confidence intervals from a single observation from any symmetric unimodal location-scale family, e.g., Cauchy or Laplace distributions.