신뢰 구간과 신뢰할 수있는 구간이 일치하는 예


11

Credible Interval 의 Wikipedia 기사에서 다음 과 같이 말합니다.

단일 모수 및 단일 단일 통계량으로 요약 될 수있는 데이터의 경우, 알 수없는 모수가 위치 모수 인 경우 신뢰할 수있는 구간과 신뢰 구간이 일치 함을 알 수 있습니다 (즉, 전진 확률 함수의 형식은 Pr (x | μ) = f (x − μ)), 사전에 균일 한 평탄 분포; [5] 및 미지의 모수가 척도 모수 인 경우 (즉, 순방향 확률 함수는 Pr (x | s) = f (x / s)), Jeffreys 이전의 [5] – 후자는 이러한 스케일 매개 변수의 로그를 취하면 분포가 균일 한 위치 매개 변수로 바뀌기 때문에 다음과 같습니다. 그러나 이것들은 명백히 특별한 (중요하지만) 경우입니다. 일반적으로 그러한 동등성을 만들 수 없습니다. "

사람들이 이에 대한 구체적인 예를 제시 할 수 있습니까? 95 % CI가 실제로 "95 % 확률"에 해당하므로 CI의 일반 정의를 "위반"합니까?

답변:


13

정규 분포:

알려진 분산으로 정규 분포를 취하십시오. 일반성을 잃지 않고이 분산을 1로 할 수 있습니다 (각 관측 값을 분산의 제곱근으로 나눔). 여기에는 샘플링 분포가 있습니다.

p(X1...XN|μ)=(2π)N2exp(12i=1N(Xiμ)2)=Aexp(N2(X¯μ)2)

어디 는 데이터에만 의존하는 상수입니다. 이는 표본 평균이 모집단 평균에 대한 충분한 통계량임을 나타냅니다. 우리가 이전에 균일을 사용한다면 μ에 대한 사후 분포는 다음과같습니다.Aμ

(μ|X1...XN)Normal(X¯,1N)(N(μX¯)|X1...XN)Normal(0,1)

따라서 신뢰할 수있는 간격은 다음과 같은 형식입니다.1α

(X¯+1NLα,X¯+1NUα)

여기서 U α 표준 정규 확률 변수되도록 선택된다 Z를 만족한다 :LαUαZ

Pr(Lα<Z<Uα)=1α

이제 신뢰 구간을 구성하기 위해이 "피벗 수량"부터 시작할 수 있습니다. 의 샘플링 분포고정μ에대한 N (μ ¯ X )은 표준 정규 분포이므로 위의 확률로 이것을 대체 할 수 있습니다.N(μX¯)μ

Pr(Lα<N(μX¯)<Uα)=1α

그런 다음 를 풀도록 재정렬 하면 신뢰 구간은 신뢰할 수있는 구간과 같습니다.μ

스케일 파라미터 :

스케일 파라미터의 경우, pdf는 . 우리는(Xi|s)~Uniform(0,s)를 취할 수있는데, 이는f(t)=1에 해당합니다. 공동 샘플링 분포는 다음과 같습니다.p(Xi|s)=1sf(Xis)(Xi|s)Uniform(0,s)f(t)=1

p(X1...XN|s)=sN0<X1...XN<s

여기서 우리는 충분한 통계량을 (관측치의 최대치)와 동일하게 찾습니다 . 이제 샘플링 분포를 찾습니다.Xmax

Pr(Xmax<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

이제 를 사용하여이를 매개 변수와 독립적으로 만들 수 있습니다 . 우리 "피봇 수량이 '주어진다이 수단 Q = 이야 - 1 X가 있어요 XP의 R ( Q < Q를 ) = Q N 은 IS하는 B 형 전자 t ( N , 1 ) 분포. 따라서 베타 수량을 사용하여 L α , U α 를 선택할 수 있습니다 .y=qsQ=s1XmaxPr(Q<q)=qNbeta(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1α=UαNLαN

그리고 우리는 중추적 인 수량을 대체합니다.

Pr(Lα<s1Xmax<Uα)=1α=Pr(XmaxLα1>s>XmaxUα1)

그리고 우리의 신뢰 구간이 있습니다. jeffreys를 사용한 베이지안 솔루션에는 다음이 있습니다.

p(s|X1...XN)=sN1XmaxrN1dr=N(Xmax)NsN1
Pr(s>t|X1...XN)=N(Xmax)NtsN1ds=(Xmaxt)N

이제 신뢰 구간을 연결하고 신뢰도를 계산합니다.

Pr(XmaxLα1>s>XmaxUα1|X1...XN)=(XmaxXmaxUα1)N(XmaxXmaxLα1)N

=UαNLαN=Pr(Lα<Q<Uα)

1α


걸작, 감사합니다! "정규 분포에서 표본의 평균을 계산할 때 95 % CI는 실제로 95 % 신뢰할 수있는 간격이기도합니다"또는 이와 유사한 간단한 대답이있을 것으로 기대했습니다. (이 가정 된 답변을 구성하는 것만으로도 구체적인 예에 ​​대한 실마리는 없습니다.)
Wayne

나는 잦은주의 95 % 예측 / 공차 구간이 OLS 회귀 및 정상 오류가있는 베이지안 예측 구간에 해당한다고 생각합니다. predict.lm의 답변과 시뮬레이션 된 답변을 비교하면 그렇게 나타납니다. 그게 사실입니까?
Wayne

Y=α+βXα,βσ

감사합니다! Confidence Interval과 관련하여 수행 한 회귀에 대한 CI를 설명하려고 노력했으며 이는 신뢰할 수있는 간격을 기대하는 평신도 청중과 연결되지 않습니다. 평신도의 CI에 대한 오해를 강화시킬 수 있기 때문에 인생을 훨씬 편하게 만듭니다.하지만 아마도 전체 통계 세계에는 좋지 않습니다.
Wayne

@ 웨인 (Wayne)-상황은 위치 규모 가족보다 조금 더 일반적입니다. 일반적으로 CI는 "충분한 통계"(이 두 개가있는 경우)를 기반으로하는 경우 신뢰할 수있는 간격과 같습니다. 통계가 충분하지 않은 경우 CI는 신뢰할 수있는 간격 해석을 위해 "보조 통계"라는 항목을 조건으로 지정해야합니다.
chanceislogic
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.