"실제 범위 확률"을 계산하는 것은 "신뢰할 수있는 간격"을 계산하는 것과 같은 것입니까?

10

엔트리 레벨 통계 교재를 읽고있었습니다. 이항 분포를 갖는 데이터에서 성공 비율의 최대 가능성 추정에 관한 장에서, 신뢰 구간을 계산하기위한 공식을 제시 한 후 무의미하게 언급했습니다.

실제 적용 범위 확률, 즉 메소드가 실제 매개 변수 값을 캡처하는 구간을 생성 할 확률을 고려하십시오. 이것은 공칭 값보다 약간 작을 수 있습니다.

그리고 실제 커버리지 확률을 포함하는 대체 "신뢰 구간"을 구성하라는 제안을 계속합니다.

나는 처음으로 명목 및 실제 범위 확률이라는 개념에 직면했다. 여기에서 오래된 질문을 통해 나아갈 때, 나는 그것에 대해 이해하고 있다고 생각합니다. 우리는 확률이라고 부르는 두 가지 개념이 있습니다. 첫 번째는 아직 발생하지 않은 이벤트가 주어진 결과를 낳을 가능성이 얼마나 큽니까? 이미 일어난 사건의 결과에 대한 관찰 요원의 추측이 참일 가능성은 얼마나됩니까? 또한 신뢰 구간은 첫 번째 유형의 확률 만 측정하고 "신뢰할 수있는 구간"이라고하는 것은 두 번째 유형의 확률을 측정하는 것으로 보입니다. 나는 신뢰 구간이 "명목 범위 확률"을 계산하는 구간이고 신뢰할 수있는 구간은 "실제 범위 확률"을 포함하는 구간이라고 요약했다.

그러나 아마도 나는 책을 잘못 해석했을 것입니다 (제공되는 다른 계산 방법이 신뢰 구간과 신뢰할 수있는 구간인지 또는 두 가지 다른 유형의 신뢰 구간인지에 대해 완전히 명확하지는 않습니다) 또는 내가 사용한 다른 출처 나의 현재 이해. 특히 다른 질문에 대한 의견은

베이직에 대한 신뢰, 잦은주의에 대한 신뢰 구간

이 책에서 그 장의 베이지안 방법을 설명하지 않았기 때문에 나의 결론을 의심하게 만들었다.

따라서 내 이해가 올바른지 또는 도중에 논리적 오류가 있는지 명확히하십시오.

confidence-interval terminology coverage-probability

— 럼초
소스

공칭 적용 범위 확률은 "목표"적용 범위 확률입니다. 신뢰 구간을 제공하는 방법을 도출 할 때 달성하려고하는 것입니다. 실제 적용 범위는 "실제"적용 범위입니다. 일부 사람들 은 실제 적용 범위가 명목 적용 범위와 같을 때 신뢰 구간이 정확 하다고 말합니다 . Scotchi와 Unwisdom은 이산 데이터에 대한 신뢰 구간이 절대 정확하지 않다고 언급했습니다. 또 다른 예는 점근 적 신뢰 구간을 사용하는 경우입니다.

n \to \infty

$n \to \infty$ . "실제"도 "현재"의 동의어이므로 귀하의 아이디어를 완전히 이해합니다.

— Stéphane Laurent

5

일반적으로 실제 분포 확률은 불연속 분포로 작업 할 때 명목 확률과 절대 같지 않습니다.

신뢰 구간은 데이터의 함수로 정의됩니다. 이항 분포로 작업하는 경우 가능한 많은 결과가 있습니다 ( $n+1$ 정확히 말하면, 가능한 많은 신뢰 구간이 있습니다. 매개 변수 이후 $p$ 연속적이며 적용 범위 확률 ( $p$ )는 대략 95 % (또는 무엇이든)보다 나을 수 없습니다.

일반적으로 CLT를 기반으로하는 방법은 공칭 값 미만의 적용 확률을 가지지 만 다른 방법은 실제로 더 보수적 일 수 있습니다.

— 어리석은 행동
소스

1

다음은 유용한 공식 정의 문입니다. 샘플 공간이 주어지면

⟨ Ω, F, P ⟩

$\langle\Omega,\mathcal{F},P\rangle$ 알 수없는 매개 변수

θ

$\theta$ , ㅏ

1 - α

$1-\alpha$ 신뢰 절차 는 한 쌍의 기능으로 구성

L \leq U : Ω \to R

$L\leq U:\Omega\to\mathbb{R}$ 그런

P [{ω \in Ω | [L (ω), U (ω)] ∋ θ}] \approx 1 - α .

$P\big[\left\{\omega\in\Omega\vert [L(\omega),U(\omega)]\ni\theta\right\}\big]\approx 1-\alpha.$ 이 표현의 왼쪽은

coverage probability

$\textit{coverage probability}$ (이것은 θ에 의존 함) RHS는 명목상 신뢰 수준 입니다. 부정한 경우

Ω

$\Omega$ )의 LHS가 RHS와 같으면 절차가 정확 합니다.

— Unwisdom

8

베이지안 신뢰 구간과 빈번한 신뢰 구간과는 아무런 관련이 없습니다. 95 % 신뢰 구간은 모수의 실제 값에 관계없이 95 % 이상의 적용 범위 를 제공하는 것으로 정의됩니다. $\pi$ . 따라서 공칭 범위가 95 % 인 경우 실제 범위는 97 % 일 수 있습니다. $\pi=\pi_1$ 때 96.5 % $\pi=\pi_2$ 하지만 가치가 없다 $\pi$ 95 % 미만입니다. 이항과 같은 불연속 분포에서 문제가 발생합니다 (예 : 공칭 범위와 실제 범위 사이의 불일치).

예를 들어, 관찰을 고려하십시오 $x$ ~에서 성공 $n$ 성공 확률을 알 수없는 이항 실험 $\pi$ :

\begin{array}{ccc} x & π_{U} & Pr (X = x | π = 0.7) & I (π_{U} \leq 0.7) \\ 0 & 0.3930378 & 0.000729 & 0 \\ 1 & 0.5818034 & 0.010206 & 0 \\ 2 & 0.7286616 & 0.059535 & 1 \\ 3 & 0.8468389 & 0.185220 & 1 \\ 4 & 0.9371501 & 0.324135 & 1 \\ 5 & 0.9914876 & 0.302526 & 1 \\ 6 & 1.0000000 & 0.117649 & 1 \end{array}

$\begin{array}{c,c,c} x & \pi_\mathrm{U} & \Pr(X= x | \pi=0.7) & I(\pi_\mathrm{U}\leq 0.7)\\ 0 & 0.3930378 & 0.000729 & 0\\ 1 & 0.5818034 & 0.010206 & 0\\ 2 & 0.7286616 & 0.059535 & 1\\ 3 & 0.8468389 & 0.185220 & 1\\ 4 & 0.9371501 & 0.324135 & 1\\ 5 & 0.9914876 & 0.302526 & 1\\ 6 & 1.0000000 & 0.117649 & 1\\ \end{array}$ 첫 번째 열에는 가능한 관측 값 됩니다. 두 번째 쇼 정확한 ^† 위 ^‡ 신뢰 바인딩 당신은 각각의 경우에 계산하는 것이다. 이제 이라고 가정하자 . 세 번째 열은 이 가정 하에서 의 각 관측 값의 확률을 보여준다 . 네 번째는 계산 된 신뢰 구간이 실제 매개 변수 값을 다루고 표시하는 경우를 보여줍니다 . 신뢰 구간이 실제 값을 포함하는 경우에 대한 확률을 실제 적용 범위 . 다른 실제 값인

x

$x$

95 %

$95\%$

π_{U} = π : [Pr (X > x | π) = 0.95]

$\pi_\mathrm{U} =\pi: [\Pr(X>x | \pi)=0.95]$

π = 0.7

$\pi=0.7$

x

$x$

1

$1$

0.989065

$0.989065$

π

$\pi$ 실제 적용 범위는 다릅니다.

적용 범위

공칭 범위는 실제 매개 변수 값이 획득 가능한 상한과 일치하는 경우에만 달성됩니다.

[나는 단지 당신의 질문을 다시 읽고 저자는 실제가 공칭 적용 확률보다 작을 수 있다고 말합니다 . 그래서 나는 그들이 위에서 말한 것은 여전히 존재하지만 신뢰 구간을 계산하는 대략적인 방법에 대해 이야기하고 있다고 생각합니다. 그래프는 약 의 평균 신뢰 수준을보고 하지만 알 수없는 매개 변수의 값에 대한 평균을 제안 할 수 있습니다.] $98\%$

† 실제 적용 범위는 값에 대한 공칭 적용 범위보다 작고 @ Stephane 's가 아닌 @Unwisdom의 의미 에 해당하는 값과 동일합니다 . $\pi$ $\pi$

‡ 상한 및 하한 간격이 더 일반적으로 사용됩니다. 그러나 설명하기가 조금 더 복잡합니다. 상한과 함께 고려해야 할 정확한 간격은 단 하나입니다. (Blaker (2000), "이산 분포에 대한 신뢰 곡선과 개선 된 정확한 신뢰 구간", Canadian Journal of Statistics , 28 , 4 및 참고 문헌 참조)

— Scortchi-복권 모니카
소스

답변 주셔서 감사합니다. 이제 실제 범위 확률이 무엇인지 알았으므로이 질문의 사용자가 신뢰할 수있는 간격과 신뢰 구간의 차이를 설명하는 질문으로 전송 된 이유를 알고 있습니까? 여기에서 실제 / 공칭 범위 조사가 가능하다는 아이디어를 얻었습니다. 이원성은 관련이 있습니다. stats.stackexchange.com/questions/63922/…

— rumtscho

아마도 OP는 (당신이했던 것처럼 질문에서 그것을 요약하거나 인용하기보다는) "명 목적"과 "실제적"이라는 용어를 본 위치에 대한 링크만을 제공하기 때문에, 그의 나머지 질문을 자신의 잘못된 해석에 바칩니다. 그 맥락에서 사용하십시오.

— Scortchi-Monica Monica 복원

2

차이점은 실제로 신뢰 구간을 계산할 때 만든 근사값을 사용하는 것입니다. 예를 들어 표준 CI를

estimate \pm 1.96 \times estimated standard error

$\text{estimate}\pm 1.96 \times \text {estimated standard error}$

이것을 "95 % 신뢰 구간"이라고 부를 수 있습니다. 그러나 일반적으로 여기에 몇 가지 근사치가 있습니다. 근사값을 구하지 않으면 실제 범위를 계산할 수 있습니다. 일반적인 상황은 표준 오류를 추정하는 중입니다. 그런 다음 간격이 너무 좁아서 95 % 확률로 실제 값을 캡처 할 수 없습니다. 그들은 85 %의 확률로 진정한 가치 만 포착 할 수 있습니다. "실제 적용 범위"확률은 어떤 종류의 몬테카를로 시뮬레이션을 사용하여 계산 될 수 있습니다 (예 : 선택한 참값을 사용하여 표본 데이터 세트를 생성 한 다음 각각 95 % CI를 계산하고 실제로 참값을 포함 함을 발견 ). $1000$ $850$

— 확률 론적
소스