신뢰 구간 해석


16

참고 : 중복 된 경우 사전에 사과드립니다. 검색에서 비슷한 q를 찾지 못했습니다.

우리가 진정한 매개 변수 p를 가지고 있다고 가정 해보십시오. 신뢰 구간 C (X)는 p의 95 %를 포함하는 RV입니다. 이제 X를 관찰하고 C (X)를 계산한다고 가정하자. 일반적인 대답은 "p를 포함하거나 포함하지 않기"때문에 "p를 포함 할 확률이 95 %"인 것으로 해석하는 것이 올바르지 않은 것 같습니다.

그러나 뒤섞인 갑판의 상단에서 카드를 골라 뒤집어 놓았다고 가정 해 봅시다. 직감적으로 나는이 카드가 스페이드 에이스 일 가능성은 1/52로 생각합니다. 비록 실제로 "스페이드 에이스 일 수도 있고 아닐 수도 있습니다." 이 추론을 신뢰 구간의 예에 적용 할 수없는 이유는 무엇입니까?

또는 카드가 "그렇거나 그렇지 않은"스페이드 에이스 인 "확률"에 대해 말하는 것이 의미가없는 경우, 스페이드 에이스가 아니라는 51 : 1 확률을 여전히 적용합니다. 이 정보를 설명 할 다른 단어가 있습니까? 이 개념은 "확률"과 어떻게 다릅니 까?

편집 : 확률에 대한 베이지안 해석에서 더 명확하게 말할 수 있습니다. 임의의 변수를 실현하고 조건에 대한 다른 정보가 없다면 임의의 변수에 p의 95 %가 들어 있다고 들었다면 랜덤 변수가 p를 포함 할 확률이 95 %라고 말하는 것이 맞습니까?

편집 : 또한, 확률의 잦은 해석에서 잦은 주의자는 "신뢰 구간에 p가 포함될 확률은 95 %입니다"라고 말하지 않는다고합시다. 잦은 주의자가 신뢰 구간에 p가 포함 된 "신뢰"를 갖는 것이 여전히 논리적입니까?

알파를 유의 수준으로하고 t = 100- 알파라고하자. K (t)는 신뢰 구간에 p가 포함되어있는 빈번 주의자의 "신뢰"입니다. K (t)가 t로 증가해야한다는 것이 합리적입니다. t = 100 % 일 때, 잦은 주의자는 신뢰 구간에 p가 포함되어 있음을 확실하게 정의해야하므로 K (1) = 1을 정규화 할 수 있습니다. 마찬가지로 K (0) = 0입니다. 아마도 K (0.95)는 0과 1과 K (0.999999)가 더 큽니다. 잦은 운동가는 K를 P (확률 분포)와 다르게 생각하는 방법은 무엇입니까?


1
실제로, 동전이 테이블 아래에서 구르는 동전 뒤집기를 고려하면, 동전이 머리 위에 놓인 사건을 고려합니다. 언뜻보기에 이것은 CI 문제와 매우 유사 해 보입니다. 사건이 발생했거나 발생하지 않았 음을 분명히 나타냅니다. 그러나 동전 뒤집기 사례에서 많은 (아마도 대부분의) 빈번한 사람들 은 관찰 할 수없는 동전이 머리에 닿았을 때 명목 확률 (예 : )을 할당하는 것이 완전히 행복해 보이지만 매개 변수. 나에게 불일치가있는 것 같습니다. p
Glen_b-복지 주 모니카

@Glen_b Frequentists는 관측에 동전 시나리오 (이 관측 비록) 동전의 실제 얼굴 값이 "임의"입니다하지 않는 것이, 말할 실적 인 추론을 적용하지만, 우리가 수 있음을 떨어 일반화 다른 어떤 관찰 결과 잠재적 인 결과를 떨어이의를 코인 및 확률 계산. 코인의 실제 액면가에 대한 확률이라면, 헤드가 있든 아니든, 가능성은 없습니다. 이 설정의 실적 인 건설에 저장됩니다. p
AdamO

@Glen_b : 동의합니다. 여기에서 제 질문을보십시오 : stats.stackexchange.com/questions/233588/…
vonjd

@vonjd 귀하의 질문은 "Note :"를 시작한 후 첫 단락의 복제본이 어느 정도입니까?
Glen_b-복귀 모니카

@ Glen_b : 솔직히 말해서 내 질문을 게시했을 때이 질문에 대해 알지 못했고 확실히 겹칩니다. 그러나 나는 그들이 일반적으로 숨겨진 결과 (확실성 간격에 대한 결과를 가져올 것)에 대한 확률을 사용하는 것에 더 관심이 있기 때문에 중복되지는 않는다고 생각하지만 이것은 순수한 신뢰 간격을 목표로합니다. 그러나 내 것이 중복이라고 생각하면 자유롭게 닫으십시오.
vonjd

답변:


8

이 문제에 대한 많은 전통적인 설명이 명확하지 않다고 생각합니다.

당신이 크기의 샘플을 가지고 말할 수 있습니다 과 수 (95) %의 대한 신뢰 구간 .10095%p

그런 다음 첫 번째에 관계 없이 다른 표본을 취하여 p에 대해 95 % 신뢰 구간을 다시 얻습니다 .10095%p

신뢰 구간은 무엇입니까? 바뀌지 않는 것은 입니다. p 즉, 잦은 방법에서 신뢰 구간은 "임의"이지만 는 "고정"또는 "일정", 즉 무작위가 아니라고 말합니다. 신뢰 구간 방법과 같은 빈번한 방법에서는 확률이 랜덤 인 것에 만 할당합니다.p

따라서 이고 는 신뢰 구간입니다. ( "더 낮게"및 "상위로"새로운 샘플을 과 U를 바꾸지 만 p 는 변하지 않습니다.Pr(L<p<U)=0.95L = U = L(L,U)L=U=LUp

특정 예 에서 U = 43.61 이 있다고 가정 해 봅시다 . 빈도주의 방법에서 하나가 문 확률을 할당 할 것이다 40.53 < P < 43.61 의 확률이 아닌, 또는 랜덤 여기 아무것도 becuase : 무작위되지 않습니다, 이 경우 변경되지 않습니다 때문에 (임의 아니다 우리는 새로운 샘플을 취합니다) 은 무작위가 아닙니다.L=40.53U=43.6140.53<p<43.611 40.53 P 43.610140.53p43.61

실제로, 사람들은 가 과 사이에 있다고 확신하는 것처럼 행동합니다 . 그리고 실질적인 문제로 종종 의미가 있습니다. 그러나 때로는 그렇지 않습니다. 그러한 경우 중 하나는 이상인 숫자 가 미리 불가능한 것으로 알려져 있거나 가능성이 높은 것으로 알려진 경우입니다. 사전 확률 분포를 할당 할 수있는 경우 Bayes 정리를 사용하여 신뢰할 수있는 구간을 얻습니다.이 구간은 의 값 범위에 대한 사전 지식으로 인해 신뢰 구간과 다를 수 있습니다.P 40.53 43.61 40 (P) P는 P (40) ( L , U ) P θ ± 1 / 2 50 % 0.001 50 % θ 0.999 100 %의 θ95%p40.5343.6140pp가능성이 있거나 불가능합니다. 실제로 데이터 자체-새로운 샘플을 채취하면 변경되는 것들, 가 만큼 크지 않을 수도 있고 그렇지 않을 수도 있음을 알 수 있습니다 . 이는 쌍 이 대한 충분한 통계량 인 경우에도 발생할 수 있습니다 . 이러한 현상은 일부 경우에 보조 통계에 대한 Fisher의 조건 조정 방법으로 처리 할 수 ​​있습니다. 이 마지막 현상의 예는 표본이 간격으로 균일하게 분포 된 두 개의 독립적 관측치로 구성된 경우입니다 . 그런 다음 두 관측 값 중 더 작은 것에서 큰 것까지의 간격은p40(L,U)pθ±1/250%신뢰 구간. 그러나 그들 사이의 거리 인 경우 , 어디 근처에 터무니없는 것 확인하십시오 IS 사이, 그리고 거리 인 경우 , 하나는 합리적으로 거의 것 확실 IS 그들 사이. 그들 사이의 거리는 조건이 될 보조 통계입니다.0.00150%θ0.999100%θ


감사합니다 마이클 감사합니다. 귀하의 예에서 특정 (L, U)가 있지만 그 값이 알려지지 않았다고 가정 해 봅시다. 우리가 알고있는 것은 이것이 95 % 신뢰 구간 랜덤 변수의 실현이라는 것입니다. 매개 변수 또는 다른 정보에 대한 사전 정보가 없으면 (L, U)에 매개 변수가 포함되어 있다는 19 : 1 확률을 제시하는 것이 공정합니까? 잦은 주의자가이 일을 기꺼이하려하지만 "19 : 1 확률로 매개 변수를 포함 할 가능성"을 "확률"이라고 부르지 않는다면, 우리는 이것을 무엇이라고 부릅니까?
applicative_x

예, 확률은 입니다. 확실히 잦은 방법 내에서 의 무지 상태에서 그 구간에 가 확률은 라고 말할 수 있습니다 . 그러나 임의의 값이 아닌 특정 값을 갖는 경우, 잦은 주의자는 이외의 확률을 할당하지 않습니다.( L , U ) 0.95 p U0.95(L,U)0.95p L 과의 알려진 값이 0 또는 1하지 않습니다. 01LU
Michael Hardy

4

% 신뢰 구간 의 교과서 정의 는 다음과 같습니다.100×(1α)

이상적인 조건에서 여러 독립적 인 연구 복제 하에서 복제 된 효과 측정 값을 % 캡처 하는 간격.100×(1α)

잦은 사람들에게 가능성은 과학적 연구 결과를 계속해서 또 다시 평가하기 위해 무한한 수의 세계 사본이 만들어진 것처럼 결과를 되풀이하는 "되감기 시간과 공간"이라는 개념에서 비롯됩니다. 따라서 확률은 정확히 빈도입니다. 과학의 첫 번째 원칙은 연구를 복제 할 수 있어야한다는 점에서 과학자들에게 이것은 연구 결과를 논의하기에 매우 편리한 방법입니다.

카드 예에서 베이지안과 빈번한 사람들의 혼동은 잦은 주의자가 갑판에서 뒤집어 놓은 특정 카드 의 액면가에 확률을 할당하지 않는 반면 베이지안과는 다릅니다. 빈도주의는에 확률을 할당합니다 무작위로 단행 갑판의 상단에서 뒤집힌 카드. Bayesian은 연구를 복제하는 데 관심이 없으며, 일단 카드가 뒤집 히면 카드가 무엇인지 100 %, 다른 가치를 가질 수 있다고 0 % 확신합니다. 베이지안의 경우 확률은 신념의 척도입니다.

베이지안에는 이러한 이유로 신뢰 구간 이 없으며 신뢰성 구간으로 불확실성을 요약 합니다.


답변 주셔서 감사합니다. 카드 예에서, 베이지안과 잦은 주의자 모두 51 : 1이 카드가 스페이드의 에이스 일 가능성이 높다고 동의하지 않습니까? 마찬가지로 95 % 신뢰 구간 (및 기타 정보 없음)을 실현하기 위해 실제 모수가 포함 된 19 : 1 확률이 아닌가? 그런 의미에서 베이지안은 95 % 신뢰 구간을 참 매개 변수를 포함 할 확률이 95 % 인 것으로 해석 할 수 있습니까?
applicative_x

@applicative_x 피노 클 데크는 어떻습니까? 이전 정보의 사용을 고려하고 있습니다. 빈도주의은 확률이라고 가정 할 수있다 만이 실험은 가설과 일치 또는 불일치 여부를 알려 valueto 카드의면을 사용한다. 모든 유형의 구간 추정 (타당성 또는 신뢰도)의 유효성은 확인할 수없는 가정에 따라 다릅니다. 진정한 매개 변수는 없습니다. 과학에 대한 위험한 사고 방식입니다. 베이지안은 이전 정의에 따라 신뢰 구간을 가지고 놀지 않습니다. 답을 다시 읽으십시오. p=1/52
AdamO 2016 년

고마워 아담, 나는 아직도 혼란스러워 생각합니다. 52 장의 카드 데크가 표준이라는 것을 (카드를 보면) 알 수 있다고 가정 해 봅시다. 나는 갑판을 뒤섞어 보지 않고 카드 10 장을 뽑습니다. 이 경우 "참 매개 변수"를 레드 카드 수로 정의 할 수 없습니까? 그런 다음 베이지안 대 빈번함에 관계없이 "참 매개 변수"가 있습니다. 무작위로 7 장의 카드를 선택할 수 있다면 10 장 중 # 장의 레드 카드에 대한 신뢰 구간을 구성하는 것을 상상할 수 있습니다.
applicative_x

1
베이지안은 매개 변수의 실제 값과 같은 것이 없다고 믿지 않아도됩니다. 베이지안은 확률이 불분명 한 진술에 확률을 할당하는 것을 의미합니다. 베이지안 확률 할당 할 수 있습니다 의 인생 억 년 전 화성에 있다는 것을 문에. 모든 경우의 절반에서 일어난 일을 말할 수 없기 때문에 잦은 주의자는 그렇게 할 수 없습니다. 베이 즈 인은 화성에 그런 생명체가 있는지에 대한 진정한 답이 있다고 믿을 수 없다고 말합니다. 귀하의 질문에 게시 된 답변도 참조하십시오. 1/2
Michael Hardy

1
@AdamO : 나는 당신의 의견이 비밀 스럽습니다. '진리'의 개념이 '유용한 것'의 주제는 주제의 변화입니다. "우리는 진실을 불변이라고 생각합니다." "우리"는 당신과 다른 사람을 의미하며, 그들이 생각하는 것과의 관련성은 무엇입니까? "아무도 이미 알려진 것을 검증하기 위해 어떤 과학자도 데이터를 수집하지 않을 것입니다." 그것은 또 다른 주제의 변화처럼 보입니다. 그런 다음 자주 주의자와 베이지안에 대한 몇 가지 의견이 있습니다. 나는 당신이 말하려는 것을 추측하고 싶지 않습니다.
Michael Hardy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.