95 % 신뢰 구간 내의 모든 값이 똑같이 가능합니까?


56

"나는 질문에 불협화음 정보를 발견 한 수단의 차이 또는 비율의 차이의 95 % 신뢰 구간 (CI)를 구축하는 경우 CI 내의 모든 값이 똑같이 가능성이? 점 추정치가 가장 가능성, 또는 CI의 중간 부분보다 CI의 "꼬리"근처에있는 값이 더 적습니까?

예를 들어, 무작위 임상 시험 보고서에 특정 치료에서 사망률의 상대적 위험이 1.06 (95 % CI 0.96 ~ 1.18)이라고 명시되어있는 경우 0.96이 1.06과 동일한 올바른 값일 가능성은?

온라인에서이 개념에 대한 많은 참조를 찾았지만 다음 두 가지 예는 그 불확실성을 반영합니다.

  1. 신뢰 구간에 대한 Lisa Sullivan의 모듈 상태 :

    평균 차이에 대한 신뢰 구간은 ( μ1μ2 ) 의 가능한 값 범위를 제공합니다 . 신뢰 구간의 모든 값은 ( μ1μ2 ) 의 실제 값에 대한 추정치 일 수 있습니다.

  2. 오류 여백 안에 제목이있는이 블로그 게시물 은 다음과 같이 말합니다.

    내가 염두에두고있는 것은 중앙 한계 정리가 t 분포 대신에 제한된 균일 분포를 암시하는 것처럼 신뢰 구간 내의 모든 점을 동일하게 취급하는“오류 한계”에 대한 오해 입니다. [...]
    “오류 한계”누락에 대해 말하는 것은 점 추정치에 가까운 가능성이 한계의 가능성보다 훨씬 가능성이 높다는 것입니다.

이것들은 모순되는 것처럼 보이므로 어느 것이 맞습니까?


7
혼란 P-값이 균일 귀무 가설 하에서 배포됩니다 관련 개념 곳이 있을까 ..
마이클 맥고완에게

4
첫 번째 인용문은 그렇지 않으면 정확한 신뢰 구간 설명에서 비정상적인 실수입니다. 두 번째 인용문은 잘 정리하기 위해 어설픈 엉망인 계정에서 나온 것입니다. 모호하거나 부정확하거나 베이지 안에서만 해석 할 수있는 진술로 가득합니다. 그러나 두 인용 모두 잘못되었습니다 !
whuber

@whuber 나는 :)이 빈도주의 해석의 베이지안 해석 호출 것 ... 엉망 두 번째 호출 할 것
마이클 맥고완

1
@Michael 구불 구불 함의 한 예는 CLT가 "[인구] 평균의 무한 반복 된 추정치가 여전히 정규 분포를 따른다는 것을 암시하는 것과 같은 독창주의"입니다. 단순히 비 기술적 인 청중에게 아이디어를 전달하기 위해 틀릴 필요는 없습니다 .
whuber

2
@ whuber, 나는 당신이 작은 죄를 인용하는 문장을 고려합니다. 주요 오류는 CLT가 t 분포를 포함하지 않는다는 것입니다.
glassy

답변:


23

대답해야 할 한 가지 질문은이 상황에서 "가능성이있다"는 것이 무엇입니까?

확률을 의미하고 (때로는 동의어로 사용됨) 엄격한 빈번한 정의를 사용하는 경우 실제 매개 변수 값은 변경되지 않는 단일 값이므로 해당 점의 확률 (우도)은 100 %이며 모두 다른 값은 0 %입니다. 따라서 거의 모든 것이 0 % 일 가능성이 높지만 간격에 실제 값이 포함되어 있으면 다른 값과 다릅니다.

베이지안 접근 방식을 사용하는 경우 CI (Credible Interval)는 사후 분포에서 비롯되며 구간 내 다른 지점에서 가능성을 비교할 수 있습니다. 후부가 간격 내에서 완벽하게 균일하지 않으면 (이론적으로는 가능하지만 이상한 상황 일 것입니다) 값은 다른 가능성을 갖습니다.

신뢰와 유사 할 가능성이 높은 경우 다음과 같이 생각하십시오. 95 % 신뢰 구간, 90 % 신뢰 구간 및 85 % 신뢰 구간을 계산하십시오. 우리는 실제 값이 95 % 간격 내에 있지만 90 % 간격 밖에있는 영역에 있다고 5 % 확신 할 수 있습니다. 실제 값이 해당 영역에 떨어질 가능성이 5 %라고 말할 수 있습니다. 90 % 간격 내에 있지만 85 % 간격 밖에있는 영역에 대해서도 마찬가지입니다. 따라서 모든 값이 똑같이 가능성이 높으면 위의 두 영역의 크기는 정확히 동일해야하고 10 % 신뢰 구간 내에 있지만 5 % 신뢰 구간 밖에있는 영역에 대해서도 동일하게 유지됩니다. 구간을 사용하여 생성 된 표준 분포는이 특성을 갖지 않습니다 (1은 유니폼에서 그리는 특수한 경우 제외).

알려진 모집단의 많은 수의 데이터 세트를 시뮬레이션하고 관심 신뢰 구간을 계산 한 다음 실제 매개 변수가 각 엔드 포인트보다 포인트 추정치에 얼마나 자주 근접하는지 비교하여이를 스스로 증명할 수 있습니다.


3
가능성은이 질문이 잦은 주의자 나 베이지안의 대답이 아닌 대답에 필요한 것입니다. 가능성은 정확하게 답을 제공하고, 다른 것들은 약간의 비틀기와 스트레칭으로 만 그렇게 할 수 있습니다.
Michael Lew

1
@ 그렉 나는 당신의 설명을 좋아한다. 분명히, 당신의 주장은 95 % CI의 "꼬리"값이 포인트 추정치에 가까운 것보다 덜 가능성이 적다는 생각을지지합니다. 맞습니까? 답변 주셔서 감사합니다.
pmgjones

1
@pmgjones의 가능성이 적습니다. 아니요, 두 번째 단락을 참조하십시오. 네 번째 단락의 맥락에서 그렇습니다.
Greg Snow

2
@GregSnow 두 번째 단락은 실제 매개 변수가 실제 매개 변수 일 확률이 100 %라고 거의 정확하게 말합니다. 당신은 정말로이 타톨 로지가 "엄격한 빈번한 정의"가 제공해야한다고 믿는가?
rolando2

2
@ rolando2, 나는 잦은 통계가 많은 것을 제공한다고 생각합니다. 나는 진정한 가치 변화를 암시하고 때로는 간격을 벗어나고 때로는 간격 안에 있습니다 (때로는 경계에 가깝고 때로는 센터). 그리고 나중의 문단은 아이디어에 대한 진정한 느낌을 얻습니다.
Greg Snow

19

이것은 좋은 질문입니다! 문제를 이해하는 데 도움이 될 수있는 가능성이라는 수학적 개념이 있습니다. Fisher는 가능성을 발명했지만 가능성보다는 다소 바람직하지 않은 것으로 간주했지만 가능성은 확률보다 더 '원시적'인 것으로 밝혀졌으며 Ian Hacking (1965)은 그것이 가능성이 없다는 점에서 공리적이라고 생각했습니다. 가능성은 반대가 아니라 확률을 뒷받침합니다.

해킹, 1965. 통계적 추론의 논리 .

정당한 이유없이 표준 교과서에 있어야한다는주의를 기울이지 않아도됩니다. 거의 정확하게 예상되는 속성을 가질 확률과 다르며 가능성 함수와 간격은 추론에 매우 유용합니다. 어쩌면 관련 가능성 함수를 도출하는 '적절한'방법이 없기 때문에 일부 통계학자는 가능성을 선호하지 않을 수도 있습니다. 그러나 많은 경우에 우도 함수는 명확하고 잘 정의되어 있습니다. 추론 가능성에 대한 연구는 아마도 Richard Royall의 작고 이해하기 쉬운 통계적 증거 : 가능성 패러다임 이라는 책으로 시작해야합니다 .

귀하의 질문에 대한 대답은 아니오, 어떤 간격 내의 포인트도 모두 같은 가능성을 갖지는 않는다는 것입니다. 신뢰 구간의 모서리에있는 신뢰 구간은 일반적으로 구간 중심을 향한 다른 구간보다 가능성이 낮습니다. 물론 기존의 신뢰 구간은 특정 실험과 관련된 모수에 대해 직접 아무 것도 알려주지 않습니다. Neyman의 신뢰 구간은 실험에 관련된 '로컬'속성이 아닌 장기적인 속성을 갖도록 설계 되었기 때문에 '전역'입니다. (행복하게 좋은 장기 성과는 현지에서 해석 할 수 있지만 수학적 현실보다는 지적 지름길입니다.) 가능성 구간 (구성 할 수있는 경우)은 실험과 관련된 가능성을 직접 반영합니다.


1
@suncoolsu 해당 구간이 명령문이 참일 가능성 구간 일 필요는 없습니다. 구간 경계가 구간 내 포인트보다 각각 적을 수 있도록 구간은 가장 가능성이 높은 추정값에만 도달해야합니다. 일반적인 신뢰 구간은 해당 요구 사항을 충족합니다.
Michael Lew

2
@pmjones 95 % CI는 CI의 여백을 향한 값이 중간 값보다 진실에 더 가까운 지 여부를 알려주지 않습니다. CI는 모집단의 반복 샘플링에 대해 진술합니다. 장기적으로 (즉, 반복 샘플링 후), 각 샘플에 대해 구성된 CI의 95 %가 실제 값을 포함합니다. 따라서 두 가지 주요 관측치가 있습니다. 1) 주어진 CI의 실제 가치에 대해 아무 말도 할 수 없습니다. 2) CI는 관측 된 데이터에 대해 아무 것도 말하지 않습니다. 이는 일반적인 베이지안 비판입니다.
suncoolsu

1
@MichaelLew 우도 원칙은 유용하지만 (LW 인용) "실제로 모든 잦은 유추는 LP를 위반하므로 LP를 준수하면 잦은 유추를 포기해야합니다." CI는 빈번한 아이디어이기 때문에 LP (기본이라고 함)에 위배됩니다.
suncoolsu

1
@suncollsu 문제는 신뢰 구간 만 있고 다른 통계적 고려 사항이 없으면 매개 변수 값이 그 자체에있을 가능성에 대해 알려주는 것이 아닙니다. 구간 내에서 매개 변수 값의 가능성에 관한 것입니다. 우도 함수는 질문에 답하며, 신뢰 구간이 우도 원칙을 위반하더라도 그 답은 정확합니다. (내 이전 의견을 다시 읽으십시오. 내용을 완전히 무시한 것 같습니다.)
Michael Lew

2
@ rolando2 Neyman의 95 % 신뢰 구간은이 방법이 사용 된 경우의 95 %에 대해 실제 모수를 포함하도록 설계되었습니다. 엄밀히 말하면 신뢰는 방법에 따르고 개별 간격에는 영향을 미치지 않으므로 개별 간격은 특정 실험에서 세계의 상태에 대해 아무 것도 알려주지 않습니다. 자세한 내용은이 질문에 대한 내 대답을 참조하십시오 stats.stackexchange.com/questions/8844/...
마이클 루

18

어떤 사람 이 CI95 내의 모든 가치를 인구 가치의 잠재적 지표로 동등하게 신뢰 해야한다고 나에게 가정 해 봅시다 . (의도적으로 "가능성이 높고"라는 용어를 피하고 있습니다.) 95의 특별한 점은 무엇입니까? 아무것도 아님 : 일관성을 유지하기 위해 CI96, CI97, ... 및 CI99.9999999 내의 모든 값을 동일하게 신뢰해야합니다. CI의 적용 범위가 한계에 도달하면 거의 모든 실수가 포함되어야합니다. 이 결론의 터무니없는 말은 초기 주장을 거부하게 만들 것입니다.


4
이것은 좋은 답변입니다! 가능한 CI의 극단적 인 접근이 미치는 영향에 대해 생각해야했습니다. 이것을 작성해 주셔서 감사합니다!
pmgjones

2

신뢰 구간의 정의부터 시작하겠습니다. 95 % 신뢰 구간이 이것에서 그것으로 진행된다고 말하면 , 그 자연의 진술은 시간의 약 95 %에 해당하고 시간의 약 5 %에 ​​해당 한다는 것을 의미합니다 . 필자 가이 특정 진술 에 대해 95 % 확신을 갖는 것은 아닙니다 . 90 % 신뢰 구간은 더 좁아지고 80 %는 더 좁아집니다. 따라서 실제 값이 무엇인지 궁금 할 때 특정 신뢰 구간의 가장자리에 가까워 질수록 신뢰도가 떨어집니다.

위의 모든 내용은 정 성적이며 특히 "신뢰"입니다. (저는 직관적 인 수하물과 다를 수있는 수학적 수하물을 가지고 있기 때문에 그 진술에서 "자신감"또는 "가능성"이라는 용어를 피했습니다. 여기 벌레의 수 있습니다.

Box, Hunter & Hunter의 고전 텍스트 ( "Statistics for Experimenters", Wiley, 1978)도 도움이 될 수 있습니다. 113, ff 페이지의 "신뢰 설정 간격"을 참조하십시오.


우리가 개념과 의미론을 부분적으로 다루고 있기 때문에, 두 번째 문장에서 당신은 "... 자연의 진술은 사실이 될 것입니다 ..."라고 말한 것을 지적 할 것입니다.
rolando2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.