신뢰 구간은 언제 유용합니까?


30

올바르게 이해하면 매개 변수의 신뢰 구간은 지정된 비율의 샘플에 대한 실제 값을 포함하는 구간을 생성 하는 방법으로 구성된 구간입니다. 따라서 '자신감'은 특정 샘플에서 계산 한 간격이 아니라 방법에 관한 것입니다.

통계의 사용자로서 모든 샘플의 공간이 가설이기 때문에 항상 이것에 의해 속이는 느낌이 들었습니다. 내가 가진 것은 하나의 샘플이며 그 샘플이 매개 변수에 대해 알려주는 것을 알고 싶습니다.

이 판단이 잘못 되었습니까? 적어도 일부 상황에서 신뢰 구간을 살펴 보는 방법이 있습니까? 이는 통계 사용자에게 의미가 있습니까?

[이 질문은 math.se 답변 https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 에서 신뢰 구간을 분석 한 후의 두 번째 생각에서 발생합니다. # 7572 ]

답변:


15

저는 CI를 가설 테스팅 (HT) 프레임 워크, Neyman 의 접근 방식에 따른 이진 결정 프레임 워크를 벗어나고 어떤 식 으로든 측정 이론과 일치하는 방법으로 생각하고 싶습니다 . 더 정확하게 말하면, 그것들은 추정의 신뢰성 (예를 들어 평균의 차이)에 더 가깝다고 생각하고 반대로 HT는 함정과 함께 가설 추론에 가깝습니다 (우리는 널을 받아 들일 수 없습니다, 대안은 종종 확률 론적 등). 그럼에도 불구하고 구간 추정과 HT 둘 다에서 우리는 대부분의 분포 분포 가정 (예 : 하에서의 샘플링 분포)에 의존해야 합니다. 잦은 접근).H0

많은 맥락에서 CI는 일반적인 HT를 보완하며 다음 그림과 같이 봅니다 ( 미만 ).H0

대체 텍스트

즉, HT 프레임 워크 (왼쪽)에서 통계가 널과 얼마나 멀리 떨어져 있는지 확인하고 CI (오른쪽)를 사용하면 특정 의미에서 "통계에서"널 효과를보고 있습니다.

또한 승산 비와 같은 특정 종류의 통계의 경우 HT는 종종 의미가 없으며 비대칭 적이며 관련 방향 및 정밀도에 대한 관련 정보를 제공하는 관련 CI를 보는 것이 좋습니다 (있는 경우).


왜 가설 검정이 다른 확률 추정치보다 확률 비에 대해 의미가 없다고 말하는가? 나는 신뢰 구간이 확률 비 및 유한 샘플에서 비대칭 샘플링 분포를 갖는 다른 추정에 대해 표준 오차보다 더 유용하다고 강조했다.
onestop

@onestop 글쎄, 나는 당신이 "비대칭 샘플링 분포 ..."에 대해 당신이 무엇을 말하는지에 대해 부분적으로 생각하고 있었다. HT보다 견적이 얼마나 정확합니까?
chl

+1. 이것은 내가 당신의 스크립트를 사용하여 뛰어 들거나 주변을 바꾸고 다른 일을 시도함으로써 점근선을 배우고 있음을 상기시킵니다. 다시 시작해 주셔서 감사합니다 . 시작하는 데 매우 도움이되었습니다.
ars

@ars 사실, 나는이 그림이 PStricks로 만들어 졌다는 것을 기억하는 것 같다. 어쨌든 Asymptote의 좋은 출발점은 piprime.fr/asymptote 입니다.
chl

@chl, 이것은 주제에 맞지 않을 수 있지만 R로이 그래프를 만들 었는지 말해 주실 수 있습니까?
suncoolsu

7

두 번째 Q와 관련된 대안 접근법, "최소한 상황에서 통계 간격 사용자에게 의미있는 신뢰 구간을 보는 방법이 있습니까?":

베이지안 추론 과 그에 따른 믿을만한 간격을 살펴보아야 합니다 . 95 % 신뢰할 수있는 구간 실제 매개 변수 값을 포함 할 확률이 95 % 인 구간으로 해석 될 있습니다. 지불하는 가격 은 데이터 수집 하기 전에 실제 모수가 취할 것으로 생각되는 값에 사전 확률 분포를 적용 해야 한다는 것 입니다. 또한 귀하의 이전은 다른 사람의 이전과 다를 수 있으므로 동일한 데이터를 사용하는 경우에도 신뢰할 수있는 간격이 달라질 수 있습니다.

이것은 요약을위한 나의 빠르고도 단단한 시도입니다! 실용적인 초점을 맞춘 최근의 교과서는 다음과 같습니다.

Andrew Gelman, John B. Carlin, Hal S. Stern 및 Donald B. Rubin. "바이 예 데이터 분석"(제 2 판). Chapman & Hall / CRC, 2003. ISBN 978-1584883883


감사. 그러나 빈번한 신뢰 구간은 구체적으로 어떻습니까? 관련이있는 상황이 있습니까?
Jyotirmoy Bhattacharya

나는 당신이 당면한 상황에 대해 다른 지식을 가지고 있다면 다른 우선 순위를 갖는 것이 문제가 아니라고 생각합니다 (적어도 베이지안 관점에서봤을 때). 우리는 우선 순위 정보를 전송하는 방법으로 우선 순위를 보았습니다. 나는 그것이 간단하지 않다는 것을 알고있다.
teucer

@Jyotirmoy 베이지안 대 잦은 접근에 관한 흥미로운 점은 여기에있다 : stats.stackexchange.com/questions/1611/…
chl

6

나는이 질문의 전제가 불확실한 것과 알려진 것의 구별을 부정하기 때문에 결함이 있다고 생각한다 .

코인 플립을 설명하는 것은 좋은 비유를 제공합니다. 동전을 뒤집기 전에 결과는 불확실합니다. 그 후에는 더 이상 "가설 적"이 아닙니다. 우리가 이해하고자하는 실제 상황 (코인의 행동, 또는 결과의 결과로 내려진 결정) 을이 통념 과 혼동 하는 것은 본질적으로 세상을 이해하는 데있어 가능성의 역할을 부정합니다.

이러한 대조는 실험 또는 규제 분야에서 급격히 완화됩니다. 이러한 경우 과학자 또는 규제 기관은 사전에 결과를 알 수없는 상황에 직면하게 될 것이라는 것을 알고 있지만 실험 설계 방법이나 규정 준수 여부를 결정하는 데 사용할 기준과 같은 중요한 결정을 내려야합니다. (약물 테스트, 작업장 안전, 환경 표준 등). 이 사람들과 그들이 일하는 기관은 좋은 실험 설계 및 가능한 한 최소한의 실수를 저지른 공정한 결정 절차와 같이 최적의 방어 가능한 전략을 개발하기 위해 그러한 방법확률 적 특성에 대한 방법 과 지식이 필요 합니다.

신뢰 구간은 고전적으로 불충분 한 정당화에도 불구하고이 결정-이론적 틀에 적합하다. 둘 다 - 임의의 간격을 구성하는 방법은 간격의 최소 예상 범위를 보장하고 간격의 예상 길이를 최소화 좋은 특성의 조합이있는 경우 사전 등록이 아닌 사후 것들 - 후 이상 이 방법을 사용한 오랜 경력을 통해 해당 방법으로 표시되는 작업과 관련된 비용을 최소화 할 수 있습니다.


신뢰 구간을 사용하여 의사 결정을하는 예를 제공하십시오. 또는 두 가지 신뢰 구간과 빈번한 프레임 워크를 완전히 유지하면서 각각 다른 결정을 내리는 방법을 비교해보십시오.
BrainPermafrost

@Brain 모든 입문 통계 교재는 그러한 예를 제공 할 것입니다. 의심 할 여지없이 빈번한 사람 중 하나는 Freedman, Pisani 및 Purves, Statistics (모든 버전)입니다.
whuber

6

95 % 신뢰 구간은 예상 값을 포함 할 가능성이 95 % 일 수있는 개별 구간이 아니라 95 % 사례에서 작동 하는 방법 을 사용하여 발생하는 입니다.

"신뢰 한계의 논리적 근거와 해석은 지금도 논란의 대상이다." {David Colquhoun, 1971, 생물 통계에 관한 강의}

이 인용문은 1971 년에 출판 된 통계 교과서에서 발췌되었지만 2010 년에도 여전히 유효하다고 주장합니다. 이항 비율에 대한 신뢰 구간의 경우 논란이 가장 심각 할 것입니다. 그러한 신뢰 구간을 계산하기위한 많은 경쟁 방법들이 있지만, 그것들은 모두 하나 이상의 의미에서 부정확하며 심지어 최악의 방법조차 교과서 저자들 사이에서 지지자들을 가지고 있습니다. 소위 '정확한'구간조차도 신뢰 구간에 필요한 특성을 산출하지 못합니다.

존 루드 브룩 (John Ludbrook)과 나는 외과의를 위해 작성된 논문 (통계에 대한 관심으로 널리 알려져 있음)에서 다른 방법 (평균적으로 다른 방법만큼 좋은 빈도수의 특성을 가지기 때문에 균일 한 베이지안 (Bayesian)을 사용하여 계산 된 신뢰 구간의 일상적인 사용을 주장했다. 모든 실제 비율에 대해 정확히 95 % 적용 범위), 중요하게는 모든 관찰 된 비율에 대해 훨씬 더 나은 적용 범위 (정확히 95 % 적용 범위). 대상 독자로 인해이 논문은 굉장히 상세하지 않기 때문에 모든 통계학자를 설득 할 수는 없지만 전체 결과와 정당성을 갖춘 후속 논문을 작성 중입니다.

이것은 베이지안 접근 방식이 잦은 접근 방식만큼 자주 발생하는 잦은 속성을 갖는 경우입니다. 이전에 균일 한 가정을 가정하는 것은 문제가되지 않습니다. 인구 비율의 균일 한 분포가 제가 자주 겪는 빈번한 범위의 계산에 내장되어 있기 때문입니다.

"적어도 일부 상황에서는 통계 사용자에게 의미있는 신뢰 구간을 보는 방법이 있습니까?" 내 대답은 이항 신뢰 구간의 경우 모든 관측 된 비율에 대해 정확히 시간의 95 % 인 모집단 비율을 포함하는 구간을 얻을 수 있다는 것입니다. 그렇습니다. 그러나 기존의 신뢰 구간 사용은 모든 모집단 비율에 대한 적용 범위를 기대하며 그 대답은 "아니오"입니다.

귀하의 질문에 대한 답변의 길이와 이에 대한 다양한 답변은 신뢰 구간이 널리 잘못 이해되었음을 암시합니다. 목표를 모든 실제 매개 변수 값에 대한 적용 범위에서 모든 표본 값에 대한 실제 매개 변수 값의 적용 범위로 변경하면 간격이 측정 값의 성능보다는 관측 된 값과 직접 관련되도록 형성되므로 더 쉬워 질 수 있습니다. 방법 자체.


5

이것은 훌륭한 토론입니다. 나는 베이지안 믿을만한 간격과 가능성지지 간격이 갈 길이며, 베이지안 후 관심 사건의 확률 (예 : 약물이 효과적 임)을 느낀다. 그러나 신뢰 구간으로 P- 값을 대체하는 것이 큰 이득입니다. NEJM 및 JAMA와 같은 최고의 의학 저널의 거의 모든 이슈에는 초록에 "증거의 부재는 증거가 없다"라는 문제가있는 논문이 있습니다. 신뢰 구간을 사용하면 이러한 실수를 방지 할 수 있습니다. 훌륭한 작은 텍스트는 http://www.amazon.com/Statistics-Confidence-Intervals-Statistical-Guidelines/dp/0727913751 입니다 .


3

질문을 직접 해결하려면 : 곡물 상자에 일정량의 곡물을 채우는 기계를 사용한다고 가정 해보십시오. 분명히 상자를 너무 채우거나 채우지 않으려 고합니다. 기계의 신뢰성을 평가하려고합니다. 다음과 같이 일련의 테스트를 수행하십시오. (a) 기계를 사용하여 상자를 채우고 (b) 상자에 채워지는 곡물의 양을 측정하십시오.

수집 된 데이터를 사용하여 기계가 상자에 채울 수있는 곡물 양에 대한 신뢰 구간을 구성합니다. 이 신뢰 구간은 우리가 얻은 구간이 기계가 상자에 넣을 실제 양의 곡물을 포함 할 확률이 95 %임을 나타냅니다. 당신이 말했듯이, 신뢰 구간의 해석은 고려중인 방법에 의해 생성 된 가상의 보이지 않는 샘플에 의존합니다. 그러나 이것이 바로 우리가 원하는 맥락에서 이루어집니다. 위의 맥락에서 우리 기계를 반복적으로 사용하여 상자를 채울 것이므로 기계가 상자에 채우는 곡물의 양을 가상의 보이지 않는 실현에 관심을 기울입니다.

위의 맥락에서 벗어나기 위해 : 신뢰 구간은 우리가 조사중인 방법 (위의 방법 = 기계에서)을 반복적으로 사용 한다면 신뢰 구간이 진정한 매개 변수를 가질 확률이 95 % 임을 보증 합니다 .


2
μσ2μ

1
@Jyotirmoy 물론 특정 CI는 방해가 될 수 있습니다. 즉, CI에 실제 값이 포함되어 있지 않을 가능성이 5 %입니다. 그럼에도 불구하고 제가 준 해석은 CI가 실제로 구성되는 방식과 일치합니다. 우리는이 방법을 반복적으로 사용하여 CI가 실제 값을 포함 할 확률이 0.95가되도록 CI를 구성한다고 상상합니다. 내 대답은 실제 값이 실제로 존재할 확률에 대해 아무 말도하지 않습니다. 그러면 신뢰 구간이 아닌 신뢰할 수있는 간격으로 만 만들 수있는 진술입니다.

1
(100α)H0tz

@Srikant. 아마도 대답에서 "method = machine"을 오해했을 것입니다. 조립 라인에서 나오는 모든 상자의 95 %가 상자의 특정 샘플에서 파생 된 95 % 신뢰 구간 내에 가중치를 가할 것이라고 생각했습니다.
Jyotirmoy Bhattacharya
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.