좁은 신뢰 구간 — 높은 정확도?


18

신뢰 구간에 대한 두 가지 질문이 있습니다.

신뢰 구간이 좁다는 것은 해당 구간 내에서 관측 값을 얻을 가능성이 적다는 것을 의미하므로 정확도가 높습니다.

또한 95 % 신뢰 구간은 99 % 신뢰 구간보다 좁습니다.

99 % 신뢰 구간은 95 %보다 정확합니다.

누군가 정확성과 좁음의 차이를 이해하는 데 도움이되는 간단한 설명을 해줄 수 있습니까?


2
나는 당신이 " 그 간격 밖에서 관측을 얻을 가능성이 더 적다"는 것을 의미한다고 생각합니다 . 불행하게도, 신뢰 구간은 기술적, 통계적 문제로 인해 의미하는 바를 의미하지는 않지만 일반적으로 주어진 신뢰 수준에서 간격이 좁을수록 결과에 대한 불확실성이 줄어 듭니다. 이 사이트에는 신뢰 구간과 달리 신뢰 구간이 의미하는 바를 설명하는 스레드가 많이 있습니다. 우리는 심지어 예측 간격에 들어 가지 않습니다 ...
Wayne

@Wayne 왜 그 진술이 " 그 간격 에서 관측을 얻을 가능성이 더 적 습니까"가 아닌가? 좁은 구간의 유형 1 오류가 크므로 실제 귀무 가설 을 기각 할 가능성이 더 높습니다 . 즉, 내 실제 null 값이 해당 구간에 포함되어 있지 않습니다. 그래서, 그것은 나에게 a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that interval맞는 것 같습니다 . 내가 어디에서 실수를하는지 설명해 주시겠습니까?
사용자 31466

답변:


19

95 %는 실험에서 실제 효과에 대해 얼마나 확신하고 있는지에 대해 수치 적으로 언급되지 않았습니다. 아마도 "95 % 적용 범위 계산을 사용한 간격"이 더 정확한 이름 일 수 있음을 인식하고있을 것입니다. 구간에 실제 값이 포함되도록 결정하도록 선택할 수 있습니다. 95 %의 시간을 일관되게한다면 당신은 옳을 것입니다. 그러나 더 많은 정보가 없으면 특정 실험에 대한 가능성을 모릅니다.

Q1 : 첫 번째 쿼리는 두 가지를 모아서 용어를 잘못 사용합니다. 당신이 혼란스러워하는 것도 당연합니다. 신뢰 구간이 좁을수록 더 정확할 수 있지만 95 % 방법과 같은 방식으로 계산하면 모두 동일한 정확도를 갖습니다. 그들은 동일한 시간 비율로 실제 가치를 포착합니다.

또한 그 폭이 좁다 고해서 그 좁은 신뢰 구간 내에있는 표본을 발견 할 가능성이 적다는 것은 아닙니다. 좁은 신뢰 구간은 세 가지 방법 중 하나를 달성 할 수 있습니다. 데이터의 실험 방법 또는 특성은 분산이 매우 낮을 수 있습니다. 해수면의 수돗물 비점 주변의 신뢰 구간은 표본 크기에 관계없이 매우 작습니다. 사람들이 매우 다양하기 때문에 사람들의 평균 체중에 대한 신뢰 구간은 다소 클 수 있지만 더 많은 관측 값을 획득함으로써 그 신뢰 구간을 더 작게 만들 수 있습니다. 이 경우, 더 많은 표본을 수집하고 신뢰 구간을 좁힘으로써 실제 가치가 어디인지 확실하게 판단 할 수 있습니다. 그러면 신뢰 구간에서 개인을 만날 확률이 줄어 듭니다. (샘플 크기를 늘리면 어쨌든 내려가지만 끓는 물 케이스에 큰 샘플을 수집하지 않아도됩니다). 마지막으로 표본이 대표적이지 않기 때문에 좁을 수 있습니다. 이 경우 실제로는 실제 값을 포함하지 않는 구간의 5 % 중 하나를 가질 가능성이 높습니다. CI 너비와 관련하여 약간의 역설이며 문헌을 알고이 데이터가 일반적으로 얼마나 다양한 지 확인하여 확인해야합니다. 이 경우 실제로는 실제 값을 포함하지 않는 구간의 5 % 중 하나를 가질 가능성이 높습니다. CI 너비와 관련하여 약간의 역설이며 문헌을 알고이 데이터가 일반적으로 얼마나 다양한 지 확인하여 확인해야합니다. 이 경우 실제로는 실제 값을 포함하지 않는 구간의 5 % 중 하나를 가질 가능성이 높습니다. CI 너비와 관련하여 약간의 역설이며 문헌을 알고이 데이터가 일반적으로 얼마나 다양한 지 확인하여 확인해야합니다.

또한 신뢰 구간은 모집단의 실제 평균값을 추정하려는 것입니다. 그 지점을 알면 훨씬 더 정확하고 정확하며 추정 범위가 없습니다. 그러나 정확히 동일한 값으로 관찰 할 가능성은 특정 샘플 기반 CI에서 값을 찾는 것보다 훨씬 낮습니다.

Q2 : 99 % 신뢰 구간이 95 %보다 넓습니다. 따라서 실제 값을 포함 할 가능성이 높습니다. 위와 위의 정확성과 정확한 차이점을 확인하십시오. 변동성이 낮고 표본 크기가 클수록 신뢰 구간을 더 좁 히면 더 정확 해집니다. 99 % 계산을 사용하여 적용 범위를 늘리면 더 정확 해지며 실제 값이 범위 내에있을 가능성이 높습니다.


2
모집단의 평균 (= 추정하려는 값)의 변동성은 0입니다.
Nick Sabbe

10

주어진 데이터 세트에 대해, 신뢰 구간의 신뢰 수준을 높이면 더 큰 구간 (또는 적어도 더 작지 않은 ) 만 발생합니다. 그것은 정확성이나 정확성이 아니라 진정한 가치를 놓칠 때 얼마나 많은 위험을 감수 할 것인지에 관한 것입니다.

여러 데이터 세트에서 동일한 종류의 매개 변수에 대한 신뢰 구간을 비교하고 하나가 다른 것보다 작은 경우 더 작은 것이 더 정확 하다고 말할 수 있습니다. 나는에 대해 이야기하는 것을 선호 정밀 보다는 정확성 (볼이 상황에서 이 관련 Wikipedia 기사를 ).


"동일한 종류의 매개 변수"및 "여러 데이터 세트"란 무엇입니까? 문맹에 관한 설문 조사와 설문 조사는 1995 년, 1998 년과는 다른시기에 실시된다. 그런 다음 "불멸 률"이 동일한 종류의 매개 변수이며 1995, 1998 등의 데이터 세트가 여러 데이터 세트를 표시합니까?
사용자 31466

예를 들어, 일부 모집단의 평균에 대한 신뢰 구간 세트. 귀하의 예도 적합하다고 생각합니다.
Karl

3

우선, 주어진 신뢰 백분율 (예 : 95 %)에 대한 CI는 모든 실제적인 목적으로 (기술적으로는 정확하지는 않지만) 실제 값이 구간 내에 있음을 확신한다는 것을 의미합니다.

이 간격이 "좁음"인 경우 (이것은 상대적 방식으로 만 간주 될 수 있으므로 다음과 비교하기 위해 너비가 1 단위라고 함), 재생할 공간이 많지 않음을 의미합니다. 해당 간격을 선택하면 간격이 좁기 때문에 실제 값에 가까워지고 그 정도가 확실합니다 (95 %).

이 값을 상대적으로 넓은 95 % CI와 비교하십시오 (이전 예와 일치하기 위해 너비가 100 단위라고 가정). 여기서도 여전히 실제 값이이 간격 내에 있을지 95 % 확신하지만 그 사실을 알려주지는 않습니다 간격에는 상대적으로 많은 값이 있기 때문에 (1과 반대되는 요소 100 정도) 단순화를 무시하기 위해 순수 주의자들에게 다시 묻습니다.

일반적으로 95 % 만 필요할 때보 다 실제 값이 99 %라고 확신 할 때 더 큰 간격이 필요합니다 (참고 : 간격이 중첩되지 않은 경우에는 사실이 아닐 수 있음) ) 따라서 필요한 신뢰도가 높을수록 선택해야하는 간격이 넓어집니다.

반면에, 당신은 있습니다 높은 신뢰 구간에 더 확실한. 따라서 동일한 너비의 간격을 두 개주고 하나는 95 % CI이고 다른 하나는 99 % CI라고하면 99 % 하나를 선호하기를 바랍니다. 이런 의미에서 99 % CI가 더 정확합니다. 진실을 놓쳤다는 데는 의심의 여지가 없습니다.


감사! 그렇다면 빛보다 빠른 중성미자에 대한이 새로운 연구는 매우 작은 신뢰 구간을 가지고 있다고 말할 때 (이것은 좁다는 것을 의미합니다) 그렇다면 그것이 넓은 신뢰 구간이라면 정확할 가능성이 더 높다는 것을 의미합니까? (다른 모든 측면을 무시)
15 분 02 초에

10
닉, 네 말이 틀렸어 "기술적 인 문제"가 아닙니다. 정확하지 않습니다. 신뢰 구간은 반복 실험에서 발생하는 시간에 대한 설명으로, 실제 값의 95 %를 포함합니다. 주어진 값에서 실제 값이 주어진 범위 내에 있다는 확신에 대한 진술은 전혀 다릅니다. "자신감"에서 "that"과 괄호 숫자를 제거하면 진실에 더 가까워집니다. 당신은 그것이 진정한 가치가 그 간격에 빠질 것이라고 믿는다는 의미라고 말할 수 있습니다.
John

그렇지 않으면, 대답은 꽤 좋습니다 ...
John

4
@ 존 : 나는 구체적으로 간격 자체가 무작위 변수라는 말을 피했습니다. 그러나 내 문장이 그렇지 않다는 것을 암시하지는 않습니다 (확실히 말하면 제안합니다). 관련 문제를 알고 있지만 질문과 관련이없는 것으로 나타났습니다. 나는 그 차이가 중요한 실제 상황을 본 적이 없기 때문에 "모든 실제적인 목적을 위해".
Nick Sabbe

4
문제가 발생하지 않았습니까? 그것은 p-value = null의 확률을 말한 다음 결코 문제가 발생하지 않았다고 말하는 것과 같습니다. 당신이 올바른 저널에 머물 경우하지 않습니다. 실제 값이 현재 범위 내에 있다고 95 % 확신한다고 말하는 것은 잘못입니다. 그것을 난해한 문제로 취급한다는 것은 이제 적어도 한 명 이상의 사람이 "가치가이 범위 내에 있다고 95 % 확신합니다"라고 말합니다. 답을 수정하기 위해 거의 변경하지 않을 것입니다. 당신이 그 진술을 변경하면 당신이 스커트 다른 문제는 무시할 수 있습니다.
John

3

내가 여기에 공표 한 좋은 답변을 추가하고 있습니다. 나는 결론을 완전히 정리한다고 말해야 할 것이 조금 더 있다고 생각합니다. Efron에서 정의한대로 정확하고 정확한 용어를 좋아합니다. 나는 최근에 다른 질문에 대해 이것에 대해 긴 토론을했습니다. 보통 whuber는 그 대답을 정말로 좋아했습니다. 나는 그것을 반복하기 위해 동일한 lnegth로 가지 않을 것입니다. 그러나 Efron의 정확도는 신뢰 수준 및 구간의 너비 또는 견고성에 대한 정확성과 관련이 있습니다. 그러나 정확성을 먼저 고려하지 않고 견고성에 대해 이야기 할 수는 없습니다. 일부 신뢰 구간은 광고하는 실제 범위를 갖기 때문에 정확한 신뢰 구간입니다. 점근 분포를 사용하기 때문에 95 % 신뢰 구간도 근사 할 수 있습니다. 무증상을 기반으로 한 대략적인 간격은 유한 표본 크기에 대한 것으로, 점근 분포가 정확한 분포 일 경우 얻을 수있는 범위 인 광고 된 범위를 갖지 않습니다. 따라서 대략적인 간격이 잠복 될 수 있습니다 (즉, 실제 적용 범위가 91 % 일 때 95 %를 광고합니다). 전자의 경우 실제 적용 범위가 광고 된 적용 범위와 얼마나 가까운 지에 대해 걱정합니다). 근접도는 1 / √n 또는 1 / n이라고 할 수있는 정확도의 순서입니다. 실제 신뢰 수준이 가까우면 정확하다고합니다. 정확하지 않은 부트 스트랩 신뢰 구간에서는 정확도가 중요하지만 일부 변형은 다른 것보다 정확합니다.

정확도에 대한이 정의는 OP가 참조하는 것과 다를 수 있지만 이제 Efron의 정의가 무엇이고 왜 정확해야 하는지를 명확히해야합니다. 이제 두 가지 방법이 정확한 경우 신뢰 수준에 대해 예상 너비가 더 작은 경우 다른 방법을 선호 할 수 있습니다. 이런 의미에서 가장 좋은 신뢰 구간 (가장 짧아짐)이 선택하는 것입니다. 그러나 이것은 정확성이 필요했습니다. 신뢰 수준이 근사치 인 경우 사과와 오렌지를 비교할 수 있습니다. 정확도가 떨어지기 때문에 광고 범위보다 실제 범위가 낮기 때문에 하나가 다른 것보다 좁을 수 있습니다.

만약 두 개의 신뢰 구간이 매우 정확하거나 하나가 정확하고 다른 하나가 매우 정확한 경우 예상 너비를 비교해도 괜찮을 것입니다. 적어도 지금 우리는 단지 두 가지 종류의 사과를보고 있기 때문입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.