신뢰 구간이 너무 넓어서 유용하지 않다고 생각하는 고객에게 할 말은 무엇입니까?


22

컨설턴트이고 신뢰 구간의 유용성을 고객에게 설명하고 싶다고 가정합니다. 내 고객은 내 간격이 너무 넓어서 유용하지 않으며 1/2을 사용하는 것을 선호한다고 말합니다.

어떻게 대답해야합니까?


15
더 많은 데이터를 수집하려면 청구하십시오.
shabbychef

2
이것은 통계 컨설팅에서 고객의 유형에 대한 필독서를 읽어 보게 합니다 .

@Procrastinator PDF 버전의 용지에 대한 링크를 게시 하시겠습니까?
assumednormal

1
@Max, JSTOR를 통해서만 사용 가능합니다. PDF를 게시하는 것은 ... 서비스의 JSTOR의 (매우 합리적인) 조항을 위반하는 것
벤 Bolker

@shabbychef-종종 샘플이 이미 큰 경우 정확도를 높이는 비효율적 인 방법입니다. 예를 들어, 일반 평균 ci의 ci 너비를 절반으로 줄이려면 표본 크기를 4 배로 늘려야합니다. 이동하기 전에 모델을 개선하는 데 시간을 투자하고 최대 비용을 4 배로 늘리십시오!
확률

답변:


16

"유용한"클라이언트의 의미에 따라 다릅니다. 간격을 임의로 좁히 겠다는 고객의 제안은 간격을 좁 히면 어떻게 든 오류의 여백을 마술처럼 줄였다는 오해를 반영하는 것 같습니다. 데이터 세트가 이미 수집되어 수정되었다고 가정하면 (이 경우에 해당하지 않는 경우 의견에 @shabbychef의 농담이 답변을 제공함) 고객에 대한 응답은 "무료 점심"이없는 이유를 강조하고 설명해야합니다. 당신 간격을 좁혀서 무언가를 희생하고 있습니다.

특히 데이터 세트가 고정되어 있으므로 신뢰 구간의 너비를 줄일 수있는 유일한 방법은 신뢰 수준을 낮추는 것입니다. 따라서보다 확실한 간격이 실제 매개 변수 값을 포함하고 있다고 확신 할 수있는 간격이 좁거나 간격이 좁을수록 선택할 수 있습니다. 즉, 신뢰 구간이 넓을수록 더 보수적입니다. 물론 폭 또는 신뢰 수준을 무의식적으로 최적화 할 수는 없습니다 . 전체 매개 변수 공간에 걸쳐 신뢰 구간을 생성 하여 무한히 좁은 신뢰 구간을 얻을 수 있기 때문에 100 % 신뢰 구간을 확실하게 생성 할 수 있기 때문입니다 ( 범위 는 0 % 임) . 100%0%

보수적 인 간격이 더 유용한 지 여부는 컨텍스트와 간격의 너비가 신뢰 수준의 함수에 따라 어떻게 달라지는 지에 따라 달라 지지만 훨씬 낮은 신뢰 수준을 사용하여 응용 프로그램을 구상하는 데 어려움을 겪고 있습니다. 더 좁은 간격이 바람직합니다. 또한 신뢰 구간이 너무나 보편적이되어 60 % 신뢰 구간을 사용하는 이유를 정당화하기가 어렵다는 점을 지적 할 가치 가 있습니다 . 95%60%


6
포기하지 않고 신뢰 구간을 간단히 줄일 수는 없지만 단측 검정과 양측 검정의 차이와 유사한 약간의 유연성이 있습니다. 또한 동일한 데이터의 더 나은 모델이 서로 다른 (그리고 아마도 더 작은) 신뢰 구간을 생성 할 수 있습니다.
Douglas Zare 2016 년

3
나는 당신이 마지막 부분을 조금 짧게 팔고 있다고 생각합니다. 95 % CI 의 편재 는 문화 현상입니다. 일부 상황에서는 다른 값이 일반적입니다 (예 : 플로팅시 오류 바는 종종 표준 오류 (예 : 68 % CI) 임). (+1, btw)
gung-복원 자 Monica

2
정신적으로이 답변은 좋지만 두 번째 단락이 너무 제한적이라고 생각합니다. 통계학자가이 당사자에게 제공하는 이점 중 하나 는 고객의 요구를보다 잘 충족시킬 수있는 대체 절차에 대한 지식입니다. 많은 경우 다른 CI 절차를 선택하여 CI 너비를 좁힐 수 있습니다. 이것은 더 많은 데이터를 수집하거나 (-1 ~ @shabbychef, 두려워합니다) 신뢰 수준을 낮추지 않아도됩니다. 실제로 어려운 부분은 절차가 선택된 CI를 해석 하는 것 입니다. 그렇기 때문에 데이터를 분석 (또는 수집)하기 전에이 대화를하고 싶습니다!
whuber

7
나는 이것이 실제로 유연하지 않기 때문에 잘 작동하지 않기 때문에 Macro에 반응하고 있습니다. 위험은 고객이 귀하의 조언을 무시하고 더 잘 모르는 사람으로부터 도움을 요청할 것입니다 (그러나 통계에 대한 충분한 전문 지식을 주장함). OP의 시나리오는 친숙하고 일반적인 시나리오입니다. 고객에게 정보를 제공하고 교육을 제공 할뿐만 아니라 대안을 제공 할 수있는 기회로 볼 수 있습니다 (장단점에 대한 솔직한 논의와 함께). "그렇습니다. CI를 더 작게 만들 수 있지만 여기에"아니오, 당신은 망쳤습니다. "라기보다는 그 결과가 있습니다.
whuber

2
더 효율적인 대안을 사용할 수있는 상황에서는 @whuber (+1)가 좋습니다 . 데이터를 수집 / 분석 하기 전에 통계 전문가와상의해야하는 또 다른 이유 입니다.
매크로

2

전적으로 고객이 신뢰 구간 을 사용 하려는 대상에 달려 있다고 제안합니다 .

  1. 일종의 보고서 / 출판 등 일반적으로 95 % CI가보고됩니다. 나는 고객이 당신의 전문 지식을 연기하는 경향이 있는지 아닌지에 따라 "통계적으로 정당화되지 않았다"고 말할 수있다. 그렇지 않은 경우 자신이 원하는 것에 대한 전문적인 편의에 대해 판단해야합니다.
  2. 내부 문서의 일종-나는 당신이 동의하지 않음을 분명히하고, 95 %가 아니기 때문에 독자가 현재보고있는 신뢰 구간 유형을 분명히합니다.
  3. 추정 불확실성의 척도로서 얼마나 많은 감도 분석을해야하는지 결정해야합니까? 나는 그들에게 95 % CI와 68 % CI로 표시된 전체 분포를 보여주는 그림을 제공하고 그것들을 가질 수 있도록했습니다.

나는 "그래서 더 큰 연구를 실행 해"가 내 입에서 가장 먼저 나오는 것을 막을 수 있다면 나 자신이 자랑 스럽다.


1
+1. (2)에서 작성한 의견은 아마도 (1)에서 설명한 상황과 관련이 있다고 생각합니다.
매크로

0

대부분의 사람들처럼 표준 편차를 사용하십시오. 사람들이 68 % CI에 익숙해지면 95 % CI가 무서울 수 있습니다.


4
이 경우 우리는 단지 개별 값의 변동성이 아닌 표본 평균의 정확성을 보여주는 데 관심이 있다는 것을 들었습니다. 특히 표준 편차 를 권장하는 이유는 무엇 입니까?
chl

Fisher는 원래 2 개의 표준 편차에 대한 근사값으로 95 % CI를 제안했습니다.
Patrick Caldon

1
@ 패트릭, 그것은 당신이 chl의 요점을 놓친 것 (그런 실수를하지 않은 잘못 표현 된 Fisher뿐만 아니라) 또는 "표준 오류 " 를 의도 한 곳에 "표준 편차"를 쓴 것처럼 들립니다 . 대부분의 CI는 표준 편차가 아니라 표준 오류를 기반으로합니다. 2 SD는 CI에 근접하지 않으며 그 반대도 마찬가지입니다.
whuber

물론 표준 오차는 평균의 표준 편차 일 뿐이므로 용어 일뿐입니다. 즉, CI가 표준 편차를 기반으로하지 않는다고 말하는 것은 실제로 사실이 아닙니다. 표본의 표준 편차를 기준으로하지 않고 평균의 표준 편차를 기준으로합니다.
Aaron-복직 자 Monica Monica

2
모든 견적이 수단 인 것은 아닙니다. 평균 이외의 추정치에 대한 표준 오차가 있으며 whuber가 제안한 추정치의 변동성에 기초하여 모수에 대한 신뢰 구간을 생성하는 데 사용되는 추정치의 표준 오차입니다.
마이클 R. 체 르닉

0

90 % 또는 95 %와 같은 특정 표준 수준에서 신뢰 구간을 제공합니다. 클라이언트는 간격이 너무 넓어서 유용하지 않은지 판단 할 수 있습니다. 그러나 물론 그것이 유용하게 만들기 위해 그것을 단축시킬 수 있다는 것을 의미하지는 않습니다. 표본 크기를 늘리면 표본 크기의 제곱근에 의해 대략적으로 줄어들 기 때문에 주어진 신뢰 수준에서 구간의 폭이 줄어들 것이라고 제안 할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.