0과 1 사이 의 비율 를 출력하는 실험을 고려하십시오. 이 비율을 얻는 방법은이 맥락에서 관련이 없어야합니다. 이 질문의 이전 버전 에서 자세히 설명 되었지만 메타에 대한 토론 후에 명확성을 위해 제거되었습니다 .
이 실험은 번 반복되는 반면 은 작습니다 (약 3-10). 독립적이고 동일하게 분산 된 것으로 간주됩니다. 이로부터 평균 를 계산하여 평균을 추정 하지만 해당 신뢰 구간 을 계산하는 방법은 무엇입니까?n X i ¯ X [ U , V ]
신뢰 구간을 계산하기 위해 표준 접근법을 사용할 때 는 때때로 1보다 큽니다. 그러나 내 직감은 올바른 신뢰 구간입니다.
- ... 범위는 0과 1이어야합니다
- ... 을 증가 시키면 작아 질 것
- ... 표준 접근법을 사용하여 계산 된 순서와 거의 같습니다.
- ... 수학적으로 건전한 방법으로 계산됩니다.
이것들은 절대적인 요구 사항은 아니지만 적어도 내 직감이 왜 틀린지 이해하고 싶습니다.
기존 답변을 기반으로 계산
다음에서 기존 해답으로 인한 신뢰 구간은 \ {X_i \} = \ {0.985,0.986,0.935,0.890,0.999 \} 와 비교됩니다 .
표준 접근법 (일명 "학교 수학")
, 이므로 99 % 신뢰 구간은 입니다. 이것은 직관 1과 모순된다.
자르기 (댓글에서 @soakley가 제안 함)
표준 접근법을 사용하고 그 결과로 [0.865,1.000] 을 제공하기 만하면 됩니다. 그러나 우리는 그렇게 할 수 있습니까? 나는 아직 하한이 일정하게 유지된다고 확신하지 못한다 (-> 4).
로지스틱 회귀 모형 (@Rose Hartman이 제안)
변환 된 데이터 : 결과 , 그 변환 결과는 다시 . 분명히 6.90은 변환 된 데이터에 대한 특이 치이며 0.99는 변환되지 않은 데이터에 대한 것이 아니므로 신뢰 구간이 매우 큽니다. (-> 3.)[ 0.173 , 7.87 ] [ 0.543 , 0.999 ]
이항 비례 신뢰 구간 (@Tim에서 제안 함)
이 접근법은 꽤 좋아 보이지만 불행히도 실험에 적합하지 않습니다. @ZahavaKor가 제안한대로 결과를 결합하고 하나의 큰 반복 Bernoulli 실험으로 해석하면 다음과 같습니다.
5 * 1000 [ 0.9511 , 0.9657 ] X i 중 합계이다. 이것을 Adj에 먹이십시오. Wald 계산기는 제공합니다 . 하나의 가 해당 간격 내에 있지 않기 때문에 현실적으로 보이지 않습니다 ! (-> 3.)
부트 스트랩 (@soakley에서 제안)
함께 우리는 3125 가능한 순열이있다. 순열 의 중간 수단을 하면 됩니다. 더 큰 간격 (-> 3)을 기대하지만 그렇게 나쁘지 않습니다 . 그러나 구성 당 보다 크지 않습니다 . 따라서 작은 샘플의 경우 (-> 2) 을 늘리기 위해 축소하는 것보다 오히려 커집니다 . 이것은 적어도 위에서 주어진 샘플에서 일어나는 일입니다.3093[0.91,0.99][min(Xi),max(Xi)]n