95 % 신뢰 구간 (CI)이 95 %의 평균을 포함 할 가능성을 의미하지 않는 이유는 무엇입니까?


228

여기에서 다양한 관련 질문을 통해 "95 % 신뢰 구간"이라고하는 "95 %"부분은 샘플링과 CI 계산 절차를 여러 번 정확하게 복제해야한다면 따라서 계산 된 CI의 95 %에 모집단 평균이 포함됩니다. 또한이 정의가하는 합의 인 것 같습니다 그렇지 않다는평균이 CI 내 어딘가에있을 확률이 95 %라는 단일 95 % CI로부터 결론을 내릴 수 있습니다. 그러나 95 %의 CI가 모집단 평균을 포함하고 있고 실제로는 CI가 모집단을 포함하는지 여부와 관련하여 불확실성이 없어야한다고 생각하는 한 전자가 후자를 의미하지는 않습니다. 우리의 실제 사례가 CI를 포함 할 확률의 추정치로 상상 된 사례의 기본 요율 (95 %)을 사용하도록 강요합니까?

게시물이 "실제로 계산 된 CI에 모집단 평균이 포함되어 있거나 포함되어 있지 않으므로 확률이 1 또는 0"인 라인을 따라 주장하는 것을 보았습니다. 그러나 이것은 확률에 대한 이상한 정의를 의미하는 것으로 보입니다 알 수없는 상태 (예 : 친구가 공정한 동전을 뒤집고 결과를 숨기고 머리가 올 확률이 50 %라고 말하는 것을 허용하지 않습니다).

분명히 나는 ​​틀렸지 만 내 논리가 어긋난 곳을 보지 못했다 ...


4
"기회"란 기술적 인 빈번한 의미 또는 베이지안 주관적인 타당성 의미에서 "확률"을 의미합니까? 빈번한 의미에서, 무작위 실험의 사건 만이 확률을 갖는다. 순서 (CI에 포함 된 실제 평균?)를 결정하기 위해 3 개의 주어진 (고정 된) 숫자 (참 평균, 계산 된 CI 경계)를 보는 것은 무작위 실험이 아닙니다. 이것이 바로 "실제로 계산 된 CI가 모집단 평균을 포함하거나 포함하지 않으므로 확률이 1 또는 0"인 확률도 잘못된 이유입니다. 이 경우에 잦은 확률 모델은 적용되지 않습니다.
caracal

11
이론적 평균을 어떻게 다루는 지에 달려 있습니다. 임의 변수 인 경우 일정 간격에 속할 확률에 대해 말할 수 있습니다. 일정한 경우에는 할 수 없습니다. 그것은 가장 간단한 설명이며, 개인적 으로이 문제를 닫았습니다.
mpiktas

2
우연히, 나는 Thaddeus Tarpey로부터이 대화를 보았습니다 : 모든 모델이 맞습니다 ... 대부분 쓸모가 없습니다 . 그는 95 % 신뢰 구간에 (p. 81 ff.)가 포함될 확률에 대한 문제에 대해 논의했습니다 . μ
chl

3
@Nesp : CI에 (고정) 매개 변수가 포함되어있을 가능성이 크므로 "확률이 0 또는 1"이라는 문에 문제가 없다고 생각합니다. (이것은 확률에 대한 빈번한 해석에 실제로 의존 하지 않습니다 !). 또한 "알 수없는 상태"에 의존하지 않습니다. 이러한 설명은 특정 샘플을 기반으로 CI가 전달되는 상황을 정확하게 나타냅니다. 그러한 확률이 사소한 것임을 보여주는 것은 간단한 수학 연습입니다. 즉, 값을 취합니다 . {0,1}
추기경

3
@MikeLawrence는 3 년 동안 다음과 같이 95 % 신뢰 구간의 정의에 만족합니다. "모집단에서 반복적으로 표본을 추출하고 각 샘플 후 95 % 신뢰 구간을 계산하면 신뢰 구간의 95 %에 평균이 포함됩니다. ". 2012 년과 마찬가지로, 이것이 95 % 신뢰 구간에 95 %의 확률이 평균을 포함한다는 것을 의미하지는 않습니다. 이 질문을 한 이후에 신뢰 구간에 대한 이해가 어떻게 발전했는지 알고 싶습니다.
luciano 2016 년

답변:


107

문제의 일부는 확률의 빈번한 정의로 인해 특정 실험 결과에 사소한 확률이 적용되는 것이 아니라이 특정 실험이 표본으로 간주 될 수있는 가상의 실험 집단에만 적용된다는 것입니다. CI의 정의는 현재 인스턴스에서 수집 된 특정 데이터가 아니라이 (보통) 가상의 실험 집단에 대한 진술이기 때문에 혼란 스럽습니다. 따라서 문제의 일부는 확률의 정의 중 하나입니다. 확률이 95 % 인 특정 간격 내에있는 실제 값에 대한 아이디어는 빈번한 틀과 일치하지 않습니다.

이 문제의 또 다른 측면은 잦은 신뢰도 계산에 통계의 실제 가치를 제한하는 것과 관련된 특정 표본에 포함 된 모든 정보를 사용하지 않는다는 것입니다. 내 질문은 "베이지안 신뢰할 수있는 구간이 잦은 신뢰 구간보다 분명히 열등한 예가 있습니까?"에드윈 제인 즈 (Edwin Jaynes)의 논문에서 신뢰 구간과 신뢰할 수있는 구간의 차이를 실제로 강조한 훌륭한 사례가 있습니다. 이 논의와 특히 관련이있는 것은 실시 예 5인데, 이는 절단 된 지수 분포의 파라미터를 추정하기위한 신뢰할 수있는 구간과 신뢰 구간 사이의 차이 (산업 품질 관리 문제)를 논의한다. 그가 제시 한 예에서 , 모수의 실제 값이 적절하게 구성된 90 % 신뢰 구간에 있지 않다는 것을 확신 할 수있는 충분한 정보가 샘플에 있습니다 !

이것은 일부에게는 충격적인 것처럼 보일 수 있지만이 결과의 이유는 신뢰 구간과 신뢰할 수있는 구간이 서로 다른 두 가지 확률 해석 해석에서 두 가지 다른 질문에 대한 답변이기 때문입니다.

신뢰 구간은 요청에 대한 답변 입니다. "많은 횟수로 반복되는 실험 인스턴스의 % 에서 매개 변수의 실제 값을 묶는 구간을 지정하십시오 ." 신뢰할 수있는 구간은 요청에 대한 답변 입니다. " 실제로 관찰 한 특정 샘플에서 주어진 확률 p로 실제 값을 괄호로 묶는 구간을 지정하십시오. "후자의 요청에 응답하려면 먼저 다음 중 하나를 채택해야합니다. ) 데이터 생성 프로세스의 새로운 개념 또는 (b) 확률 자체 정의의 다른 개념. 100pp

특정 95 % 신뢰 구간이 평균을 포함 할 확률이 95 %임을 암시하지 않는 주된 이유는 신뢰 구간이 다른 질문에 대한 답변이므로 두 질문에 대한 답변이 발생할 때 올바른 답변 일뿐입니다. 같은 수치 솔루션이 있습니다.

요컨대, 신뢰와 신뢰 구간은 다른 관점에서 다른 질문에 대답합니다. 둘 다 유용하지만 실제로 질문하려는 질문에 올바른 간격을 선택해야합니다. 참값을 포함 할 확률이 95 % (앞) 인 해석을 허용하는 구간을 원할 경우 신뢰 구간이 아닌 신뢰할 수있는 구간 (및 그와 함께 승무원 개념화)을 선택하십시오. 하지 말아야 할 것은 해석에 사용 된 것과 다른 해석에서 확률에 대한 다른 정의를 채택하는 것입니다.

개선을 위해 @cardinal에게 감사합니다!

다음은 David MaKay의 훌륭한 저서 "정보 이론, 추론 및 학습 알고리즘" (464 페이지) 의 구체적인 예입니다 .

관심있는 모수를 와 데이터 D , 다음 분포 와 독립적 으로 점 한 점 x 1x 2 로하자.θDx1x2

p(x|θ)={1/2x=θ,1/2x=θ+1,0otherwise

경우 있다 (39) , 우리는 데이터 세트 보여야하는데 ( 39 , 39 ) , ( 39 , 40 ) , ( 40 , 39 )( 40 , 40 ) 모두 동일한 확률로 (1) / 4 . 신뢰 구간 고려θ39(39,39)(39,40)(40,39)(40,40)1/4

.[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)]

데이터 를 여러 번 다시 샘플링하면 이러한 방식으로 구성된 신뢰 구간에 시간의 실제 값 75 %가 포함 되므로 이는 확실히 75 % 신뢰 구간 입니다.D=(x1,x2)

이제 데이터 고려하십시오 . 이 경우 빈번주의 75 % 신뢰 구간은 [ 29 , 29 ] 입니다. 그러나 생성 프로세스의 모델이 정확하다고 가정하면 이 경우 θ 는 28 또는 29 일 수 있으며, 29가 28보다 가능성이 높다고 가정 할 이유가 없으므로 사후 확률은 p ( θ = 28 | D )입니다. = p ( θ = 29 | DD=(29,29)[29,29]θp(θ=28|D)=p(θ=29|D)=1/2. 따라서이 경우 빈도수 신뢰 구간은 실제 값 θ를 포함 할 확률이 50 % 일 뿐이므로 75 % 신뢰할 수있는 구간이 아닙니다.θ , 우리가 추론 할 수있는 주어진 이 특정 샘플에서를θ .

그렇습니다. 이것은 예의 예입니다. 그러나 신뢰 구간과 신뢰할 수있는 구간이 다르지 않은 경우, 고려 된 예에서 여전히 동일합니다.

주요 차이점은 신뢰 구간은 실험을 여러 번 반복하면 어떤 일이 일어날 지에 대한 진술이며, 신뢰할 수있는 구간은이 특정 샘플에서 추론 할 수있는 것에 대한 진술입니다.


8
신뢰 구간은 "실험이 여러 번 반복되는 경우 통계의 실제 값을 확률 p로 묶는 구간을 제공합니다"라는 질문에 대한 답변입니다. 신뢰할 수있는 구간은 "실제 값을 확률 p로 묶는 구간을줍니다"라는 질문에 대한 답변입니다. 우선, 확률에 대한 빈번한 해석에 관한 진술은 바람직한 것으로 남습니다. 아마도 문제는 그 문장에서 단어 확률 을 사용하는 것입니다. 둘째, 나는 믿을만한 간격 "정의"가 너무 단순하다는 것을 알았다.
추기경

7
... CI에 부여한 특성을 고려하면 약간 오도합니다. 관련 맥락에서 종결 문장은 같은 문제가 있습니다. 시간의 실제 값이 95 % 인 구간을 원하면 신뢰 구간이 아닌 신뢰할 수있는 구간을 선택하십시오. 구어체 사용은 "실제 값의 95 %를 포함합니다"는 다소 부정확하며 잘못된 인상을 남깁니다. 실제로, 나는 그러한 표현이 CI의 정의에 훨씬 가깝다 는 설득력있는 주장을 할 수있다 .
추기경

11
요청 :이 답변에 대한 평가자가 의견에 의견 / 이유를 표현하는 것이 도움이 될 것입니다. 이 질문은 대부분의 것보다 약간의 토론으로 이어질 가능성이 높지만 응답자에게 건설적인 피드백을 제공하는 것이 여전히 유용합니다. 이는 사이트의 전체 콘텐츠를 개선 할 수있는 가장 쉬운 방법 중 하나입니다. 건배.
추기경

9
디크 란, 그렇습니다. 그것은 내가 편집에서 조금 더 이끌어 내려고했던 것의 일부였습니다. 급진적 빈도주의 (나는 확실히 생각하는 하지 그게 내가의 CI는 보수적이다 ")로 도발을 기술 할 수 있습니다 디자인 의 간격 사전에 상관없이 내가 관찰하는 일이 어떤 특정 데이터, 매개 변수가 구간 95 %에서 캡처되지 않는다는 등을 '간단히 누군가가 내 랩에 일부 데이터를 던졌습니다. 해당 데이터에서 생성 한 간격에 실제 매개 변수가 포함되어있을 확률은 얼마입니까?' .
추기경

2
Dikran, 우리는 모두 다른 배경에서 왔으며 이해를 풍부하게합니다. 확률과 관련 개념과 관련하여 아마도 내가 상호 작용하는 즐거움을 누린 가장 훌륭한 사상가는 공식 통계 나 (수학적) 확률 배경이 없었을 것입니다. 그는 엔지니어였습니다.
추기경

28

잦은 통계에서 확률은 장기적인 사건에 관한 것입니다. 완료된 후 단일 이벤트에는 적용되지 않습니다. 그리고 실험의 실행과 CI의 계산은 바로 그러한 사건입니다.

숨겨진 동전이 머리가 될 확률과 비교하고 싶지만 그렇게 할 수는 없습니다. 당신은 그것을 아주 가까운 무언가와 관련시킬 수 있습니다. 게임에서 플립 "헤드"이후에 언급해야하는 규칙이 있다면 장기적으로 올바른 확률은 50 %이며 이는 유사합니다.

실험을 실행하고 데이터를 수집하면 동전의 실제 뒤집기와 비슷한 것이 있습니다. 실험의 과정은 그것이 발생하는 것을 뒤집기 동전의 과정처럼 μ또는 동전이 머리처럼 보이지 않거나 그렇지 않습니다. 동전을 볼 수 있든 없든 동전이 뒤집 히면 머리가 될 수도 있고 머리가 될 수도 있고 그렇지 않을 수도 있습니다. 이제 헤드를 호출한다고 가정하십시오. 그것이 CI를 계산하는 것입니다. 동전을 공개 할 수 없기 때문에 (실험과 유사하게 사라질 것입니다). 당신이 옳거나 틀리면 그게 맞습니다. 현재 상태가 다음 플립에서 머리가 올 확률과 관련이 있습니까, 아니면 그것이 무엇인지 예측할 수 있습니까? 아닙니다. 헤드가 생산되는 프로세스는 0.5의 확률로 생산할 수 있지만 이미 존재하는 헤드가 0.5의 가능성을 갖는 것은 아닙니다. CI를 계산하면 μ를 캡처 할 확률이 없습니다μ이미 동전을 뒤집어 놓았습니다.

알았어, 내가 충분히 고문 한 것 같아 중요한 점은 비유가 잘못되었다는 것입니다. 동전을 공개 할 수는 없습니다. 동전 (실험)에 대한 가정을 기반으로 머리 나 꼬리 만 부를 수 있습니다. 나중에 머리 나 꼬리에 올바른 베팅을하고 싶을 수도 있지만, 그 정보를 수집 할 수는 없습니다. 또한 가져 오기 값이 간격에 있음을 나타내는 것은 CI 프로 시저의 중요한 구성 요소입니다. 그렇지 않은 경우 CI가없는 것입니다 (또는 명시된 %의 CI가없는 것임).

아마도 CI를 혼동하게 만드는 것은 이름입니다. 포함하거나 포함하지 않는 값의 범위입니다 . 우리는 그것들에 μ가 포함되어 있다고 생각 하지만 그 확률은 그것을 개발 한 프로세스와 같지 않습니다. 95 % CI 이름의 95 % 부분은 프로세스에 관한 것입니다. 나중에 μ를 포함한다고 생각하는 범위를 계산할 수 있습니다μμμ 몇 가지 확률 수준에 있지만 다른 계산이 아닌 CI의를.

그것은의 지정과 같은 이름을 95 % CI 생각하는 것이 좋습니다 종류의 당신이 포함 그럴듯하게 생각하는 값의 범위의 측정 하고 그 타당성에서 95 %를 구분합니다. 우리는 이것을 제니퍼 CI라고 부르고 99 % CI는 웬디 CI입니다. 실제로 더 나을 수 있습니다. 그런 다음, 이후 우리는 우리가 믿는 것을 말할 수 μ는 값의 범위에있을 가능성이 아무도 우리가 촬영 한 웬디 확률이 있다는 말을 부착하지 얻을 것 μ를 . 다른 명칭을 원한다면 CI의 "신뢰도"부분을 자유롭게 제거해야한다고 생각합니다 (그러나 간격입니다).μμμ


충분히 공정하게 말하면이 답변은 괜찮은 것처럼 보이지만 공식적인 (수학적) 설명을보고 싶습니다. 공식적으로는 이벤트로 변환하는 것을 의미합니다. 나는 나의 요점을 설명 할 것이다. 나는 처음에 값 과 혼동되는 것을 기억한다 . 어딘가에서 나는 " p 값이 실제로 계산하는 것은 귀무 가설 H 0 이 참일 때 데이터의 확률입니다 "라고 읽었습니다 . 내가 베이 즈 정리와 함께이 관련 할 때, 모두가 지금은 모든 사람에게 그것을 설명 할 수있는 너무 많은 의미했다 (즉, 하나의 계산, 즉 P는 ( D | H 0 ) ). 그러나, 나는 그 확신 (아이러니하게도) 아니에요 ...H0(|H0)
네스토르

... (계속) 신뢰 구간 : 지식 측면에서 말한 것을 표현할 수있는 방법이 있습니까? freq. 통계. 하나는 보통 점 추정치를 몇몇 방법 (예를 들면, MLE)로. 작성하는 방법이 P ( L은 1 ( μ ) < μ < L 2 ( ^은 해요 U를 ) | D ) (예 베이지안 중앙 후부 구간과 함께 μ 은 "참 평균")의 함수로서 P ( L ' 1 < ˉ X - μ <μ^(1(μ^)<μ<2(^)|)μp ( D | H 0 ) 의 함수로 p ( H 0 | D ) 를표현할 수있을 때와 같이 L ' 2 ) = α (즉, 신뢰 구간의 α %가 실제로무엇입니까 ) ? 직관적으로 나는 항상 그것이 할 수 있다고 생각했지만 결코 그렇게 할 수는 없습니다. (1'<엑스¯μ<2')=αα(H0|)(|H0)
Néstor

때로는 댓글을 삭제할 수 있다는 단점이 있습니다. 이 경우 급격한 변화를 따라갈 수 없었습니다!
추기경

1
" 신뢰 구간을 계산하지 않으면 숨겨진 동전과 비슷한 것이 있고 동전이 50 % 확률로 머리를 가질 확률과 마찬가지로 mu를 포함 할 확률은 95 %입니다. "- 여기에 비유가 잘못되었습니다. "CI 계산"은 코인 공개와 일치하지 않으며 "Heads"또는 "Tails"호출에 해당합니다.이 시점에서 여전히 50-50 개의 기회가 있습니다. 코인을 공개하는 것은 모집단 값 보는 것에 해당하며 ,이 시점에서 코인 이 "호출 된"간격에 있는지에 대한 질문에 대답 할 수 있습니다. OP의 퍼즐은 남아 있습니다. μ
Glen_b

1
@ vonjd, 나는 그것에 대해 이해가되지 않는 것을 보지 못했습니다. 상대가 플러시하거나하지 않는 경우는 분명합니다. 전자의 경우 확률은 (사소한) 1이고 후자의 경우 0입니다. 결과적으로 확률이 .198이라고 말할 수는 없습니다. 완벽하게 이해됩니다. 손을 다루기 전에 플러시 될 가능성에 대해 이야기하는 것이 합리적입니다. 마찬가지로, 카드를 뽑기 전에 필요한 옷을 입을 확률에 대해 이야기하는 것이 합리적입니다. 카드를 받은 후에 는 그 카드가 어떤 것이 든 적합합니다.
gung

22

논쟁, 추론 및 논리에 대한 공식적이고 명백한 아이디어는 서양 전통 내에서 아리스토텔레스에서 시작되었습니다. 아리스토텔레스 (Aristotle)는이 주제들에 대해 몇 가지 다른 작품들 ( Topics ;-)을 포함하여)에 썼습니다 . 그러나 가장 기본적인 단일 원칙은 형이상학을 포함한 다양한 곳에서 찾을 수있는 모순의 법칙입니다제 IV 권, 3 장 & 4 장. 전형적인 공식은 "... 동일한 의미에서 [같은 의미로] 불가능하지 않다"는 것입니다 (1006 a 1). 그것의 중요성은 "이것은 자연스럽게 다른 모든 공리의 출발점이기도하다"(1005 b 30)라고 약간 일찍 언급되었다. 철학적으로 왁싱을 해줘서 용서해주십시오. 그러나이 질문은 본질적으로 편의를 위해 단순히 옆으로 밀 수없는 철학적 내용을 가지고 있습니다.

다음과 같은 생각을 해보십시오. Alex는 동전을 뒤집어 붙잡고 손을 위로 향하게하여 팔뚝으로 뒤집습니다. 밥은 올바른 위치에 서있었습니다. 그는 Alex의 손에 동전을 간단히 보았으므로 현재 어느 쪽이 향하고 있는지 추론 할 수 있습니다. 그러나 Carlos는 동전을 보지 못했습니다. 그는 올바른 위치에 있지 않았습니다. 이 시점에서 Alex는 동전이 머리를 보여줄 가능성이 무엇인지 묻습니다. Carlos는 헤드의 장기 주파수이므로 확률이 0.5라고 제안합니다. Bob은 동의하지 않으며 확률은 정확히 0에 지나지 않는다고 자신있게 주장합니다 .

이제 누가 옳습니까? 물론 밥이 잘못 보았을 수도 있고 틀릴 수도있다 (그가 잘못 보지 않았다고 가정하자). 그럼에도 불구하고, 당신은 둘 다 옳고 비 모순의 법칙을 유지할 수 없습니다. (나는 당신이 비 모순의 법칙을 믿지 않는다면, 그것들이 옳거나 그와 같은 다른 공식이라고 생각할 수 있다고 생각합니다.) 이제 비슷한 사례를 상상해보십시오. 그러나 밥이 없으면 카를로스의 제안이 될 수 있습니다. Bob이없는 사람이 동전을 보지 못했기 때문에 더 맞습니까 (eh?)? 비 모순의 법칙의 적용은이 경우에 분명하지 않지만, 중요해 보이는 상황의 일부가 전자에서 후자로 일정하게 유지되는 것이 분명하다고 생각합니다. 확률을 정의하려는 많은 시도가 있었고 앞으로도 여전히 더 많은 것이있을 수 있습니다. 그러나 누가 서있고 어디에 위치하는지에 대한 함수로서 확률의 정의는 거의 호소력이 없다. 여하튼 "구문"을 사용하여 추측신뢰 구간 "), 우리는 Frequentist 접근법 내에서 일하고 있으며, 그로 인해 동전의 실제 상태가 관련이 없음을 아는 사람이 있는지 여부는 임의의 변수가 아닙니다. 이는 실현 된 가치이며 머리를 보여 주거나 꼬리를 보여줍니다 .

@John이 지적했듯이, 동전 상태는 처음에 신뢰 구간이 실제 평균을 포함하는지에 대한 질문과 유사하지 않을 수 있습니다. 그러나 동전 대신에, 우리는 이것을 매개 변수 로 Bernoulli 분포에서 얻은 실현 된 값으로 추상적으로 이해할 수 있습니다 . 코인 상황에서 p = .5 이고 95 % CI의 경우 p = .95입니다 . 연결을 만들 때 알아야 할 중요한 것은 은유의 중요한 부분이 상황을 지배하는 p 가 아니라 뒤집힌 동전이나 계산 된 CI가 임의의 변수 가 아니라 실현 된 값이라는 것 입니다. =.5=.95

이 시점에서이 모든 것이 빈번주의 확률 개념 내에서 발생한다는 점에 주목하는 것이 중요합니다. 베이지안 관점은 비 모순의 법칙을 위반하지 않으며, 현실의 본질 (보다 구체적으로 확률)에 대한 다른 형이상학 적 가정으로부터 시작된다. CV의 다른 사람들은 내가 아닌 베이지안 관점에서 훨씬 더 정통하며 아마도 귀하의 질문에 대한 가정이 베이지안 접근법에 적용되지 않는 이유를 설명 할 수 있으며 실제로 평균의 95 % 확률이 있을 수 있습니다 95 % 신뢰할 수있는 거짓말이전에 사용 된 정확한 조건을 포함한 특정 조건 하의 간격 (아래 @DikranMarsupial의 설명 참조). 그러나, 나는 당신이 Frequentist 접근법 내에서 일하고 있다고 말하면, 특정 평균 95 % CI 내에 진정한 평균이 존재할 확률이 .95 일 수는 없다고 생각합니다.


5
베이지안 접근법에서는 실제 값이 95 % 신뢰할 수있는 간격에있을 가능성이 실제로 95 % 일 가능성은 없습니다. 통계의 가치에 대한 특정 사전 분포 (초기 지식 상태를 나타냄)를 제공 한 후 업데이트 된 지식 상태를 나타내는 사후 분포를 갖는 데이터를 관찰 한 경우, 우리는 진정한 가치가 있다고 95 % 확신합니다. 이것은 우리의 사전이 정확하고 가능성의 형태와 같은 다른 가정 일 경우에만 정확합니다.
Dikran Marsupial

@DikranMarsupial, 메모 주셔서 감사합니다. 약간 한입입니다. 귀하의 제안과 일치하도록 답변을 편집했지만 toto에 복사하지 않았습니다 . 추가 수정이 적절한 지 알려주세요.
gung

기본적으로 베이지안 접근 방식은 관심있는 매개 변수에 대한 지식 상태에 대한 진술로 가장 잘 해석되지만 (추천, 학습 중입니다 .o) 모든 가정이 정확하지 않으면 지식 상태가 정확하다는 것을 보증하지 않습니다. . 나는 철학적 토론을 즐겼으며, 다음 번에는 모순을 논의 할 때 비 모순의 법칙을 기억해야한다. o)
Dikran Marsupial

12

95 % CI가 평균을 포함 할 확률이 95 %를 의미하지 않는 이유는 무엇입니까?

이 질문과 주어진 답변의 대부분에는 많은 문제가 설명되어 있습니다. 나는 그들 중 두 명에만 국한 할 것이다.

에이. 인구는 무엇입니까? 진정한 인구가 존재합니까?

모집단 평균의 개념은 모델에 따라 다릅니다. 모든 모형이 잘못되었지만 일부 모형이 유용하기 때문에이 모집단 평균은 유용한 해석을 제공하기 위해 정의 된 허구입니다. 소설은 확률 모델로 시작합니다.

확률 모델은 삼중 항 으로 정의되며 , 여기서 X 는 표본 공간 (빈 공간이 아님), F

(X,F,P),
XF 의 부분 집합 계열 , PF에 대해 잘 정의 된 확률 측정입니다. (데이터 동작을 제어합니다). 일반성을 잃지 않고 개별 사례 만 고려하십시오. 모집단 평균은 μ = x X x P ( X = x ) 로 정의됩니다 . 즉, P 아래의 중심 경향을 나타냅니다XPF
μ=xXxP(X=x),
P또한 모든 x X 의 무게 가 P ( X = x )로 주어진 의 모든 지점의 질량 중심으로 해석 될 수 있습니다 .XxXP(X=x)

확률 이론에서 측정 값 는 알려진 것으로 간주되므로 모집단 평균은 위의 간단한 연산을 통해 액세스 할 수 있습니다. 그러나 실제로 확률 P 는 거의 알려져 있지 않습니다. 확률 P가 없으면 데이터의 확률 적 행동을 설명 할 수 없습니다. 데이터 거동을 설명하기 위해 정확한 확률 P 를 설정할 수 없으므로 데이터 거동을 지배 (또는 설명) 할 수있는 확률 측정 값이 포함 된 패밀리 M 을 설정합니다 . 그런 다음 고전적인 통계 모델이 나타납니다 ( X , F , M ) . 위의 모델은 Θ 가 존재하면 파라 메트릭 모델이라고합니다PPPPM

(X,F,M).
P<되도록 M{ P의 θ :θΘ}. 이 게시물에서 파라 메트릭 모델 만 고려해 봅시다.ΘRpp<M{Pθ: θΘ}

각 확률 측정 값 에 대해 각각의 평균 정의 μ θ = x X가 있습니다.PθM 즉, M 의 정의에 밀접하게 의존하는 집단 평균 { μ θ : θ Θ } 이있다. 가족 M

μθ=xXxPθ(X=x).
{μθ: θΘ}MM제한된 사람에 의해 정의되므로 데이터 동작을 제어하는 ​​실제 확률 측정 값을 포함하지 않을 수 있습니다. 실제로, 선택된 가족은 실제 측정 값을 거의 포함하지 않으며,이 실제 측정 값은 존재하지 않을 수도 있습니다. 모집단 평균의 개념은 의 확률 측정 값에 따라 다르 므로 모집단 평균은 모형에 따라 다릅니다.M

베이지안 접근법은 의 하위 집합에 대한 사전 확률 (또는 Θ )을 고려하지만이 게시물에서는 고전 버전에만 집중할 것입니다.MΘ

비. 신뢰 구간의 정의와 목적은 무엇입니까?

앞서 언급했듯이 모집단 평균은 모델에 따라 다르며 유용한 해석을 제공합니다. 그러나 통계 모델은 확률 측정 패밀리 (각 확률 측정에서 모집단 평균을 생성 함)로 정의되므로 모집단 평균 패밀리가 있습니다. 따라서, 실험에 기초하여, 모집단 수단의 좋은 후보를 포함하는 작은 세트 (간격)를 추정하기 위해 추론 절차를 사용해야한다. 잘 알려진 절차 중 하나는 ( ) 1 - α 이고 inf θ Θ P θ ( C α ( X ) μ θ ) = 1 - α ) 신뢰 영역이며,모든 θ Θ , P θ ( C α ( X ) θ 에 대해 세트 C α로 정의됩니다.1αCαθΘθ )

Pθ(Cα(X)μθ)1α   and   infθΘPθ(Cα(X)μθ)=1α,
여기서 (Schervish, 1995 참조). 이것은 매우 일반적인 정의이며 사실상 모든 유형의 신뢰 구간을 포함합니다. 여기에서 P θ ( C α ( XPθ(Cα(X)=)=0Pθ(Cα(X)μθ) 확률 이 포함 μ를 θ을 측정 값에 따라 P의 θ는 . 이 확률은 항상 1 - α 보다 크거나 같아야 하며, 최악의 경우 평등이 발생합니다.Cα(X)μθPθ1α

비고 : 독자들은 현실 상태에 대한 가정을 할 필요가 없으며, 신뢰 영역은 "참"평균을 참조하지 않고 잘 정의 된 통계 모델에 대해 정의됩니다. "진정한"확률 측정 값이 존재하지 않거나 없는 경우에도 가정은 실제 상태가 아닌 통계 모델링에 대한 것이므로 신뢰 영역 정의가 작동합니다.M

Cα(X)Cα(X)μθ(1α)θΘ

xCα(x)Cα(x)μθθΘ

xCα(x)(1α)100%μθθΘ

추신 : 의견, 리뷰, 비평 또는 이의 제기를 내 게시물에 초대합니다. 그것에 대해 자세히 논의 해 봅시다. 저는 영어를 모국어로 사용하지 않기 때문에 오타와 문법 오류가 포함되어 있습니다.

참고:

Schervish, M. (1995), 통계 이론, 제 2 판, Springer.


누구든지 토론하고 싶습니까?
Alexandre Patriota

4
토론은 대화에서 발생할 수 있지만 기본 사이트에서는 부적절합니다. 우리의 참조하시기 바랍니다 도움말 센터를 이 작동하는 방법에 대한 자세한 내용은. 그동안 나는 당신의 게시물의 형식에 의아해합니다. 거의 모든 것이 인용 형식으로되어 있습니다. 출판 된 일부 출처에서이 자료를 추출 했습니까? 아니면이 답변에 맞게 새로 작성된 자료입니까? 후자 인 경우 견적을 제거하십시오!
whuber

2
(+1). 매우 명확한 시놉시스에 감사드립니다. 우리 사이트에 오신 것을 환영합니다!
whuber

11

"우연성 원칙"의 두 번째 장에 설명 된 본질적으로 쓸모없는 75 % 신뢰 구간에 대한 Berger의 사례를 아무도 보여주지 않은 것에 놀랐습니다. 자세한 내용은 원본 텍스트 ( Project Euclid에서 무료제공됨)에서 확인할 수 있습니다 .이 예에서 필수적인 것은 명확하게 알 수없는 매개 변수의 값을 확실하게 알고있는 상황을 설명하는 것 입니다. 데이터를 관찰하지만 구간에 실제 값이 포함되어 있다고 75 % 확신 할 수 있다고 주장합니다 . 이 예제의 세부 사항을 살펴보면 신뢰 구간을 구성하는 전체 논리를 이해할 수있었습니다.


8
잦은 설정에서는 먼저 CI와 관련하여 "간격에 실제 값이 포함되어 있다고 75 % 확신한다고 주장 하지 않습니다 ". 여기에 문제의 핵심이 있습니다. :)
추기경

1
해당 예에 대한 직접 링크 / 페이지 참조를 제공 할 수 있습니까? 장을 검색했지만 올바른 예를 찾을 수 없습니다.
Ronald

@Ronald : 2 장의 첫 페이지에있는 첫 번째입니다. 직접 링크는 추가 할 수 있습니다.
추기경

1
요청대로 링크하십시오. 아. 넵. 이 예에서는 분명해 보입니다. 실험을하면 결과 신뢰 구간 에 평균 포함될 확률이 75 % 입니다. 실험을 마치고 실험 방법을 알게되면 결과 샘플의 분포에 따라 확률이 다를 수 있습니다.
Ronald

7

이 질문을 새로운 질문으로해야하는지 모르겠지만 생각 실험을 제안하여 위에서 언급 한 것과 동일한 질문을 해결합니다.

먼저, 표준 데크에서 무작위로 게임 카드를 선택하면 클럽을 선택하지 않은 확률은 13/52 = 25 %라고 가정합니다.

두 번째로, 실험을 여러 번 반복한다는 점에서 95 % 신뢰 구간을 해석해야한다고 계산되었으며, 계산 된 구간에는 실제 평균 95 %의 시간이 포함됩니다. 제임스 워터스가이를 설득력있게 입증했다고 생각합니다. 시뮬레이션. 대부분의 사람들은 95 % CI에 대한이 해석을 받아들이는 것 같습니다.

이제, 생각 실험을 위해. 성인 남성 또는 여성의 키가 큰 인구 집단에 정규 분포 변수가 있다고 가정 해 봅시다. 모집단에서 주어진 표본 크기의 여러 표본 추출 프로세스를 수행하고 각 표본에 대한 표본 평균 및 95 % 신뢰 구간을 계산하는 기꺼이 지칠 줄 모르는 조수가 있습니다. 내 조수는 매우 예리하고 인구에서 가능한 모든 샘플을 측정합니다. 그런 다음 각 표본에 대해 내 보조자는 결과 신뢰 구간을 녹색 (CI에 실제 평균이 포함 된 경우) 또는 빨간색 (CI에 실제 평균이 포함되지 않은 경우)으로 기록합니다. 불행히도 조수가 그의 실험 결과를 보여주지 않을 것입니다. 인구의 성인 키에 대한 정보가 필요하지만 시간이 있습니다. 실험을 한 번하는 데 필요한 자원과 인내심. 내 보조자가 사용하는 것과 동일한 표본 크기의 단일 임의 표본을 만들고 동일한 방정식을 사용하여 신뢰 구간을 계산합니다.

조수의 결과를 볼 방법이 없습니다. 내가 선택한 임의의 샘플이 녹색 CI를 생성 할 확률은 얼마입니까 (즉, 구간에 실제 평균이 포함되어 있음)?

내 마음에 이것은 이전에 설명한 카드 덱 상황과 동일하며 계산 된 간격에 실제 평균이 포함되어있을 가능성이 95 % 일 가능성이있는 것으로 해석 될 수 있습니다 (예 : 녹색). 그럼에도 불구하고 95 % 신뢰 구간은 구간에 실제 평균이 포함될 확률이 95 % 인 것으로 해석 할 수없는 것으로 보입니다. 위의 생각 실험에서 나의 추론이 왜 그리고 어디에서 멀어 집니까?


+1 이것은 정상적인 모집단에서 이진 표본 추출 상황으로의 개념적 진행에 대한 명백한 설명입니다. 우리와 공유해 주셔서 감사합니다. 저희 사이트에 오신 것을 환영합니다!
whuber

질문으로 게시하십시오.
John

의견 감사합니다, 존 이제 별도의 질문으로 게시했습니다 ( stats.stackexchange.com/questions/301478/… ).
user1718097

4

θ(엑스1,엑스2,,엑스)100%

((엑스1,엑스2,,엑스)<θ<에프(엑스1,엑스2,,엑스))=

θ(엑스1,엑스2,,엑스)에프(엑스1,엑스2,,엑스)((엑스1,엑스2,,엑스),에프(엑스1,엑스2,,엑스))

따라서 구간에 포함 된 모수의 확률에 대한 정보를 제공하는 대신 임의의 변수로 구간을 구성하므로 모수를 포함하는 구간의 확률에 대한 정보를 제공합니다.


3

실질적인 목적으로, 95 % CI가 친구의 코인 플립에 50:50 확률로 베팅하는 것보다 95 : 5 확률에 실제 평균을 포함했다는 것이 더 이상 잘못이 아닙니다.

친구가 이미 동전을 뒤집어 놓고 50 % 확률 이 있다고 생각하는 경우 하면 확률이라는 단어의 다른 정의를 사용하고 있습니다. 다른 사람들이 말했듯이, 잦은 주의자들에게는 사건이 발생한 사건에 확률을 할당 할 수 없지만 주어진 프로세스를 사용하여 미래에 사건이 일어날 확률을 설명 할 수 있습니다.

다른 블로그에서 : 잦은 주의자는 다음과 같이 말합니다. "특정 이벤트는 확률을 가질 수 없습니다. 동전에는 머리 나 꼬리가 표시됩니다. 동전을 보여주지 않으면 사실이 무엇인지 말할 수 없습니다. 당신이 토스의 초기 조건을 충분히 강하게 변화 시킨다면, 많은 토스에서 헤드의 상대 주파수는 0.5 "에 가까울 것으로 예상됩니다. http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability


2
그 블로그는 짚맨 논쟁처럼 들린다. 확률 모델을 생성하는 능력에 어떤 종류의 (존재하지 않는) 본질적 한계가있는 확률 철학을 혼동하는 것으로 보입니다. 나는 그 특성화에서 고전 통계 절차 나 방법론의 어떤 형태도 인식하지 못한다. 그럼에도 불구하고, 나는 당신의 최종 결론이 좋은 것이라고 생각합니다. 그러나 CI 가 내기가 아니라 CI 와 관련이 있다는 것을 명확하게 밝히지 않으면 서 사용하는 언어 는이 질문이 다루어야 할 혼란의 형태를 만들 위험이 있습니다.
whuber

1
제가 자주 사용하는 방법 중 하나는 CI가 절차의 결과라는 것을 강조하는 것입니다. 최종 진술에 대해 내가 좋아하는 것은 "95 : 5 확률로 95 % 신뢰 구간이 실제 평균을 포함했다는 것보다 더 이상 잘못된 것은 아닙니다. 친구의 동전 던지기에 50:50 확률로 베팅합니다. "
whuber

알았어.
nigelhenry

2

보유한 특정 데이터 세트에서 계산 한 CI가 평균을 포함하지 않는 가능한 CI의 5 % 중 하나라고 가정하십시오. 당신이 그것을 상상하고 싶은 95 % 신뢰할 수있는 간격에 얼마나 가깝습니까? (즉, 95 %의 확률로 평균을 포함하는 것이 얼마나 가까운가?) 당신은 그것이 거의 근접하다는 확신이 없습니다. 실제로 CI는 실제로 평균을 포함하는 95 % CI의 95 % CI 중 하나와 겹치지 않을 수도 있습니다. 평균 자체를 포함하지 않는다는 것은 말할 것도없고 95 % 신뢰할만한 간격이 아니라는 것을 암시합니다.

이를 무시하고 CI가 평균을 포함하는 95 % 중 하나라고 낙관적으로 가정 할 수 있습니다. 자, CI가 95 %라는 것을 감안할 때 CI에 대해 무엇을 알고 있습니까? 그것은 평균을 포함하지만 평균의 반대편에있는 다른 모든 것을 제외하고 극단적으로 나갈 수 있습니다. 분포의 95 %를 포함하지 않을 것입니다.

어느 쪽이든, 95 % CI가 95 % 신뢰할 수있는 간격이라는 합리적인 희망은 없습니다.


첫 번째 단락이 궁금합니다. 어쩌면 나는 그것을 오해하고 있지만, CI와 신뢰할 수있는 간격이 가능한 모든 관측 세트 와 일치 하는 여러 가지 예가 있다는 사실과 논쟁이 약간 상충됩니다 . 내가 무엇을 놓쳤습니까?
추기경

@ 추기경 : 잘못되었을 수 있습니다. 나는 일반적인 경우를 이야기하고 있었지만 CI와 신뢰할 수있는 간격이 동일한 경우 CI가 너무 멀리 떨어져 있지 않도록하는 정규성과 같은 다른 제한 사항이 있다고 생각합니다.
Wayne

나는이 단락의 마지막 문장에 가장 집중했다. 일치 간격의 예는 점을 강조하기위한 것입니다. 당신은 당신이 그 문장을 진정으로 믿을 것인지 아닌지를 고려할 수 있습니다. :)
추기경

당신은 95 % CI가 5 % 않는다는 것을 의미하지 않는다는 것을 의미합니까 하지 평균 포함되어 있습니까? "정의에 따르면 평균 자체를 포함 할 필요조차 없다"고 말해야합니까? 아니면 더 많은 것을 놓치고 있습니까?
웨인

Wayne, 특정 구간에 평균이 포함되어 있지 않다는 사실이 유효한 구간이되는 것을 어떻게 방해합니까? 이 말을 잘못 읽고 있습니까?
추기경

2

(즉, 친구가 공정한 동전을 뒤집고 결과를 숨기고 50 %의 확률로 머리가 나올 수는 없습니다)

친구가 동전 50 % 머리 / 꼬리로 뒤집는 것을 추측하면 제대로하지 않습니다.

  • 동전이 착륙 한 후 그리고 결과가 숨겨지기 전에 동전을 빨리 보도록 노력해야합니다.
  • 또한 동전의 공정성에 대한 사전 추정치를 미리 작성해야합니다.

동전 던지기에 대한 추측의 신뢰성은 이러한 조건에 달려 있으며 항상 같은 50 %는 아닙니다 (때때로 부정 행위 방법이 더 효과적 일 수 있음).

만약 당신이 속임수를 쓴다면, 전체 시간의 x> 50 % 일 것이라고 생각할 수 있지만, 반드시 모든 특정 투척의 확률이 항상 x %의 머리라는 것을 의미하지는 않습니다. 따라서 특정 던지기 확률에 대한 전체 확률을 투영하는 것은 약간 이상합니다. 다른 '확률 유형'입니다.


그것은 당신이 지정 / 정의하는 수준이나 깊이에 관한 것입니다. '확률' 입니다.

  • 자신감은 '특정 실험 / 플립의 특정 확률' 과는 독립적이며 '선험적 확률' 과는 독립적입니다 .

  • 자신감은 실험앙상블에 관한 것 입니다 . 모집단의 사전 확률 또는 분포를 알 필요가 없도록 구성됩니다.

  • 자신감은 추정치 전체적인 '실패율'에 관한 것이지만, 특정한 경우에 대해보다 정확한 확률 변동 을 지정할 수 있습니다 .

    ( 이 확률의 차이는 적어도 암시 적으로 존재합니다. 이론적으로 하며 우리는 그것들의 존재를 알 필요가 없습니다. 그러나 베이지안 접근법을 사용하여 이러한 확률을 명시 적으로 표현할 수 있습니다).


예 1 :

매우 드문 질환을 검사한다고 가정하십시오. 높은 인 Bernoulli 시험 (양수 또는 음수)으로 보일 수있는 테스트를 수행합니다.=0.99=0.01 아프지 않은 경우 .

0.05100.95 합니다.

환자의 1 %가 아프면 평균적으로 양성 검사의 1.98 %를 얻습니다 (99 % 건강한 사람의 검사에서 1 %, 1 % 아픈 사람의 검사에서 99 %가 양성). 이것은 양성 테스트를받을 때 95 % CI 간격 (조건부) 을 만들어 시간의 50 % 만 수정합니다.

예 2 :

사람들에게 300 개의 IQ 질문을 수행한다고 가정 해보십시오. 순진한 신뢰 구간과 빈번한 관점에서 각 사람 있다고 가정 할 수 있습니다나는(μ나는,σ나는2)μ나는

이것은 평균에 대한 회귀의 영향이 있고 모든 사람의 IQ 대한 선험적 확률 된다는 것을 무시합니다.μ나는(100,15) . 그런 다음 결과가 낮거나 높은 극단적 인 경우 측정 / 테스트를 기반으로 95 % 신뢰 구간에서 사람의 IQ 확률이 낮아집니다. 보다 습니다.

(100에 가까운 결과를 가진 사람들에게는 그 반대이며, 그들의 IQ는 아마도 95 % -CI 내에서 95 %보다 높을 것입니다. 사례의 95 %)


2

먼저 신뢰 구간 또는 1보다 큰 차원 공간에서 신뢰 구간을 정의 해 보겠습니다. 이 정의는 Jerzy Neyman이 1937 년에 왕립 학회에 제출 한 간결한 버전입니다.

에스에이(,α)아르 자형영형(에스에이(,α)|=,나는)=αα나는에스=에스(에스,α)={|에스에이(,α)} .

α 은 샘플 공간 확률 영역이 통계를 포함하는 값일 뿐이다.

[(에스,α)]아르 자형영형(에스=에스|=,나는)에스=[에스에이(,α)]아르 자형영형(에스=에스|=,나는)에스=α

[(에스,α)]α 기대치가 확률이 아니기 때문에 에 은 아닙니다!

에스=에스

아르 자형영형((에스,α)|에스=에스,나는)=(에스,α)아르 자형영형(에스=에스|=,나는)아르 자형영형(=|나는)아르 자형영형(에스=에스|=,나는)아르 자형영형(=|나는)

이 확률은 α나는에이(,α)에스

아르 자형영형((에스,α)|에스=에스,나는)=(에스,α)아르 자형영형(에스=|=에스,나는)아르 자형영형(에스=|=에스,나는)=아르 자형영형(에스(에스,α)|=에스,나는)=아르 자형영형(에스에이(에스,α)|=에스,나는)

에스에이(에스,α)에스에이(에스,α)

아르 자형영형((에스,α)|에스=에스,나는)=아르 자형영형(에스에이(에스,α)|=에스,나는)=α

정규 통계량에 대해 구성된 표준 신뢰 구간을 사용하여 모집단 평균을 추정하는 교과서 예는 위의 가정의 특수한 경우입니다. 따라서 표준 95 % 신뢰 구간 에는 확률 0.95의 평균 포함됩니다. 그러나이 서신은 일반적으로 유지되지 않습니다.


-1

여기에 흥미로운 답변이 있지만 R을 사용하여 약간의 실습을 추가한다고 생각했습니다. 최근에 통계 코드에서이 코드를 사용하여 신뢰 구간의 작동 방식을 강조했습니다. 코드의 기능은 다음과 같습니다.

1-알려진 분포에서 표본 추출 (n = 1000)

2-각 표본의 평균에 대한 95 % CI를 계산합니다.

3-각 표본의 CI에 실제 평균이 포함되어 있는지 묻습니다.

4-콘솔에서 실제 평균을 포함한 CI 비율을보고합니다.

방금 스크립트를 여러 번 실행했으며 실제로 CI의 94 % 미만이 실제 평균을 포함한다는 것을 발견하는 것은 드문 일이 아닙니다. 적어도 나에게 이것은 신뢰 구간에 95 % 확률이 참 모수를 포함 할 것이라는 생각을 없애는 데 도움이됩니다.

#   In the following code, we simulate the process of
#   sampling from a distribution and calculating
#   a confidence interval for the mean of that 
#   distribution.  How often do the confidence
#   intervals actually include the mean? Let's see!
#
#   You can change the number of replicates in the
#   first line to change the number of times the 
#   loop is run (and the number of confidence intervals
#   that you simulate).
#
#   The results from each simulation are saved to a
#   data frame.  In the data frame, each row represents
#   the results from one simulation or replicate of the 
#   loop.  There are three columns in the data frame, 
#   one which lists the lower confidence limits, one with
#   the higher confidence limits, and a third column, which
#   I called "Valid" which is either TRUE or FALSE
#   depending on whether or not that simulated confidence
#   interval includes the true mean of the distribution.
#
#   To see the results of the simulation, run the whole
#   code at once, from "start" to "finish" and look in the
#   console to find the answer to the question.    

#   "start"

replicates <- 1000

conf.int.low <- rep(NA, replicates)
conf.int.high <- rep(NA, replicates)
conf.int.check <- rep(NA, replicates)

for (i in 1:replicates) {

        n <- 10
        mu <- 70
        variance <- 25
        sigma <- sqrt(variance)
        sample <- rnorm(n, mu, sigma)
        se.mean <- sigma/sqrt(n)
        sample.avg <- mean(sample)
        prob <- 0.95
        alpha <- 1-prob
        q.alpha <- qnorm(1-alpha/2)
        low.95 <- sample.avg - q.alpha*se.mean
        high.95 <- sample.avg + q.alpha*se.mean

        conf.int.low[i] <- low.95
        conf.int.high[i] <- high.95
        conf.int.check[i] <- low.95 < mu & mu < high.95
 }    

# Collect the intervals in a data frame
ci.dataframe <- data.frame(
        LowerCI=conf.int.low,
        UpperCI=conf.int.high, 
        Valid=conf.int.check
        )

# Take a peak at the top of the data frame
head(ci.dataframe)

# What fraction of the intervals included the true mean?
ci.fraction <- length(which(conf.int.check, useNames=TRUE))/replicates
ci.fraction

    #   "finish"

도움이 되었기를 바랍니다!


2
비판에 대해 사과하지만이 답변을 (일시적으로) 하향 조정해야했습니다. 나는 그것이 신뢰 구간의 의미를 오해하고 있다고 생각하며 이것이 이것이 당신의 수업에서 사용 된 주장이 아니기를 진심으로 바랍니다. 시뮬레이션은 (정교한) 이항 샘플링 실험으로 축소됩니다.
추기경

5
@cardinal Well ... 그녀는 빈번한 통계의 장기 해석을 사용하고 있습니다. 모집단에서 여러 번 표본을 추출하고 CI를 여러 번 계산하면 CI의 95 %에 실제 평균이 포함되어 있음을 알 수 있습니다.1α=0.95). 적어도 그것은 나에게 분명했다.
Néstor

4
1000 개의 CI 샘플에서 "94 % 미만"은 CI의 95 %에 평균이 포함되어 있다는 생각에 대한 확실한 증거가 아닙니다. 실제로,이 경우 CI의 95 %가 실제로 평균을 포함 할 것으로 예상합니다.
Ronald

3
@Ronald : 그렇습니다. 이것은 의견에 대한 나의 요점이지만, 당신은 훨씬 더 간단하고 간결하게 말했습니다 . 감사. 코멘트 중 하나에 명시된 바와 같이, 하나는 940 개 성공 이하에 대한 볼 수 8.7 % 의 시간을 그것은 사실이다 어느 하나 1000 개 실험의 과정을 통해 구축 정확히 95 % CI. :)
추기경

2
@JamesWaters : 답변 해 주셔서 감사합니다. 코드는 괜찮지 만 "잘못된 인스턴스를 어떻게 설명하는지"알 수 없습니다. 그 의도를 설명 할 수 있습니까? 나는 여전히 여기에 근본적인 오해가있을 것으로 의심된다. 당신은 I CI가 무엇인지 이해하고 그것을 올바르게 해석하는 방법을 이해하는 것처럼 보이지만 시뮬레이션 실험은 당신이 그것을 주장한다고 생각되는 질문에 응답하지 않습니다. 이 답변에 잠재력이 있다고 생각합니다. 그래서 당신이 극복하려는 요점을 명확히하기 위해 멋진 편집으로 끝나기를 원합니다. 건배. :)
추기경
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.