정확하게 신뢰 구간은 무엇입니까?


86

나는 신뢰 구간이 대략적이고 비공식적으로 알고 있습니다. 그러나 한 가지 중요한 세부 사항으로 머리를 감쌀 수는 없습니다. Wikipedia에 따르면 :

신뢰 구간은 모수의 실제 값이 실제로 얻은 데이터를 감안할 때 신뢰 구간에있을 확률이 있음을 예측하지 않습니다.

이 사이트의 여러 곳에서 비슷한 점을 보았습니다. Wikipedia에서보다 정확한 정의는 다음과 같습니다.

반복 된 (및 가능하면 다른) 실험에 대한 여러 개의 개별 데이터 분석에서 신뢰 구간이 구성된 경우 매개 변수의 실제 값을 포함하는 이러한 구간의 비율은 대략 신뢰 수준과 일치합니다.

다시, 나는이 사이트의 여러 곳에서 비슷한 점을 보았습니다. 나는 그것을 얻지 못한다. 반복 실험에서 실제 모수 를 포함하는 계산 된 신뢰 구간의 비율 θ(1α) 인 경우 실제 실험에 대해 계산 된 신뢰 구간에 θ 가 있을 확률 이 이외의 것)은 어떻게 될 수 있습니까? )(1α) ? 답변에서 다음을 찾고 있습니다.

  1. 위의 부정확 한 정의와 올바른 정의의 차이점에 대한 설명.

  2. 첫 번째 정의가 왜 틀린지 명확하게 보여주는 신뢰 구간의 공식적이고 정확한 정의.

  3. 기본 모델이 정확하더라도 첫 번째 정의가 크게 잘못되는 경우의 구체적인 예입니다.


4
이 게시물에는 신뢰 구간 stats.stackexchange.com/questions/2356/… 문제에 대한 좋은 설명이 있습니다. 포스트에 언급 된 기사는 왜 위의 정의가 신뢰 구간에 맞는지 정확하게 밝히는 데 도움이된다고 생각합니다. CI가 어떻게 그것을 더 잘 이해할 수 있는지 분석하는 것은 종종 그렇습니다.
chanceislogic

2
내 일부는 질문에 박수를 보냅니다 (+1). 경쟁적인 부분은 다음과 같이 지적하고 싶어합니다. 1. 화학이나 시장 조사에서 지적을하기 위해 실용적이지만 철학적으로 통계를 사용하지 않는 통계 소비자의 대다수는 결코 문제의 장점을 파악하지 못할 것이며, 종종 우리는 종종 결과를 설명하기 위해 상실된다. 2. 일부 순수 주의적 통계 학자조차도 무작위 표본을 다루지 않을 때 신뢰 구간이 포함 된 것과 같은 추정 적 진술을 함정에 빠뜨릴 수 있습니다. 훨씬 더 큰 문제.
rolando2

3
@ 마리오 당신의 가정은 사실이 아닙니다! 100 번의 반복 실험 중 95 개 CI (수단이 아님)에 실제 (그러나 알려지지 않은) 평균 이 포함될 것으로 예상 합니다 . CI는 무작위이지만 실제 모집단 평균은 다릅니다.
whuber

6
Cumming & Maillardet (2006) 의 좋은 논문 은 복제 수단의 95 %가 원래 CI에 속하지 않고 단지 83.4 % (이 값을 '캡처 백분율'이라고 부름)로 보여줍니다. A) 원래의 변화가 주위 의미 : 그 이유는 거기에 변화의 두 가지 소스가 있다는 것입니다 mu, 그리고 B) 복제의 변화가 주위 의미합니다 mu. 대부분의 사람들은 A를 잊어 버립니다. 원래의 CI는 반드시 필요하지 않습니다 mu!
Felix S

2
관심있는 독자는이 스레드를보고 싶어 할 수도 있습니다. 왜 95 % CI가 95 %의 평균을 포함 할 가능성을 의미하지 않습니까?
gung

답변:


26

신뢰 구간을 생각할 때이 생각 실험이 도움이된다는 것을 알았습니다. 또한 귀하의 질문에 답변합니다 .3.

하자 Y = X + - 1XU(0,1)Y=X+a12Yy1y2x1x2Xyl=min(y1,y2)[ y l , y u ] a a x 1 < 1yu=max(y1,y2)[yl,yu]aax1>1x1<12<x21x1>12>x214

그러나 이면 구간에 가 확률이 아니라 임을 알 수 있습니다 . 미묘한 점은 모수에 대한 신뢰 구간이 모수 변수 인 구간의 끝 점이 모수 의 확률이 아니라 구간을 계산하기 전에 확률이 모수의 양쪽에 있다는 것을 의미합니다. 구간 을 계산 한 후 구간 내에 누워있는 것은 입니다. 11yuyl>12a1 z%z%z%12z%z% z%


3
참고 거의 확실 따라서 간격 파라미터가 포함 확률을 제로로한다. 실제로 추정하는 것이 경우 인수가 작동합니다 . [ y l , y u ] a θ = a + 1Y>a[yl,yu]aθ=a+12
나요

4
이 카운터 예제가 유효하다고 생각하지 않습니다 . 본 후에 간격에 가 확률 이 하나 라는 것을 알고 있기 때문에 . 추가 정보를 얻은 후에 확률이 변경되어야한다는 것이 합리적입니다. 구간이 50 % 신뢰 구간이라는 사실 만 알고 있다면 확률은 여전히 ​​1/2이됩니다 (긴 실행 빈도가없는 특정 이벤트에 적용되므로 빈번하지는 않습니다).Y U - Y의 L > 1 / 2θyuyl>1/2
Dikran Marsupial 2016 년

1
그건 참 좋은 예입니다,하지만 난 강력 확률은 어떻게 든 변경에 대한 당신의 진술에 동의 이전이후 신뢰 구간을 계산. 그것은 말이되지 않으며, 수학이 당신이 알고있는 것과 모르는 것에 어떻게 든 신경을 쓴다는 인상을줍니다. 그렇지 않습니다 !!. 당신은 항상 것을 가지고 입니다 . 또한 항상 가지고 그 이다 . 그것은 모순이 아닙니다. 하나는 단순히 무조건 확률이고 다른 하나는 조건부 확률입니다. 1P(a[yl,yu]) P(a[yl,yu]121P(a[yl,yu]|yuyl>12)1
fgp

2
@fgp, 그렇습니다. 아마도 Taylor가 확률 변화에 대해 이야기하는 것은 좋지 않습니다. 확률은 변하지 않습니다. 논증이 보여주는 것은 CI에 대한 잘못된 이해가 논리적 문제를 야기한다는 것을 보여주는 상황이 발생하기 쉬운 방법이다. 관찰 한 CI가 50 %의 확률로 정확하지만 정확하지는 않다고 생각하면 CI에 대한 이해가 잘못되었습니다.
John

36

신뢰 구간과 관련하여 많은 문제가 있지만 인용문에 중점을 두겠습니다. 문제는 정확성의 문제 라기보다는 오해의 가능성이 있습니다. 사람들이 "매개 변수에 특정 확률이있다"고 말하면 매개 변수 를 임의 변수로 생각 합니다. 이것은 (고전적) 신뢰 구간 절차의 관점이 아니며, 랜덤 변수는 구간 자체이며 매개 변수는 무작위가 아니라 아직 알려지지 않은 것으로 결정됩니다. 그렇기 때문에 그러한 진술이 자주 공격받는 이유입니다.

수학적으로, 우리는 할 경우 데이터 매핑 어떤 절차가 될 매개 변수 공간의 하위 집합과 (매개 변수의 값에 상관없이 경우 주장 될 수있다) 는 이벤트 를 정의한 다음 정의에 따라 확률은 가능한 값에 대해 . 경우 신뢰와 신뢰 구간 절차 의 다음이 확률 (모든 파라미터 값을 통해)을 상하 한있을 것으로 예상되는x = ( x i ) θ θ t ( x ) A ( x ) Pr θ ( A ( x ) ) θ t 1 α 1 αtx=(xi)θθt(x)A(x)Prθ(A(x))θt1α1α. (이 기준에 따라, 우리는 일반적으로 짧은 신뢰 구간 또는 대칭적인 것들과 같은 일부 추가 속성을 최적화하는 절차를 선택하지만 별도의 문제입니다.) 큰 숫자의 약한 법칙은 두 번째 인용을 정당화합니다. 그러나 이는 신뢰 구간의 정의가 아니라 단지 자신이 소유 한 속성 일뿐입니다.

나는이 분석이 질문 1에 답하고, 질문 2의 전제가 잘못되었다는 것을 보여주고, 질문 3을 무질서하게 만듭니다.


3
훌륭한 질문에 답변 해 주셔서 감사합니다. 추가 토론을 위해 다음과 같은 비유를 생각해 볼 수 있습니까? 공정한 동전을 반복해서 뒤집어 봅시다. 그런 다음 입니다. 이제 동전을 한 번 뒤집었지만 뒤집은 것을 보여주지 않습니다. "머리가 올 확률은 얼마입니까?" 그 질문에 어떻게 대답 하시겠습니까? P(Head)=.50
볼프강

3
그것을 표현하는 또 다른 방법 : 비 베이지 아인의 경우, 확률이있을 수있는 유일한 "사물"은 무작위 실험의 미래 결과라는 의미에서 가능한 사건 일 수 있습니다. 매개 변수에 고정 된 true 값이 있다고 가정하면 특정 값을 갖는 간격이 있으면 매개 변수가 간격에 포함되는지 여부는 더 이상 가능한 이벤트가 아닙니다. 결과적으로 간격을 생성하는 프로세스는 확실하지만 두 개의 특정 숫자는 확신 할 수 없습니다.
caracal

1
@caracal-생각할만한 음식, "코인 플립"은 모두 진정으로 "무작위"입니까? "예"라고 말하면 동전이 머리에 올라 오는지 여부가 많은 것들 (예 : 바람, 고도, 힘 및 뒤집기 각도, 동전 무게 등)의 결정 론적 (그러나 복잡한) 기능이라는 생각을 거부 할 것입니다. ). CI 기반 사고에 적용되는 "랜덤 성" 의 이중 표준 을 보여줍니다 . 데이터 는 고정되어 있지만 그 값에 대해서는 확실하지 않지만 (ergo 데이터는 무작위 임 ) 매개 변수 는 고정되어 있지만 그 값에 대해서는 확실하지 않습니다 ( ergo 매개 변수는 무작위가 아닙니다 ).
chanceislogic

4
@ Wolffgang 나는 당신의 예가 어떻게 신뢰 구간과 관련이 있는지 알지 못한다. 분포 모수와 관련된 것은 요구하지 않습니다. 귀하의 상황은 예측 간격 과 가장 밀접한 관련이 있습니다. 나는이 전체 토론이 그 맥락에 관심이 있다고 생각하지만, 신뢰 구간에 관한 스레드에는 속하지 않습니다.
whuber

2
@whuber 실제 알 수없는 매개 변수를 캡처하는 특정 95 % CI에 대한 확률 진술을 할 수 있는지에 대한 질문은 결과가 아직 알려지지 않은 특정 플립에 대한 확률 진술을 할 수 있는지에 대한 질문과 매우 유사합니다. 장기적으로 CI의 95 %가 매개 변수를 캡처합니다. 장기적으로 플립의 50 %가 머리입니다. 특정 CI가 매개 변수를 캡처 할 확률이 95 %라고 말할 수 있습니까? 우리가보기 전에 머리가 올라갈 확률이 50 %라고 말할 수 있습니까? 나는 둘 다 예라고 말할 것이다. 그러나 일부 사람들은 동의하지 않을 수 있습니다.
볼프강

19

CI의 정의를 잘못된 것으로 부르지는 않지만 확률에 대한 정의가 두 개 이상 있기 때문에 잘못 해석하기 쉽습니다. CI는 다음 확률에 대한 정의 (자주 또는 온톨로지)를 기반으로합니다.

(1) 제안 확률 = 데이터 생성 프로세스에 따라 제안이 참인 것으로 간주되는 장기 실행 비율

따라서 CI를 사용할 때 개념적으로 유효 하려면 이 확률 정의를 승인 해야합니다 . 그렇지 않은 경우 이론적 관점에서 간격은 CI가 아닙니다.

그렇기 때문에이 정의에서 확률의 "장거리 빈도"정의가 사용되고 있음을 명확히하기 위해 단어 확률이 아닌 단어 비율 을 사용했습니다.

확률의 주요 대안 정의 (연역적 논리 또는 베이지안의 확장으로서의 인식론 또는 확률)는 다음과 같습니다.

(2) 제안의 확률 = 지식의 상태에 따라, 제안이 참되다는 합리적 신념

사람들은 종종 직관적으로 이러한 두 가지 정의를 혼합하여 직감에 호소하는 해석을 사용합니다. 이를 통해 모든 종류의 혼란스러운 상황에 빠질 수 있습니다 (특히 하나의 패러다임에서 다른 패러다임으로 이동할 때).

두 가지 접근 방식이 종종 동일한 결과를 초래한다는 것은 경우에 따라 다음과 같은 결과를 초래한다는 것을 의미합니다.

데이터 생성 프로세스에 따라, 제안이 참이고 지식의 상태에 따라 다르다 = 제안이 참으로 관찰되는 장기의 비율

요점은 보편적으로 적용되지 않기 때문에 서로 다른 두 가지 정의가 항상 같은 결과를 가져올 것으로 기대할 수는 없다는 것입니다. 따라서 실제로 베이지안 해를 구한 다음 같은 간격이되는 것을 발견하지 않으면 CI에 의해 주어진 간격에 참값을 포함 할 확률로 해석 할 수 없습니다. 그리고 그렇게하면, 구간은 신뢰 구간이 아니라 신뢰할 수있는 구간입니다.


2
정의 1에 따른 제안의 확률이 합리적인 수인 이유를 모르겠습니다. 장기 비율 은 제안이 참인 것으로 보이는 시간 비율의 한계를 나타내는 것으로 보인다. 각 비율은 합리적인 숫자이지만 한계는 아닙니다. (다행히도, 당신의 괄호는 답변의 나머지 부분에서 최고의 접선 보인다.)
나요

3
@probability이 답변은 우리를 매우 건설적인 방법으로 접선에서 벗어나게하는 것 같습니다. 적도 확률과 비율은 온도계의 수은 수준과 온도를 동일시하는 것과 같은 온톨로지 혼동의 한 형태입니다. 하나는 이론적 인 구성 요소이고 다른 하나는이를 측정하는 데 사용되는 물리적 현상입니다. stats.stackexchange.com/questions/1525/… 에서 이에 대한 논의가 있습니다 .
whuber

@Didier-맞습니다. 사실 . 비이성적 인 한계를 가진 합리적인 용어입니다. 이 말을 삭제했습니다. 이것을 가져 주셔서 감사합니다. xn=r2xn1+xn12r
probabilityislogic

6
@whuber-요점은 사람들이 CI를 잘못된 방식으로 해석하도록하는 오해이기 때문에 제기하는 것이 중요합니다. "합리적 신념"과 확률을 혼동하는 것은 빈번한 패러다임과 일치하지 않습니다. 이것은 CI가 "진정한 값의 간격 일 가능성"을 의미 할 때 발생하는 것인데, 이는 @dsimcha가 질문에서 수행하는 것입니다.
probabilityislogic

1
@probability 설명해 주셔서 감사합니다. 귀하의 답변이 "확률 = 비례"의 정의와 일치하는 것으로 이해했습니다. 사실, 여러분의 의견이 이제 이것을 오해로 특징 짓고 있음에도 불구하고, 세밀하게 다시 읽는다는 것은 여전히 ​​이것이 여러분이 세 번째 단락에서 말하는 것임을 암시합니다. 이 점을 분명히하고 싶을 수도 있습니다.
whuber

6

RA Fisher는 신뢰 구간의 유용성에 대한 기준을 가지고있었습니다. CI는 다른 신뢰 수준을 암시하는 "식별 가능한 부분 집합"을 인정해서는 안됩니다. 대부분의 (대부분은 아님) 반례에서, 우리는 서로 다른 범위 확률을 갖는 식별 가능한 부분 집합이있는 경우가 있습니다.

이러한 경우 Bayesian cred-intervals를 사용하여 모수의 위치에 대한 주관적인 의미를 지정하거나, 데이터가 주어지면 모수의 상대적 불확실성을 반영 할 가능성 간격을 공식화 할 수 있습니다.

예를 들어, 비교적 모순이없는 것으로 보이는 한 경우는 모집단 평균의 양측 정규 신뢰 구간입니다. 주어진 표준을 가진 정규 모집단에서 샘플링을 가정하면 95 % CI는 모수에 대한 자세한 정보를 제공하는 식별 가능한 부분 집합이 없음을 인정합니다. 이것은 표본 평균이 우도 함수에서 충분한 통계량이라는 사실로 알 수 있습니다. 즉, 우도 함수는 일단 표본 평균을 알고 나면 개별 표본 값과 무관합니다.

정규 평균에 대한 95 % 대칭 CI에 대한 주관적인 신뢰가있는 이유는 명시된 적용 범위 확률이 적고 정규 평균에 대한 대칭 95 % CI가 "가장 높은 가능성"구간이라는 사실에서 비롯됩니다. 구간 내의 매개 변수 값은 구간 외부의 모든 매개 변수 값보다 가능성이 높습니다. 그러나, 가능성은 (장기 정확도의 관점에서) 확률이 아니기 때문에 (베이지안의 이전 및 가능성의 사용과 마찬가지로) 주관적인 기준에 가깝습니다. 요약하면, 적용 범위 확률이 95 % 인 정규 평균에 대한 구간이 무한히 많지만, 대칭 CI만이 구간 추정치에서 예상하는 직관적 인 타당성을 가지고 있습니다.

따라서 RA Fisher의 기준은 커버리지 확률이 식별 가능한 하위 집합 중 어느 것도 인정하지 않는 경우에만 주관적 확신과 동일해야 함을 의미합니다. 서브 세트가 존재하면, 커버리지 확률은 서브 세트를 설명하는 파라미터 (들)의 실제 값에 대해 조건부 일 것이다. 직관적 인 신뢰 수준으로 구간을 얻으려면 부분 집합을 식별하는 데 도움이되는 적절한 보조 통계를 사용하여 구간을 추정해야합니다. 또는 분산 / 혼합 모형에 의지 할 수 있으며, 이는 자연스럽게 모수를 임의의 변수 (일명 베이지안 통계)로 해석하거나 우도 프레임 워크에서 프로파일 / 조건부 / 마진 우도를 계산할 수 있습니다. 어느 쪽이든, 당신은 객관적으로 검증 가능한 타당성에 대한 희망을 버리고,

도움이 되었기를 바랍니다.


1
(+1) 대칭 일반 CI를 정당화하는 한 가지 방법은 예상 길이를 최소화하는 것입니다. 궁극적으로 그것은 의사 결정 절차에서 손실 함수로서 길이의 선택으로 주관성을 밀어 낸다. 그러나 그것은 아마도 통계적 선택의 선택에서 우리의 분석적 목표의 역할을 노출시키기 때문이다. "나쁜"주관성, 그것은 단지 약간의 중대한 소명처럼 들린다.
whuber

5

A로부터 이론적 관점 질문 2와 3은 정의가 잘못이라는 잘못된 가정에 기초한다. 그래서 나는 그 점에서 @whuber의 대답과 동의하고, 질문 1에 대한 @whuber의 대답은 나로부터 추가 입력을 요구하지 않습니다.

그러나보다 실용적인 관점 에서 동일한 정보 (즉, 정보가없는 사전)를 기반으로 베이지안 신뢰할 수있는 간격과 수치 적으로 동일한 경우 신뢰 구간에 직관적 정의 (실제 값을 포함 할 가능성)를 부여 할 수 있습니다.

그러나 이것은 다이 하드 안티-베이지안에게는 다소 안타까운 일입니다. CI에주고 싶은 해석을 CI에 부여하기위한 조건을 검증하기 위해서는 직관적 해석이 자동으로 유지되는 베이지안 솔루션을 해결해야합니다!

1αx¯±σZα/21αx¯±σZα/2

조건을 정확히 모르지만 CI를 직관적으로 해석하려면 다음이 중요하다는 것을 알고 있습니다.

1) 분포가 모수와 독립적 인 피벗 통계가 존재합니다 (정확한 피벗이 정규 및 카이-제곱 분포 외부에 존재합니까?)

2) 귀찮은 매개 변수가 없습니다 (Pivotal 통계의 경우를 제외하고 CI를 만들 때 방해 매개 변수를 처리 해야하는 몇 가지 정확한 방법 중 하나입니다)

3) 관심 모수에 대한 충분한 통계가 존재하고 신뢰 구간이 충분한 통계를 사용합니다.

(x¯|μ,σ)N(μ,σn)(μ|x¯,σ)N(x¯,σn)

이러한 조건은 일반적으로 찾기 어렵고 일반적으로 베이지안 간격을 계산하고 비교하는 것이 더 빠릅니다. 흥미로운 것은 "내 CI는 무엇보다 신뢰할 수있는 간격입니까?"라는 질문에 답하는 것입니다. 이 내용을 살펴보면 CI 절차에 대한 숨겨진 가정을 발견 할 수 있습니다.


1
(+1) 실제로 "안티 바이 안"과 같은 사람이 있습니까? :-)
whuber

6
@whuber 여기 하나가 있습니다. 그리고 여기 통계 철학에서 장학금에 관해 그녀와 협력 하는 계량 경제학자 가 있습니다.
Cyan

1
감사! 그것은 내가 알지 못했던 확률과 통계의 철학에서 매우 흥미로운 스레드입니다.
whuber

1
를 잘못 썼습니다x¯±zα/2σnn

3

이것은 이해하기 어려울 수 있습니다.

  • 모든 신뢰 구간의 평균 95 %가 모수를 포함하는 경우
  • 하나의 특정 신뢰 구간이 있습니다
  • 왜이 구간에 매개 변수가 95 %를 포함 할 확률이 아닌가?

신뢰 구간은 샘플링 절차와 관련이 있습니다. 많은 표본을 취하여 각 표본에 대해 95 % 신뢰 구간을 계산하면 해당 구간의 95 %에 모집단 평균이 포함됩니다.

예를 들어 산업 품질 부서에 유용합니다. 그 사람들은 많은 표본을 채취했으며, 이제는 대부분의 추정치가 현실과 거의 비슷할 것이라는 확신을 가지고 있습니다. 그들은 그들의 추정치의 95 %가 꽤 좋다는 것을 알고 있지만, 각각의 모든 특정 추정치에 대해 말할 수는 없습니다.

16

16

16

마찬가지로 표본이 1 개 (1 개의 신뢰 구간) 만있는 경우 모집단 평균이 해당 구간에있을 가능성을 말할 방법이 없습니다. 평균 (또는 모든 매개 변수)이 포함되어 있는지 여부입니다. 확률은 1 또는 0입니다.

또한 신뢰 구간 내의 값이 그 밖의 값보다 더 정확하지는 않습니다. 나는 작은 그림을 만들었습니다. 모든 것은 ° C로 측정됩니다. 물은 0 ° C에서 얼고 100 ° C에서 끓습니다.

경우 : 차가운 호수에서 얼음 아래로 흐르는 물의 온도를 추정하고 싶습니다. 100 곳의 온도를 측정합니다. 내 데이터는 다음과 같습니다.

  • 0.1 ° C (49 곳에서 측정);
  • 0.2 ° C (49 개 위치에도 있음);
  • 0 ° C (1 곳에서.이 물 은 얼기 직전의 물이었다 );
  • 95 ° C (한 곳에는 호수에 매우 뜨거운 물을 불법적으로 버리는 공장이 있습니다).
  • 평균 온도 : 1.1 ℃;
  • 표준 편차 : 1.5 ° C;
  • 95 % -CI : (-0.8 ° C ...... + 3.0 ° C).

이 신뢰 구간의 온도는 외부의 온도보다 확실히 높지 않습니다. 이 호수에서 흐르는 물의 평균 온도는 0 ° C보다 낮을 수 없습니다. 그렇지 않으면 물이 아니라 얼음이됩니다. 이 신뢰 구간의 일부 (즉, -0.8에서 0까지의 섹션)에는 실제로 실제 모수 를 포함 할 확률0 % 입니다.

결론 : 신뢰 구간은 빈번한 개념이므로 반복되는 표본의 아이디어를 기반으로합니다. 많은 호수의 연구원이이 호수에서 표본을 채취하고 모든 연구원이 신뢰 구간을 계산할 경우 해당 구간의 95 %에 실제 모수가 포함됩니다. 그러나 하나의 단일 신뢰 구간에 대해 실제 모수를 포함 할 가능성을 말하는 것은 불가능합니다.


1
잦은 통계가 사전 믿음을 갖고이를 업데이트하는 잦은 사람과의 믿음을 측정하지 않는다는 사실을 혼동하지 마십시오. 차이점은 잦은 정보가 데이터 외부에 지식이없는 바보인지 여부가 아니라 잦은 통계가 신념 상태에 대한 직접적인 척도를 제공하는지 여부입니다. 잦은 주의자는 테스트, CI 등을 기반으로 자신의 신념을 업데이트해야합니다. 그렇지 않으면 의사 결정에 따라 모든 것이 작동하지 않으므로 전체 시스템이 작동하지 않습니다.
John

2

좋아, 고전적인 잦은 방법을 사용하여 매개 변수에 대한 95 % 신뢰 구간을 계산할 때 매개 변수가 해당 구간 내에있을 확률이 95 %라는 것을 의미하지는 않습니다. 그리고 ... ... 베이지안 관점에서 문제에 접근하고 매개 변수의 95 % 신뢰할 수있는 간격을 계산 하면 고전적인 접근 방식 과 정확히 동일한 간격 ( 정보가 아닌 것으로 가정) 을 얻습니다. 나는 데이터 집합의 평균을 (말)에 대한 95 % 신뢰 구간을 계산하기 위해 고전적인 통계를 사용한다면, 이다 매개 변수가 그 간격에 자리 잡고있는 95 %의 확률이 있다는 사실.


5
빈번한 신뢰 구간과 베이지안 신뢰할 수있는 구간을 사용하여 동일한 결과를 얻는 지 여부는 문제, 특히 베이지안 접근 방식에 사용 된 이전 분포에 따라 다릅니다. 수학과 과학에서 당신이 옳았을 때 당신이 옳은 이유에 옳다는 것이 중요합니다!
Dikran Marsupial

4
"[모수]에 대한 95 % 신뢰 구간을 계산하기 위해 클래식 통계를 사용하는 경우"일관성있게 추론 하는 경우 "모수가 해당 구간에있을 확률"을 나타내는 것은 의미없습니다 . 그 확률을 언급하는 순간 상황의 통계 모델이 변경되었습니다. 매개 변수가 임의 인 새 모델에서는 잦은 방법을 사용하여 CI를 계산하는 것이 올바르지 않습니다. 어떤 상황에서는 이런 식으로 올바른 답을 얻는 것이 흥미롭지 만 그에 대한 개념적 혼란을 정당화하지는 않습니다.
whuber

4
@whuber-당신의 전제 "... 당신이 꾸준히 추론한다면 ..."은 오래된 콕스 정리의 결과입니다. 그것은 당신이 일관성있게 추론한다면, 당신의 해 수학적으로 베이지안 해와 동일 해야 한다고 말합니다 . 따라서 이러한 전제에서 CI는 반드시 신뢰할 수있는 구간과 동등하며 확률에 대한 해석은 유효합니다. 그리고 베이 즈에서는 분포를 갖는 매개 변수가 아니며, 분포를 갖는 매개 변수에 대한 불확실성입니다.
chanceislogic

2
... 계속 ... 그래서 나는 바보 같은 게임을 할 수 있습니다. 나는 "매개 변수가 간격에있는 문제", 나는 빈번한 "간격이 매개 변수를 포함하는 문제", 나는 베이지안입니다. ..., 나는 빈민가, ..., 나는 베이지안입니다 ..., 나는 빈민가입니다 ..... 항상 실제 계산의 숫자는 절대 변하지 않습니다
확률 론적

2

Frequentist 신뢰 구간 에 대해 묻고 있습니다. 정의 (두 인용문 중 어느 것도 정의가 아님을 명심하십시오!

이 매개 변수 값이있는이 적합 모형을 고려 하여이 실험을 여러 번 반복하면 실험의 95 %에서 매개 변수 의 추정값이이 간격 내에있게됩니다.

따라서 모델 (관측 된 데이터를 사용하여 구축)과 추정 된 매개 변수가 있습니다. 그런 다음 이 모델과 모수에 따라 가상의 데이터 세트 를 생성 하면 추정 모수는 신뢰 구간에 포함됩니다.

실제로,이 잦은 접근 방식은 주어진대로 모델과 추정 된 파라미터를 고정 된 것으로 간주하고 데이터를 불확실한 것으로 간주합니다.

이것은 실제로 해석하기 어렵고 이것은 종종 베이지안 통계에 대한 논쟁으로 사용됩니다 ( 때로는 논쟁의 여지가 거의 없을 것 입니다. 반면에 베이지안 통계는 데이터를 고정 된 것으로 간주하고 매개 변수를 불확실한 것으로 간주합니다. 베이지안 신뢰할 수있는 간격 은 베이지안 신뢰할 수있는 간격은 실제 매개 변수 값이 95 % 인 간격입니다.

그러나 실제로 많은 사람들이 베이지안 신뢰 구간과 같은 방식으로 잦은 신뢰 구간을 해석하고 많은 통계 학자들은이를 큰 문제로 간주하지 않습니다. 모두 알고 있지만 100 % 정확하지는 않습니다. 또한 실제로 베이 즈 정보가없는 사전을 사용할 때 잦은주의와 베이지안 신뢰 / 신뢰할 수있는 간격은 크게 다르지 않습니다 .


1α1α

@ whuber, 알았어.하지만 정의가 틀렸다고 말하는 경우 CI가 무엇인지에 대한 전체 정의를 게시하십시오.
호기심

Xt=[L,U]ϕ(θ)θθ0γt(θ0)=Prθ0{L(X)ϕ(θ0)U(X)}γ¯t=infθΩγt(θ)tt

@ whuber, 당신의 정의는 실제로 이해할 수 없으며 대부분의 사람들에게도 두려워합니다.
호기심

3
Curious 정의의 주요 문제는 "... 추정 된 매개 변수의 값이 간격 내에 있습니다."라고 생각합니다. 추정 된 매개 변수는 아니지만 알려지지 않은 고정 된 매개 변수입니다. 간격 내에 들어 가지 않고 간격이 이동하고 95 %의 시간이 매개 변수를 캡처합니다.
John

2

θTθθ[T1;T+1]

T=12

T=12θ[11;13]P(θ[11;13]|T=12)

P(θ[11;13]|T=12)θT

  • θ[0;30]
  • 이 실험을 해, 찾으십시오.T=12
  • P(θ[11;13]|T=12)=0.94

P(θ...|T...)θθ[T1;T+1]0.95θ,P(θ[T1;T+1]|θ)=0.95

그래서 :

  • P(θ[T1;T+1]|T)=0.94T=12
  • θ,P(θ[T1;T+1]|θ)=0.95

베이지안 진술이 더 자연 스럽습니다. 가장 빈번하게, 잦은 진술은 베이 즈 (Bayesian) 진술로 자발적으로 잘못 해석된다 (수년간 통계를 수행하지 않은 정상적인 인간 두뇌에 의해). 그리고 솔직히, 많은 통계 서적은 그 점을 매우 명확하게 밝히지 않습니다.

그리고 실제로?

많은 일반적인 상황에서 사실은 잦은주의와 베이지안 접근법에 의해 얻어진 확률이 매우 가깝다는 것입니다. 따라서 베이지안에 대한 잦은 진술을 혼동한다는 것은 거의 영향을 미치지 않습니다. 그러나 "철학적으로"는 매우 다릅니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.