신뢰 구간이 유용합니까?


11

잦은 통계에서 95 % 신뢰 구간은 무한 횟수 반복 될 경우 시간의 실제 매개 변수 95 %를 포함하는 구간 생성 절차입니다. 이것이 왜 유용한가요?

신뢰 구간은 종종 오해됩니다. 매개 변수가 95 % 확신 할 수있는 구간 이 아닙니다 (유사한 베이지안 신뢰 구간을 사용하지 않는 한). 신뢰 구간은 미끼와 같은 느낌입니다.

내가 생각할 수있는 유스 케이스는 모수가 그 값이라는 귀무 가설을 기각 할 수없는 값의 범위를 제공하는 것입니다. p- 값이이 정보를 제공하지 않습니까? 그렇게 오도하지 않고?

한마디로 : 신뢰 구간이 필요한 이유는 무엇입니까? 올바르게 해석하면 어떻게 유용합니까?



베이지안 신뢰 구간은 어느 쪽도없는 우리가 매개 변수에 95 % 확신 할 수있는 간격.
섹스 투스 엠피 리 쿠스

@MartijnWeterings : 귀하가 이전을 100 % 확신하지 않는 한.
시안

@ Xi'an 매개 변수 가 임의의 변수로 합리적으로 간주 될 것으로 100 % 확실하고 실험이 공동 주파수 분포 에서 샘플링하는 것과 같은 경우에 작동합니다. 즉, Bayes 규칙을 다음과 같이 사용합니다. 명시적인 'prior'가없는 . 고정 된 것으로 간주되는 매개 변수는 동일하지 않습니다. 그런 다음 사후 신념은 와 의 오래된 관절 주파수 분포를 '업데이트'해야합니다 . 100 % 확실했던 '사전 신념'을 업데이트한다고 주장하는 것은 약간 터무니 없습니다. P ( θ , x ) P ( θ | x ) = P ( θ , x ) / P ( x ) X θθP(θ,x)P(θ|x)=P(θ,x)/P(x)Xθ
Sextus Empiricus

답변:


10

신뢰 구간이 무작위 로 처리되는 한 (즉, 아직 보지 못한 임의의 변수로 데이터를 처리한다는 관점에서 본다면) 실제로 그것에 대해 유용한 확률 진술을 할 수 있습니다. 특히, 매개 변수 대해 레벨의 신뢰 구간이 있고 구간이 범위에 있다고 가정하십시오 . 그런 다음 우리는 말할 수 있습니다.1αθL(x)U(x)

P(L(X)θU(X)|θ)=1αfor all θΘ.

잦은 패러다임의 바깥으로 이동 하고 이전 분포에 대해 이상을 하면 해당 (약한) 한계 확률 결과가 나타납니다.θ

P(L(X)θU(X))=1α.

데이터를 로 수정하여 신뢰 구간의 한계를 고치면 이제 데이터가 수정되었으므로 더 이상이 확률 설명에 호소하지 않습니다. 그러나 신뢰 구간이 임의의 구간으로 취급되는 경우 실제로 확률 확률을 계산할 수 있습니다. 즉, 확률 하면 매개 변수 는 (랜덤) 구간에 속합니다.X=x 1 α θ1αθ

잦은 통계 내에서 확률 진술은 무한 반복 시험에 대한 상대 빈도에 대한 진술입니다. 그러나 이는 빈번주의 패러다임 의 모든 확률 진술 에 해당되므로, 이의 제기가 상대 빈도 진술에 대한 것이라면 이는 신뢰 구간에 특정한 이의 제기가 아닙니다. 우리가 잦은 패러다임 밖으로 이동한다면, 우리는 확률 확률을 원하는 확률로 목표 변수를 포함한다고 합리적으로 말할 수 있습니다. 임의의 의미에서.

나는 다른 사람들에 대해 알지 못하지만, 그것은 꽤 강력한 확률 결과이며, 이러한 형태의 간격에 대한 합리적인 정당화 인 것 같습니다. 나는 베이지안 방법에 더 부분적이지만 신뢰 간격을 뒷받침하는 확률 결과 (임의의 의미에서)는 스니핑해서는 안되는 강력한 결과입니다.


1
"자주주의 패러다임의 외부로 이사하는 것"이 ​​정확히 문제가되지 않습니까? 일반적으로 우리는 관심있는 매개 변수의 실제 값을 확률로 포함하는 간격을 원합니다. 빈번한 분석은 우리에게 그것을 제공 할 수 없으며, 베이지안 분석으로 암시 적으로 재 해석하면 오해로 이어집니다. 베이지안 신뢰할 수있는 간격을 통해 직접 질문에 대답하는 것이 좋습니다. 품질 관리와 같이 "실험"을 반복적으로 수행하는 신뢰 구간에는 용도가 있습니다.
Dikran Marsupial

이는 베이지안으로 암시 적으로 재 해석하는 문제가 아닙니다 (후자는 후자를 얻기 위해 데이터를 조건으로 함). 답은 단지 신뢰 구간에 대해 유용한 확률 진술을 할 수있는 OP를 보여주는 것입니다. 잦은 패러다임에 대한보다 일반적인 반대에 관해서는, 그것들은 좋고 훌륭하지만, 신뢰 구간에 특정한 반대는 아닙니다.
벤-복 직원 모니카

1
위의 확률 문에서 볼 수 있듯이, 우리는 할 수 있습니다 CI를 너무 오래 우리는이에 보면, 어떤 확률로 매개 변수를 포함 보장 선험적 .
벤-복원 모니카

1
잦은 패러다임에서 벗어나 베이 즈 프레임 워크로 이동하지 않는다면 어떤 프레임 워크입니까? 나는 자주주의에 반대하는 표현을하지 않았다. 나는 당신이 실제로 제기하고자하는 질문에 가장 직접적으로 대응하는 틀을 사용해야한다고 믿는다. 자신감과 신뢰할 수있는 간격은 다른 질문에 대답합니다.
Dikran Marsupial

1
@Dikran : 확률 진술은 기록 된 그대로이며 순수한 수학적 진술입니다. 나는 당신이 이것에 합리적으로 반대 할 수있는 방법을 정말로 보지 못합니다.
벤-복원 모니카

5

위의 @Ben에 동의하며 베이지안 대 빈번한 간격이 동일한 환경에서 가치가있는 간단한 예를 제공한다고 생각했습니다.

병렬 조립 라인이있는 공장을 상상해보십시오. 라인을 멈추는 것은 비용이 많이 들고 동시에 고품질의 제품을 생산하기를 원합니다. 그들은 시간이 지남에 따라 가양 성 및가 음성 모두에 대해 우려하고 있습니다. 공장에서는이 프로세스가 평균화 프로세스입니다. 위양성 문제에 대한 전원 및 보장 된 보호입니다. 공차 구간뿐만 아니라 신뢰 구간도 공장에서 중요합니다. 그럼에도 불구하고 기계는 정렬이 이고 탐지 장치는 가짜 이벤트를 관찰합니다. 평균 결과는 중요하지만 특정 결과는 운영상의 세부 사항입니다.θΘ

이것의 반대편에는 단일 제품 또는 단일 로트 제품을 구매하는 단일 고객이 있습니다. 조립 라인의 반복 속성에 대해서는 신경 쓰지 않습니다. 그들은 구매 한 하나의 제품에 관심을 갖습니다. 고객이 NASA이고 와 같이 사양을 충족하려면 제품이 필요하다고 가정 해 봅시다 그들은 구매하지 않은 부품의 품질에 신경 쓰지 않습니다. 그들은 어떤 형태의 베이지안 간격이 필요합니다. 또한 한 번의 실패로 많은 우주 비행사가 사망하고 수십억 달러가 소요될 수 있습니다. 구매 한 모든 부품이 사양을 충족한다는 것을 알아야합니다. 평균화는 치명적입니다. 토성 V 로켓의 경우, 1 %의 결함률은 아폴로 비행 중에 결함 부품 10,000 개를 암시했을 것입니다. 모든 임무에서 0 %의 결함이 필요했습니다.γΓ.

팩토리가 수행하는 동안 샘플 공간에서 작업 할 때 신뢰 구간이 걱정됩니다. 샘플 공간을 작성 중입니다. 고객이하는 것처럼 매개 변수 공간에서 작업 할 때 신뢰할 수있는 간격이 걱정됩니다. 외부 관찰에 신경 쓰지 않으면 베이지안입니다. 보이지는 않았지만 볼 수 있었던 샘플에 관심이 있다면, 당신은 자주 사용하는 사람입니다.

장기 평균화 또는 특정 이벤트에 관심이 있습니까?


NASA는 실제로 베이지안 간격을 기준으로 부품을 구매합니까? 나는 당신의 요점을 이해하지만 실제로 그렇게합니까?
Aksakal

@ Aksakal 나는 모른다. 물론 Juran은 NASA에서 품질 보증에 관한 훌륭한 작품을 썼습니다. 그러나 테스트 과정을 읽은 후 10 년이 넘게 논의 된 적이 있다면 전혀 기억이 나지 않습니다. 나는 W Edwards Deming이 신뢰할 수있는 간격을 선호하는 신뢰 구간과 반대되는 것을 알고 있지만 직접적으로는 그렇지 않습니다. 제 생각에는 알고있는 사람들을 알고 있지만 현재 물어 보는 것은 불편합니다. 대부분의 사람들이 훈련하는 방식이기 때문에 자주 사용하는 방법을 사용한다는 것입니다.
Dave Harris

그래도 "망치"의 경우입니까? 아마도 엔지니어링 분야와 관련이 있을까요?
Aksakal

@ Aksakal 나는 그것에 동의 할 자격이 없습니다.
Dave Harris

회사가 수준의 복합 가설 검정 를 사용하여 부품을 만든다고 가정 하면 실수를 테스트했습니다. 는 실수없이 통과하고 는 실패합니다. NASA에게 합리적인 보증을 제공 할 수 있습니다. 실수로 테스트를 통과 할 수있는 최대 제품 수 (오류없이 잘못 간주 됨)는 입니다. 품목 을 판매했음을 알면 판매 된 부품이 실제로 대체 가설 따르지 않을 가능성을 최대로 계산할 수 있습니다 . α H 0 : γ > Γ x y n α x γ ΓnαH0:γ>ΓxynαxγΓ
Sextus Empiricus

4

참고 의해 것을 엄격한 신뢰 구간의 정의, 그것은 이다 그들이 즉, 완전히 무의미 가능성이 관심있는 매개 변수에 대한 정보 없습니다. 그러나 실제로는 일반적으로 매우 의미가 있습니다.

무의미한 신뢰 구간의 예로, 시간의 95 %가 생성하고 시간의 5 %가 [ , ]를 생성하는 프로 시저가 있다고 가정합니다 . 여기서 있는 모든 랜덤 변수의 쌍이되도록 . 이어서 이것은 캡처 절차 어떤 확률 시간 중 적어도 95 % 정도로, 모든 기술적 가능성에 대한 유효한 신뢰 구간이다. 그러나이 절차에 의해 생성 된 구간이 주어진 대해 이라고 말하면 실제로 대해 전혀 배우지 않았다는 것을 알아야합니다 .[0,1]UminUmaxUmin,Umax U m i n < U m a x [ 0.01 , 0.011 ] p pUmin<Umax[0.01,0.011]pp

반면에 대부분의 신뢰 구간은보다 유용한 방식으로 구성됩니다. 예를 들어, Wald Interval 프로 시저를 사용하여 생성되었다고 말하면

p^ ˙ N(p,se)

여기서 는 표준 오류입니다. 이 방법에 대한 매우 의미있는 진술이다 관련 . 이것을 신뢰 구간으로 바꾸는 것은 단순히 정규 분포에 익숙하지 않은 사람에게이 결과를 단순화하려는 시도입니다. 그것은 단지 정규 분포에 대해 모르는 사람들을위한 도구 일 뿐이라고 말하는 것이 아닙니다. 예를 들어, 백분위 수 부트 스트랩은이 오류의 분포가 가우시안이 아닐 때 추정기와 true 매개 변수 사이의 오류를 요약하는 도구입니다.seP는 P는p^p


2

신뢰 구간은 유용 할뿐만 아니라 물리와 같은 일부 분야에서 필수적입니다. 불행하게도, CI에 관한 가장 큰 소음은 베이 즈 사람들이 빈번한 사회 주의자들과의 가짜 토론에서, 일반적으로 사회 "과학"과 다른 과학과 같은 학문의 맥락에서 잡힌 것에서 비롯됩니다.

전기 요금과 같은 물리학의 양을 측정한다고 가정합니다. 나는 항상 값의 불확실성에 대한 측정 값을 제공 할 것이며, 이는 일반적으로 표준 편차입니다. 물리학에서 오류는 종종 가우시안이므로 CI로 직접 변환됩니다. 그러나 오류가 가우시안이 아닌 경우 약간 복잡해지며 일부 적분 등을 평가해야합니다. 일반적으로 너무 난해한 것은 없습니다.

여기 입자 물리학의 CI 및 정의에 대한 간단한 프리젠 테이션은 :

그러한 간격이 다수의 반복 실험에서 매개 변수의 실제 값을 포함하는 횟수에 대한 정량적 진술

물리학에서 "반복 실험"은 종종 글자 그대로의 의미를 갖습니다. 실제로 논문에서 실험을 반복 수 있고 실제로 그 분수를 관찰 한다고 가정 합니다 . 따라서 CI는 거의 문자 그대로의 의미이며 측정의 불확실성에 대한 정보를 표현하는 방법 일뿐입니다. 그것은 생각 실험이 아니며, 주관적인 의견이 아니며, 가능성에 대한 당신의 또는 내 감정이 아닙니다. 그것은 당신이 실험에서 고안 할 수 있었던 것과 실험을 재현 할 때 관찰 할 수있는 것입니다.


1

이 스레드는 Frequentist vs Bayesian 토론으로 빠르게 발전했으며, 이는 쉽게 해결할 수 없습니다. 두 가지 접근 방식의 수학은 견고하므로 항상 철학적 취향에 달려 있습니다. 사건의 상대적 빈도의 한계로서 확률에 대한 잦은 해석은 많은 수의 강력한 법칙에 의해 정당화된다. 확률에 대한 선호도 해석에 관계없이 이벤트의 상대 빈도는 확률 1의 확률로 수렴됩니다.

빈번한 신뢰 구간은 실제로 베이지안 신뢰 구간보다 해석하기가 더 까다 롭습니다. 알 수없는 수량을 임의의 변수로 취급함으로써 베이지안은 한 구간에 해당 수량이 확률로 포함되어 있다고 주장 할 수 있습니다. 빈번한 의사는 일부 수량을 임의의 변수로 취급하지 않으며 상수 만 포함하는 모든 방정식은 참 또는 거짓 일 수 있습니다. 따라서 알려지지 않은 상수를 추정 할 때 잦은 빈도는 확률을 포함하기 위해 RANDOM 간격으로 경계를 묶어야합니다. 잦은 방법은 확률이 랜덤 변수를 포함하는 하나의 구간 대신 여러 가지 다른 가능한 구간을 생성하며 그 중 일부는 알려지지 않은 상수를 포함합니다. 커버리지 확률이 합리적으로 높으면 특정 구간에 알 수없는 상수가 포함되어 있다고 주장하는 것이 합리적입니다.

베이지안은 우발적 인 양을 임의의 변수로 취급 할 때 빈번히 발트하는 것만큼이나 믿음의 도약을 할 것입니다. 사실 빈번한 네이 만 건축 방법은 그러한 믿음의 도약으로 당황스러운 문제를 드러 냈습니다. 적극적으로이를 방지하지 않으면 서 (한 가지 접근법에 대해서는 1997 년 Feldman and Cousins ​​참조), 드문 결과로 인해 분포 모수에 대한 EMPTY 신뢰 구간이 생성 될 수 있습니다. 그러한 믿음의 도약은 매우 불합리합니다! 나는이 예제를 사용하여 잦은 방법을 조롱하는 몇 명의 베이지안을 보았지만, 잦은 사람들은 일반적으로 "아직도 대부분 정확한 간격을 갖지만 허위 가정을하지 않습니다"라고 대답합니다. 나는 베이지안 / 자주 주의적 임 파스가 그들의 방법을 적용하는 대부분의 사람들에게 중요하지 않다는 것을 지적 할 것이다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.