신뢰 구간 해석에 대한 설명이 있습니까?


47

"신뢰 수준 갖는 신뢰 구간"개념에 대한 나의 현재 이해는 신뢰 구간을 여러 번 계산하려고하면 (매번 새로운 표본으로 각 시간마다) 올바른 매개 변수 를 포함한다는 것 입니다. 시각.1α1α

이것이 "진정한 매개 변수가이 간격에있을 확률"과 같지 않다는 것을 알고 있지만, 명확히하고 싶은 것이 있습니다.

[주요 업데이트]

95 % 신뢰 구간을 계산하기 전에 계산 한 구간이 실제 모수를 포함 할 확률은 95 %입니다. 신뢰 구간을 계산하고 특정 구간 얻은 후에는 더 이상 말할 수 없습니다. 우리는 진정한 매개 변수가 에있을 것이라고 95 % 확신한다고 비-종속적 인 주장을 할 수조차 없습니다 . 우리가 할 수 있다면, 이것은 다음과 같은 반례들과 모순 될 것입니다 : 정확히, 신뢰 구간은 무엇입니까?[a,b][a,b]

나는 이것을 확률 철학에 대한 토론으로 만들고 싶지 않다. 대신, 특정 구간을 보는 방법과 이유에 대한 정확하고 수학적 설명을 찾고 가 해당 구간을보기 전에 보유한 95 % 확률을 변경 (또는 변경하지 않음)합니다. "간격을 본 후 확률의 개념이 더 이상 의미가 없다"고 주장한다면 괜찮습니다 . 그것이 의미 있는 확률에 대한 해석을 해봅시다 .[a,b]

더 정확하게:

95 % 신뢰 구간을 계산하도록 컴퓨터를 프로그래밍한다고 가정 해 봅시다. 컴퓨터는 약간의 숫자 처리를 수행하고 간격을 계산하며 암호를 입력 할 때까지 간격 표시를 거부합니다. 암호를 입력하고 간격을 확인하기 전에 (그러나 컴퓨터가 이미 암호를 계산 한 후) 간격에 실제 매개 변수가 포함될 확률은 얼마입니까? 95 %이고이 부분은 논쟁의 여지가 없습니다 . 이것은 제가이 특정한 질문에 관심을 가질 확률에 대한 해석입니다 (제게 억제하고있는 주요 철학적 문제가 있으며 이것이 의도적 인 것입니다).

그러나 암호를 입력하고 컴퓨터에 계산 된 간격이 표시되도록하면 간격 (간격에 실제 매개 변수가 포함되어 있음)이 변경 될 수 있습니다. 이 확률이 절대 변하지 않는다는 주장은 위의 반례와 모순됩니다. 이 반례에서 확률은 50 %에서 100 %로 변경 될 수 있지만 ...

  • 확률이 100 % 또는 0 %가 아닌 다른 것으로 변경되는 예가 있습니까 (편집 : 그렇다면 그렇다면 무엇입니까)?

  • 특정 구간 본 후에 확률이 변하지 않는 예가 있습니까 (즉, 실제 모수가 에있을 확률 은 여전히 ​​95 %입니다)?[a,b][a,b]

  • 컴퓨터를 본 후에 일반적으로 확률 변화가 뱉어 않는 방법 (왜) ?[a,b]

[편집하다]

모든 훌륭한 답변과 유용한 토론에 감사드립니다!


1
이것은 흥미로운 점을 제공 할 수 있습니다 : en.wikipedia.org/wiki/Credible_interval
nico

P (E | C) = 1 및 P (E | C ') = 0이라고 가정하면 근거가 맞지 않습니다. 실제 간격에 실제 매개 변수 값이 포함되지 않은 경우이 후자가 반드시 외부에 있다고 설명하는 이유는 무엇입니까?
glassy

"실제 간격"또는 "최후 1"이 무슨 뜻인지 잘 모르겠습니다. 당신은 명확히 할 수 있습니까?
엘리엇

@nico 링크를 주셔서 감사합니다. 내 원래의 질문의 의도는 "내 주장은 신뢰 구간이 베이지안 신뢰할 수있는 구간으로 해석 될 수 있음을 보여주는 것처럼 보이지만, 사실이 아니기 때문에 내 추론에 문제가있는 것"이었다. 그러나 "간격이 [알 수없는] true 매개 변수를 포함 할 확률이 0 또는 1"이라는 개념에 만족하지 않는다는 것을 인정해야합니다. 나에게 그것은 동전을 뒤집어 놓은 후에 보았을 때 0이나 1이라고 동전이 착륙 할 확률이라고 말하는 것과 같습니다. 왜 1/2이 아닌지 모르겠습니다.
엘리엇

@Elliot : Schrödinger의 고양이가 떠 오릅니다 :) 나는 당신에게 적절한 설명을 해줄만큼 충분히 전문가가 아니지만, 이것에 대한 답을보고 싶습니다. 추신 : 동전도 가장자리에 떨어질 수 있다는 것을 잊지 마십시오!
니코

답변:


28

나는 근본적인 문제는 빈번한 통계가 장기 빈도를 가질 수있는 것에 대해서만 확률을 할당 할 수 있다고 생각한다. 매개 변수의 실제 값이 특정 간격에 있는지 여부에 관계없이 장기 실행 빈도가 없는지 여부에 따라 실험을 한 번만 수행 할 수 있으므로 잦은 확률을 지정할 수 없습니다. 문제는 확률의 정의에서 발생합니다. 확률의 정의를 베이지안으로 변경하면 더 이상 장기 주파수에 대한 논의와 관련이 없으므로 문제가 즉시 사라집니다.

관련 질문에 대한 내 (뺨에 혀가 아닌) 대답을 here 참조하십시오 .

" Frequentist는 아기가 사건이 발생하는 장기 주파수를 대표한다고 믿는 사람입니다. 필요한 경우, 특정 상황을 무작위 표본으로 간주하여 장기 주파수에 대해 의미있게 이야기 할 수있는 가상의 모집단을 발명 할 것입니다. 당신은 그에게 특정한 상황에 대한 질문을하는데, 그는 직접적인 대답을하지 않고 대신에 (가상 상상의) 인구에 대해 진술 할 것입니다. "

신뢰 구간의 경우 일반적으로 우리가 묻고 싶은 질문은 (예를 들어 품질 관리에 문제가없는 한) "이 샘플 데이터가 주어 졌을 때 매개 변수의 실제 값을 포함하는 가장 작은 구간을 확률로 반환합니다. 엑스". 그러나 실험은 한 번만 수행되므로 확률을 할당하는 데 사용할 수있는 장기 실행 빈도가 없으므로 잦은 주의자는이 작업을 수행 할 수 없습니다. 대신에 빈번 주의자는 당신이 수행 한 실험이 무작위 표본으로 간주 될 수있는 실험 집단 (당신이 수행하지 않은)을 발명해야합니다. 그런 다음 잦은 주의자는 특정 실험에 대해 실제로 묻고 자하는 질문에 대한 직접적인 대답보다는 가상의 실험 집단에 대한 간접적 인 대답을 제공합니다.

본질적으로 언어의 문제이며, 인구의 잦은 정의는 단순히 특정 간격에있는 매개 변수의 실제 값의 확률에 대한 논의를 허용하지 않습니다. 잦은 통계가 나쁘거나 유용하지 않다는 것을 의미하지는 않지만 한계를 아는 것이 중요합니다.

주요 업데이트에 대하여

"95 % 신뢰 구간을 계산하기 전에 계산 한 구간이 실제 모수를 포함 할 확률은 95 %입니다."라고 확신 할 수 없습니다. 빈번한 틀 안에서. 매개 변수의 실제 값이 특정 방법으로 구성된 신뢰 구간에있는 장기 빈도는 매개 변수의 실제 값이 특정 표본에 대한 신뢰 구간에있을 확률이라는 암시 적 추론이 있습니다. 우리가 사용할 데이터의. 이것은 완벽하게 합리적인 추론이지만 매개 변수의 실제 값이 특정 데이터 샘플에 대해 구성하는 신뢰 구간에있을 확률이 높기 때문에 빈번하지 않은 베이지안 추론입니다. 하나의 데이터 샘플 만 있습니다.

그러나 우리는 "진정한 매개 변수가 [a, b]에있을 확률이 95 %라고 확신하는 일종의 비-연속적 주장"을 할 수 있습니다. 그것은 정확히 베이지안 신뢰할 수있는 간격이며 많은 문제들에 대해 베이지안 신뢰할 수있는 간격 잦은 신뢰 구간과 정확히 일치합니다.

"나는 이것을 확률의 철학에 대한 토론으로 만들고 싶지 않다", 슬프게도 이것은 불가피하다. 통계의 진정한 가치가 신뢰 구간에 있는지에 대한 빈번한 확률을 할당 할 수없는 이유는 직접적인 결과이다 잦은 확률 철학의 빈번한 이론가들은 빈번한 이론가들이 자신의 철학에서 확률을 정의하는 방식과 같이 장기 빈도를 가질 수있는 것들에만 확률을 할당 할 수 있습니다. 그것은 빈번한 철학을 잘못하지는 않지만 확률의 정의에 의해 부과되는 한계를 이해하는 것이 중요합니다.

"암호를 입력하고 간격 (컴퓨터가 이미 계산 한 후)을 확인하기 전에 간격에 실제 매개 변수가 포함될 확률은 얼마입니까? 95 %이며이 부분은 논쟁의 여지가 없습니다." 부정확하거나 적어도 그러한 진술을 할 때, 귀하는 빈번한 통계의 틀에서 벗어 났으며 장기적인 빈도보다는 진술의 진실성에 대한 어느 정도의 타당성을 포함하는 베이지안 추론을 만들었습니다. 그러나 앞에서 말했듯이 완벽하게 합리적이고 자연스러운 추론입니다.

niether 이벤트에 빈번한 확률을 지정할 수 있으므로 비밀번호를 입력하기 전후에 아무것도 변경되지 않았습니다. 빈번한 통계는 특정 사건에 관한 진술의 타당성에 대한 질문을 자주하기 때문에 반 직관적 일 수 있습니다.


2
그렇습니다. 그것이 제가하는 요점입니다. 두 번째 진술은 실제로이 특정 동전에 대한 진술이 아닙니다. 그것은 대부분의 사람들이 우리의 특정 동전에 대한 진술로 잘못 해석 한 가상의 동전 집단에 대한 진술입니다. 그러나 그 도약을 위해 우리는 확률에 대한 베이지안 직감을 적용하고 실제로 신뢰 구간이 무엇인지 무시합니다. 확률의 잦은 정의에서 벗어나면 동전의 상태에 확률을 할당하는 데 아무런 문제가 없습니다.
Dikran Marsupial 2018 년

2
명확하게 말하면, "처음에 여러 개의 개별 인스턴스를 상상해보십시오. 헤드를 생산하는 사람들의 절반 정도가 머리를 기대할 것입니다."는 완벽하게 올바른 잦은 추론입니다. 그러나 거기에서 "따라서이 입자 동전이 0.5 일 확률은 0.5"일 가능성은 한 번만 발생할 수 있기 때문에 장기 실행 빈도가없는 것에 적용 될 가능성이 아닙니다. 베이지안 확률은 제안의 타당성에 대한 진술이기 때문에 완벽하게 건전한 베이지안 추론입니다 (인구 내의 장기 빈도를 기반으로 할 수 있음).
Dikran Marsupial 2016 년

1
두 질문에 대한 그의 대답은 실제로 착륙 할 가상의 동전 인구 비율에 대한 진술 일 것입니다. 그러나 사람들이 일반적으로 도움을 원하고 (간접 답변은 일반적으로 그다지 도움이되지 않음), 또한 잦은 통계는 반 직관적이며 잦은 사람들은이 점을 피하기 위해이 점을 피할 가능성이 있기 때문에 이것은 명시 적으로 보이지 않을 것입니다 혼동. 특정 플립에 대해 확률 론적 통계를 작성하기 위해 고정 된 경우, 좋은 잦은 주의자는 단순히 대답하기를 거부 할 것입니다-잦은 통계의 범위를 벗어납니다.
Dikran Marsupial 2016 년

1
본질적으로 빈번 주의자는 실제로 귀하의 질문에 대답하지 않을 것입니다. 그는 동전 뒤집기 인구에 대해 진술하고 특정 뒤집기의 머리 확률이 암시 적 인구 비율과 동일하다는 것을 추론하도록 남겨 두었습니다. . 그러나 그것은 당신의 베이지안 추론 일 것입니다.
Dikran Marsupial 2016 년

1
@Aaron 물론, 많은 가능성에 대해 "확률은 0 또는 1"이라고 말할 수 있지만, 그 대답은 우리에게 절대 아무것도 사지 않습니다 (예를 들어, 우리가 게임에 얼마나 베팅해야하는지에 대한 구체적인 질문에 대답하려는 경우 우리는 우주 왕복선을 발사해야합니다). 또한, "발생할 수있는"일들은 다음과 같습니다 : (1) 동전이 착륙 한 머리와 당신이 그것을 덮었습니다. (2) 동전이 착륙 한 꼬리와 당신이 그것을 덮었습니다. 많은 "충돌 및 덮음"시험의 "가상 인구"에서 약 50 %가 머리를 보게됩니다.
엘리엇

14

주요 업데이트, 새로운 주요 답변. 문제가있는 위치이기 때문에이 점을 명확하게 해결하려고합니다.

"간격을 본 후에는 확률의 개념이 더 이상 의미가 없다"고 주장한다면, 그것이 의미가있는 확률에 대한 해석을 해보자. "

확률 규칙은 변경되지 않지만 유니버스 모델은 변경됩니다. 확률 분포를 사용하여 모수에 대한 이전의 신념을 수량화 할 의사가 있습니까? 데이터를 본 후 확률 분포를 업데이트하는 것이 합리적입니까? 그렇게 생각하면 와 같은 문장을 만들 수 있습니다 . 내 사전 분포 는 일반적으로 이해되는 무작위성 뿐만 아니라 자연의 진정한 상태에 대한 나의 불확실성을 나타낼 수 있습니다. 즉, 항아리에있는 빨간 공의 수에 사전 분포를 할당하는 경우 빨간 공의 무작위입니다. 고정되어 있지만 확실하지 않습니다.P(θ[L(X),U(X)]|X=x)

내가이 말을했지만, 당신이 전화를 할 의향이없는 경우를 포함하여 몇몇 사람들 확률 변수 다음 문 아니다 의미있는. 내가 빈번한 사람이라면 를 고정 된 수량으로 취급 하고 확률 분포를 밝힐 수는 없습니다. 왜? 그것이 고정되어 있고, 확률에 대한 나의 해석은 장기 주파수와 관련이 있습니다. 항아리 안에있는 빨간 공의 개수는 변하지 않습니다. 는 입니다. 공을 몇 개 뽑으면 임의의 샘플이 있습니다. 무작위 샘플을 여러 개 가져 오면 어떤 일이 일어날 지 물어볼 수 있습니다. 즉, 대해 이야기 할 수 있습니다.P ( θ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ [ L ( X ) , U ( X ) ] )θP(θ[L(X),U(X)]|X=x)θθθP(θ[L(X),U(X)]) 간격은 샘플에 따라 다르므로 (기다리십시오!) 무작위입니다.

그러나 당신은 그것을 원하지 않습니다. 원합니다. 관찰 된 (이제 고정 된) 샘플로 구성한이 간격이 매개 변수를 포함 할 확률은 얼마입니까? 그러나 일단 당신이 에 조건을 설정하고 나면 빈번한 사람은 아무것도 남지 않으며 문장 는 어떤 의미에서도 의미가 없습니다.X = x P ( θ [ L ( X ) , U ( X ) ] | X = x )P(θ[L(X),U(X)]|X=x)X=xP(θ[L(X),U(X)]|X=x)

에 대해 진술하는 유일한 원칙적 방법 (IMO) 은 (사전) 확률 분포를 갖는 모수에 대한 불확실성을 정량화하는 것입니다. Bayes Theorem을 통해 새로운 정보로 배포판을 업데이트하십시오. 내가 본 다른 모든 접근법은 Bayes에 대한 부족한 근사치입니다. 당신은 확실히 빈번한 관점에서 그것을 할 수 없습니다.P(θ[L(X),U(X)]|X=x)

즉, 베이지안 관점에서 전통적인 잦은 절차를 평가할 수 없거나 (예를 들어 신뢰 구간은 균일 한 사전에 따라 신뢰할 수있는 구간 일뿐 아니라) 잦은 관점에서 베이지안 추정자 / 신뢰할 수있는 구간을 평가하는 것이 가치가 없다고 말하는 것은 아닙니다 (그렇다고 생각합니다). 고전적 / 자주적 통계는 쓸모 없다고 말할 수 없습니다. 그것이 무엇이며, 우리는 그것을 더 만들려고 노력해서는 안됩니다.

우주에 대한 믿음을 나타 내기 위해 매개 변수에 사전 분포를 제공하는 것이 합리적이라고 생각하십니까? 그것은 당신이하는 당신의 의견에서 나온 것처럼 들립니다; 내 경험에 따르면 대부분의 사람들은 동의 할 것입니다 (@ G. Jay Kerns의 답변에 대한 나의 의견에서 약간의 반 농담입니다). 그렇다면 Bayesian 패러다임은 대한 진술을 논리적이고 일관된 방법으로 제공합니다 . 잦은 접근 방식은 그렇지 않습니다.P(θ[L(X),U(X)]|X=x)


1
(+1) 다시 한 번 잘 수행하고 죽은 중심을 찾으십시오.

+1 위와 같은 설명 (G. Jay Kerns의 답변 참조); 정말 도움이되었습니다.
엘리엇

현상금 schmounty :) 나는 당신이 도움이 발견 기쁘다.
JMS

11

자, 이제 말하고 있습니다! 이 주요 업데이트 질문에 맞지 않기 때문에 이전 답변을 삭제하기로 투표했습니다.

이 새롭고 업데이트 된 질문에서 정통 잦은 해석 아래 95 % 신뢰 구간을 계산하는 컴퓨터를 통해 다음과 같은 질문에 대한 답변을 얻을 수 있습니다.

  1. 아니.
  2. 아니.
  3. 간격이 관찰되면 더 이상 무작위가 아니며 변경되지 않습니다. (간격이 이었을 수도 있습니다.) 그러나 θ 는 변하지 않으며 결코 변하지 않았습니다. ( θ = 7 일 수 있습니다.) 컴퓨터가 7을 계산하는 구간의 95 %가 7을 계산하기 때문에 확률이 95 %에서 0 %로 변경되지만 [ 1 , 3 ] 구간의 100 %는 7을 포함하지 않습니다.[1,3]θθ=7[1,3]

(실제로, 실험자는 실험자가 이라는 것을 결코 알지 못합니다. 즉, 실험자는 [ 1 , 3 ]이 θ를 덮을 확률 이 0인지 1 인지 알 수 없음을 의미합니다 . (S) 그는 단지 말할 수 있습니다. 즉, 실험자는 컴퓨터 간격의 95 %가 θ를 포함 한다고 말할 수 있지만 이미 알고 있습니다.θ=7[1,3]θθ

질문의 정신은 관찰자의 지식 과 그것이 가 어디에 있는지에 대한 힌트를 계속 암시 합니다. 당신은 아직 그것을 보지 않고 간격 계산 컴퓨터에 대한 암호에 대해 얘기했다 이유는 (아마도)이다 . 나는 당신의 의견에서 답이 불만족 스럽거나 부적절하게 0 또는 1에 커밋 할 의무가있는 것처럼 보 였는데, 왜 우리는 그것이 87 %, 15 / 16 또는 99 % 라고 믿을 수 없었습니까 ?? ? 그러나 그것은 빈번한 틀의 힘과 동시에 아킬레스의 발 뒤꿈치입니다. 관찰자의 주관적인 지식 / 믿음은 무의미합니다. 중요한 것은 장기 상대 주파수입니다. 더 이상 아무것도 없습니다.θ15/16

최종 BTW : 확률에 대한 해석을 변경하면 (이 질문에 대해 무심코 선택하지 않은 경우) 새로운 답변은 다음과 같습니다.

  1. 예.
  2. 예.
  3. 확률 = 주관적 지식 또는 신념 수준 및 관찰자의 지식이 변경 되었기 때문에 확률이 변경됩니다. 우리는 사전 / 사후 분포에 대한 지식을 나타내고, 새로운 정보가 이용 가능 해지면 전자는 후자 (베이 즈 규칙을 통해)로 변형됩니다.

(그러나 전체 공개의 경우 설명하는 설정이 주관적인 해석과 잘 맞지 않습니다. 예를 들어, 컴퓨터를 켜기 전에도 사전에 95 %의 신뢰할 수있는 간격이 있으며 컴퓨터를 켜고 사용하기 위해 컴퓨터를 사용합니다. 우리는 95 % 후방 신뢰할 수있는 간격으로 보통 이전보다 상당히 더 얇습니다.)


다시! :) 잘 했어.
JMS

3
나는 베이지안 확률 확률이 반드시 주관적이지 않다는 것을 지적해야한다. 그래서 그것은 종종 잦은 접근의 힘이 아니다. "코인 랜딩 헤드 업 문제의 가능성"에 대한 객관적인 베이지안 접근법의 경우, 정보없는 사전을 사용하는 것은 전혀 주관성을 포함하지 않습니다. 잦은 접근 방식의 실제 강점은 품질 관리와 같은 문제에 있으며 반복되는 시도와 장기 빈도에 대해 이야기하는 것이 당연합니다. 특정 이벤트에 대해 질문 할 때 어려움이 있습니다.
Dikran Marsupial 2018 년

@JMS 감사합니다. @Dikran, 컴퓨터 화면의 작은 상자에 544 자로 이야기하기가 어렵습니다. 간단히 : "베이지안"이라는 단어가 "주관적"과 동의어가 아니라는 점에 동의합니다. 그리고 두 접근 방식의 진정한 강점이 실제로 어디에 있는지를 파악하려고 노력할 필요는 없습니다. 결론 : 우리는 모두 장기 상대 주파수에 동의 할 수 있지만, 종종 후부는 내 것과 다를 수 있습니다.

2
@Dikran Marsupial 당신은 좋은 지적을합니다. 장난감 문제를 지나서 실제 적용된 모델링으로 옮기면 사전 분배 자체가 아닌 가능성을 지정하는 방법을 통해 정말로 중요한 주관성이 종종 나타나는 경우가 종종 있습니다. 기타). 이러한 방식으로 주관성은 모델 기반 통계의 많은 부분, 베이지안 및 잦은 주의자 모두에 내장됩니다.
JMS

+1 아름다운 답변 감사합니다. 이것은 분명히 현상금이 필요하지만 정치가되는 것을 피하기 위해 나는 투표에 빠졌습니다.
엘리엇

6

나는 내 두 센트를 던질 것이다. 빈도주의에, 신뢰 구간 자체는 2 차원 확률 변수는 본질에 있습니다 경우 당신이 실험에게 gazillion 시간을 다시 것, 신뢰 구간은 당신 것입니다 추정 (예 : 새로 발견 된 데이터에서 각 시간을 계산)마다 다를 것입니다 . 따라서 구간의 두 경계는 랜덤 변수입니다.

따라서 95 % CI는이 임의 변수 세트가 95 %의 경우에 실제 값 (매우 빈번한 표현)을 포함한다는 보장 (이 CI로 이어지는 모든 가정이 정확함)을 의미합니다.

표준 정규 분포에서 평균 100 개의 드로우에 대한 신뢰 구간을 쉽게 계산할 수 있습니다. 그런 다음 해당 표준 정규 분포에서 10000 곱하기 100 값을 그리고 매번 평균의 신뢰 구간을 계산할 때 실제로 0에 약 9500 번 있음을 알 수 있습니다.

당신은 사실 (실제 데이터에서) 한 번만 신뢰 구간을 생성 참에있는 진정한 가치의 확률을 줄일 않습니다 0 또는 1 중 하나에 간격을하지만, 그것은으로 신뢰 구간의 확률을 변경하지 않습니다 실제 값을 포함하는 임의 변수.

그래서, 결론 : 가능성 있는 진정한 가치 (95 %)은 변경되지 않습니다를 포함하는 95 % 신뢰 구간 (즉, 평균), 어느 쪽도 아니는 진정한 가치를 포함하기위한 특정 구간 (CI 또는 무엇이든)의 확률을한다 (0 또는 1). 컴퓨터가 알고있는 구간의 확률이지만 실제로는 0 또는 1이 아닙니다 (특정 구간이기 때문에). 알지 못하기 때문에 (빈번한 방식 으로이 동일한 구간을 다시 계산할 수 없습니다) 같은 데이터에서 다시 여러 번), 당신이해야 할 모든 간격의 확률입니다.


재미있는 참고 사항 :이 사이트의 맞춤법 검사기는 잦은 단어가 굵은 밑줄로 표시되는 것을 발견했습니다. 이 사이트는 베이지 안에서 비밀리에 마스터됩니까? 아, 나는 그것이 아닌 것 같아요 베이 즈는 자신의 곱슬 밑줄 :-)이 있기 때문에
닉 Sabbe

4

신뢰 구간이 "참 매개 변수가 구간에있을 확률"을 지정하지 않는 이유는 구간이 지정되면 매개 변수가 해당 구간에 있거나 그렇지 않기 때문입니다. 그러나 예를 들어 95 % 신뢰 구간의 경우 값이 포함 된 95 % 신뢰 구간을 만들 가능성이 있습니다. 이것은 이해하기 어려운 개념이므로 잘 표현하지 못할 수 있습니다. 자세한 설명 은 http://frank.itlab.us/datamodel/node39.html 을 참조 하십시오 .


2
신뢰 구간을 계산하기 위해 컴퓨터를 프로그래밍한다고 가정하지만 출력을 보지는 않습니다. 결과를보기 전에 간격에 올바른 매개 변수가 포함되었을 가능성이 95 %라는 것을 알고 있습니다 (코인 플립의 결과를보기 전과 마찬가지로 50 %의 확률이 있음을 알고 있습니다). 처음에 올바른 매개 변수를 모르는 경우 출력을 보는 방식 으로이 확률이 어떻게 변경됩니까 (동전 플립의 결과를 보면 머리의 확률이 50 %에서 1로 변경된다는 데 동의합니다) 또는 0)?
엘리엇

또한, 나는 구별이 있다는 것에 동의하지만, 위의 "인수"가 그들이 똑같다는 것을 보여주는 무엇이 잘못되었는지 궁금합니다.
엘리엇

2
@Elliott 당신의 질문은이 비유와 같은 것 같습니다 : 당신은 공정한 동전을 뒤집습니다. Ergo, 헤드 확률은 50 %입니다. 이제 동전을 보면 머리입니다. 이것은 머리의 확률을 어떻게 바꾸는가? 대답은 그렇지 않다는 것입니다. 확률은 결과가 아니라 동전 튀기는 절차를 의미하기 때문입니다. 절차가 매개 변수를 포함하는 50 %의 기회를 가질 수 있지만 : 당신이 유사한 방식으로 작품을 참조 반례가 나에게 보인다 는 사실 후에 는 매개 변수가 실제로 포함되어 있는지 확인 할 수있다된다. 그래서 무엇?
whuber

저는 공정한 동전이 나올 확률을 바꾸는 것에 대해 이야기하고 있지 않습니다. 대신, 나는이 특정 동전이 머리가 될 확률을 변경하는 것에 대해 이야기하고 있습니다. 뒤집어 본 후 살펴보기 전에, 그러한 경우의 약 절반이 동전이 들어 있기 때문에 문제의 가능성은 50 %라고 주장합니다. 반면에, 내가 그것을보고 머리를 본 후, 그러한 경우의 100 %는 머리를 가진 동전을 포함합니다 (꼬리를 보았을 때 꼬리가있는 경우는 제거되었고 머리를 보지 못했습니다).
엘리엇

사실 이후에 해당 매개 변수가 적용되었는지 확인할 수 있음에 동의합니다. "그래서 뭐?"에 대한 나의 대답 "따라서 (원래 질문에서) 위의 주장은 틀렸어 야하며, 무엇이 잘못되었는지 궁금합니다."
엘리엇

4

잦은 주의자가 특정 표본에 대한 신뢰 구간에있는 통계의 실제 (인구) 값이있을 가능성이 있다고 생각하지 않습니다. 그것은 아니거나 그렇지 않지만 특정 사건에 대한 장기 실행 빈도는 없으며 통계 절차의 반복적 인 수행으로 얻을 수있는 사건의 집단 만 있습니다. "우리는 신뢰 구간의 95 %가 통계치의 실제 값을 포함 할 것"과 같은 진술을 고수해야하지만, "진정한 값이이 특정 계산에 대해 계산 된 신뢰 구간에있을 확률은 없다" 견본". 이것은 p의 모든 값에 해당되며 확률이 실제로 무엇인지에 대한 잦은 정의로는 불가능합니다. 베이지안은 믿을만한 간격을 사용하여 그러한 진술을 할 수 있습니다.


3

E[a,b]

E~(L(X),U(X))

편집 : @G. Jay Kerns는 나보다 더 나은 논증을하고 더 빨리 타이핑하므로 아마도 따라갈 것입니다. :)


[a,b]

2
|

잘 모르겠습니다. :-)

2

E[a,b]ECCP(E|C)=P(E)P(E|C)=P(E)

P(E|C)=1P(E|C)=0


이 특정 구간 [a, b]에 실제 매개 변수가 포함 된 이벤트로 C를 정의한 경우, E와 C / C '가 독립적이라는 것에 확신이 없습니다. .
엘리엇

그러나 C는 랜덤 변수입니다! 모든 것이 이미 발생한 후 이러한 모든 이벤트의 정의를 변경하고 있습니다. 달리 말하면 C를이 특정 이벤트로 정의하는 경우 C는 더 이상 신뢰 구간이 아닙니다.
raegtin

2
문제는 C가 구간이 실험의이 특정 실행에서 실제 매개 변수를 포함하는 이벤트 인 경우 실행 빈도가 길지 않으므로 (특정 실행은 한 번만 발생할 수 있음) 할당 할 수 없다는 것입니다 그것에 대한 빈번한 확률. 이것이 잦은 신뢰 구간의 정의가 반복 실험 집단에 관한 이유입니다. 베이지안 추론을 빈번한 설정에 적용한 것으로 보이며 확률 정의가 일치하지 않습니다.
Dikran Marsupial 2016 년

그것을 보는 또 다른 방법이 있습니다. 당신이하고있는 것 같습니다 다음과 같습니다 : 신뢰 구간 [a, b]를 얻기 위해 계산을 실행합니다. 이 특정 신뢰 구간 [a, b]에 실제 모수가 포함 된 이벤트가되도록 C를 정의하십시오. 또한이 특정 구간 [a, b]에 참 매개 변수가 포함 된 이벤트로 E를 정의하십시오. 따라서 E와 C는 같은 사건입니다!
raegtin

그것이 당신이 실제로하고있는 일입니다. 당신은 것 같다 생각 다음 (당신이하지 않은) 일을하는지 : 실행 계산 # 1 간격을 얻을 수를 [A, B]. 이 특정 구간 [a, b] 에 참 매개 변수가 포함 된 이벤트로 E를 정의하십시오 . 다음으로 계산 # 1을 잊고 다른 계산 된 간격 [a ', b']에 참 매개 변수가 포함 된 이벤트로 C를 정의하십시오. 이 경우 E와 C는 독립적입니다.
raegtin

2

여기에 너무 많은 설명이있어서 읽을 시간이 없습니다. 그러나 기본 질문에 대한 대답은 짧고 달콤 할 수 있다고 생각합니다. 데이터에 무조건적인 확률의 차이입니다. 데이터를 수집하기 전에 1- 알파의 확률은 잘 정의 된 절차에 매개 변수가 포함될 확률입니다. 데이터를 수집하고 간격을 생성 한 특정 간격을 알고 나면 매개 변수가 상수이므로이 조건부 확률은 0 또는 1입니다. 그러나 매개 변수의 실제 값도 알지 못하므로 데이터를 수집 한 후에는 어떤 값인지 알 수 없습니다.

Michael Chernick의 게시물 확장은 양식 주석을 복사했습니다.

완벽한 추정이라고 할 수있는 병리학 적 예외가 있습니다. X (n) = pX (n-1) + en에 의해 주어진 1 차 자기 회귀 과정이 있다고 가정하자. p가 1 또는 -1이 아니며 절대 값이 1보다 작다는 것을 알 수 있습니다. 이제 en은 혼합 분포와 동일하게 독립적으로 분포되어 있으며 en = 0이라는 양의 확률 q가 있습니다.

완벽한 추정이라고 할 수있는 병리학 적 예외가 있습니다. X (n) = pX (n-1) + en에 의해 주어진 1 차 자기 회귀 과정이 있다고 가정하자. p가 1 또는 -1이 아니며 절대 값이 1보다 작다는 것을 알 수 있습니다.

이제 en은 혼합 분포로 독립적으로 동일하게 분포되어 있으며 en = 0 인 양의 확률 q가 있고 확률 1-q의 경우 절대적으로 연속적인 분포를 갖습니다 (예 : 밀도가 0에서 떨어진 간격으로 0이 아님). 시계열에서 데이터를 순차적으로 수집하고 각 연속 값 쌍에 대해 p (X (i) / X (i-1))로 추정합니다 .ei = 0 일 때 비율은 p와 정확히 같습니다.

q가 0보다 크므로 결국 비율은 값을 반복하고 해당 값은 매개 변수 p의 정확한 값이어야합니다. 0이 아닌 ei 값이 아닌 경우 확률 0 및 ei / x (i -1) 반복하지 않습니다.

따라서 순차적 중지 규칙은 비율이 정확하게 반복 될 때까지 샘플링 한 다음 반복 된 값을 p의 추정치로 사용합니다. 이 추정값을 중심으로 구성하는 간격은 정확히 p이므로 true 모수를 포함 할 확률 1입니다. 이것은 실용적이지 않은 병리 적 예이지만 오류 분포에 필요한 속성을 가진 고정 확률 적 프로세스가 존재합니다.


2
대신 몇 가지 주석 과정에서 설명한 예제를 답변에 추가하는 것을 고려 했습니까?
Macro

@Michael 두 번째로 Macro의 의견을 말씀 드리겠습니다. 의견은 일반적으로 다른 사용자와 상호 작용하는 방법으로 생각되며 (예 : 설명을 요청할 때 등) 경우에 따라 ' 스택 교환3 급 시민 '으로 간주되기도 합니다. 그러나 가장 최근의 교환에 이어이 일련의 의견을 진행하는 방법을 결정하도록하겠습니다. 이 발언은 여기 에있는 다른 일련의 주석에 적용됩니다 .
chl

누군가가 답변이 실제로 질문에 대한 답변이 아니라고 판단 할 때 많은 토론이있는 답변을 공표하는 정책이 있기 때문에 답변에 의견을 쓰지 않습니다. 따라서 답변은 답변을 제공하고 의견은 의견 아래에 있습니다. 내 의견은 글자 수 한도를 초과하는 경향이 있으므로 몇 가지를 사용합니다.
Michael Chernick

@MichaelChernick 해당 정책이 없으므로 귀하의 의견을 게시물에 통합했습니다.

1
@MichaelChernick, 나는이 사이트에 약 1 년 동안 정기적으로 게시 해 왔으며 중재자가 압제 적이거나 사이트 규칙이 혼란 스럽다고 제안하는 사람은 없었습니다. 다시 발생하는 문제 : 게시물은 FAQ에서 명시 적으로 논의 된 내용입니다.
매크로

1

여전히 도움이 될 수있는 많은 질문과 답변에 대한 두 가지 관찰.

혼란의 일부는 1940 년대 경까지 확고한 수학적 기반에 있지 않은 좀 더 깊은 확률 이론에 대한 글로스에서 나온 것이다. 그것은 샘플 공간, 확률 공간 등을 구성하는 것에 들어갑니다.

먼저, 동전 뒤집기 후에는 머리가 올라 오면 꼬리가 나오지 않을 확률이 0 %라는 것을 알았습니다. 이 시점에서 확률에 대해 이야기하는 것은 이치에 맞지 않습니다. 무슨 일이 있었는지, 우리는 알고 있습니다. 확률은 미래에 알려지지 않았으며 현재에 알려지지 않았습니다.

제로 확률이 실제로 무엇을 의미하는지에 대한 작은 결론으로, 이것을 고려하십시오 : 우리는 공정한 수의 확률로 머리가 올 확률이 0.5이고 꼬리가 올 확률이 있다고 가정합니다. 이는 결과가 MECE (상호 배타적이고 완전히 철저한)이므로 100 % 확률로 머리 꼬리 가 나올 수 있음을 의미합니다 . 그러나 머리와 꼬리를 구성하는 데는 0 %의 변화가 있습니다 . '머리'와 '꼬리'에 대한 우리의 개념은 상호 배타적이라는 것입니다. 따라서, 우리가 '코인 던지기'를 생각하거나 정의하는 방식으로 는 불가능 하기 때문에 이것은 확률이 0 % 입니다. 그리고 던지기 전후에는 불가능합니다.

정의에되지 않습니다에 추가 추론, 아무것도, 불가능은 이다 가능. 실제로는 변호사가 "이 문서에 서명하여 잊어 버릴 수 없습니까?"라고 묻는 것이 싫습니다. 질문의 본질 상 대답은 항상 '예'이기 때문입니다. 그 문제에 대한 답은 "물론 화를 통해 행성 Remulak 4로 이송되어 무언가를 수행 한 다음 기억하지 않고 다시 수송 할 수 없는가?"라는 질문에 대한 '예'입니다. 가능성은 매우 낮을 수 있지만 불가능하지 않은 것은 가능합니다. 우리의 규칙적인 확률 개념에서 우리가 동전 뒤집기에 대해 이야기 할 때 동전이 나올 수 있습니다. 꼬리가 나올 수 있습니다. 그리고 그것은 심지어 선상에 있거나 (어떻게 든, 우리가 약물을 복용하고 궤도에 오르는 동안 우주선에 찔린 것처럼) 공중에 영원히 떠오를 수도 있습니다. 하지만 던지기 전후에 동시에 꼬리 : 실험의 표본 공간에서 상호 배타적 인 결과입니다 ( '확률 표본 공간'및 '시그마 대수'참조).

둘째, 신뢰 구간에 대한이 베이지안 / 자주주의 철학에서, 빈번 주의자로 행동하는 경우 빈도와 관련이있는 것이 사실이다. 따라서 표본 평균과 추정 평균의 신뢰 구간이 95 %라고 말하면 '실제'값이 경계 사이에 있다고 95 % 확신 할 수 없습니다. 우리는이 실험을 반복해서 반복 할 수 있다면, 시간의 95 %가 평균이 실제로 한계 사이에 있다는 것을 알게 될 것입니다. 그러나 우리가 한 번의 실행으로 그것을 할 때, 우리는 정신적 인 지름길을 취하고 '우리가 옳다고 95 % 확신합니다.'라고 말합니다.

마지막으로 실험을 기반으로 한 가설 검정의 표준 설정이 무엇인지 잊지 마십시오. 식물 성장 호르몬이 식물을 더 빨리 자라게하는지 알고 싶다면, 6 개월의 성장 후 토마토의 평균 크기를 먼저 결정해야합니다. 그런 다음 호르몬을 사용하여 반복하고 평균 크기를 얻습니다. 우리의 귀무 가설은 '호르몬이 효과가 없었습니다.'라는 것 입니다 . 그러나 시험 된 식물이 평균적으로 99 %의 신뢰도로 더 큰 경우, 이는 식물에 의해 항상 무작위 변이가 있고 얼마나 정확하게 계량 할 수 있는지를 의미하지만,이를 설명 할 수있는 임의의 양은 1보다 적을 것입니다. "백에 시간."


1

이 문제는 사전 및 사후 확률의 혼란 또는 특정 랜덤 변수의 공동 분포를 모르는 불만으로 특징 지을 수 있습니다.

조절

n1nXYXYP(X=xY=y)=1/(n(n1))x,yN:={1,,n}xyP(X=x)=1/nP(Y=x)=1/nxN

tP(X=x)=1/nxNxNX=xP(X=x|Y=t)=P(X=xY=t)/P(Y=t)xt1/(n1)x=t0X=xY=tX=xX=xY=tP(X=x)=P(Y=x)=1/nxN

증거를 조건화하지 않으면 증거를 무시하는 것을 의미합니다. 그러나 우리는 확률 모델에서 표현할 수있는 것에 만 의존 할 수 있습니다. 항아리에서 나온 두 개의 공을 사용한 예에서는 날씨 나 오늘의 느낌을 조절할 수 없습니다. 그러한 증거가 실험과 관련된 증거라고 생각할만한 이유가있는 경우,이 증거를 공식적인 사건으로 표현할 수 있도록 먼저 모델을 변경해야합니다.

CC=1X<YP(C=1)=1/2tP(C=1|Y=t)=(t1)/(n1)P(C=1|Y=1)=0C=1P(C=1|Y=n)=1C=1P(C=1)=1/2

신뢰 구간

X=(X1,,Xn)n(l,u)γXluRnθRP(l(X)θu(X))γ

C(l,u)C=1l(X)θu(X)P(C=1)γ

x=(x1,,xn)RnxiXiiC=1δ:=P(C=1|X=x)01(C=1X=x)((l(x)θu(x))X=x)l(x)θu(x)δ=0l(x)θu(x)X=xδ=1l(x)u(x)xδ{0,1}

P(C=1)γC=1x[l(x),u(x)][l(x),u(x)]θγ,이 증거를 인정하고 동시에 무시하는 것을 의미합니다.

더 많이 배우고 덜 알기

δXYxRP(X=x)P(Y=x)P(X=xY=y)x,yR(X,Y)

Y=7XP(X=x)x(x,7)xRxP(X=x)Y=7Y=77P(X=x)X=xP(X=x|Y=7)=P(X=xY=7)/P(Y=7)

YX


0

과거에 주어진 게임에서 xbar-2sd (x)와 xbar + 2sd (x) 사이의 닉스 점수가 약 .95 일 확률을 말한다면, 이는 농구 점수 분포에 대한 특정 분포 가정을 감안할 때 합리적인 진술입니다. . 몇 가지 게임 샘플이 주어진 점수에 대한 데이터를 수집하고 해당 간격을 계산하면 과거의 특정 날짜에 해당 간격에서 점수가 올 확률은 분명히 0 또는 1이며 게임 결과를 Google에서 찾을 수 있습니다. 잦은 가능성을 제로가 아니거나 하나의 확률로 유지한다는 유일한 개념은 반복 샘플링에서 비롯되며 특정 샘플의 인터벌 추정 실현은 샘플이 발생했거나 샘플의 인터벌 추정을 제공하지 않은 마술 포인트입니다. . 비밀번호를 입력하는 지점이 아닙니다.

이것이 Dikran이 위에서 주장한 바이며, 나는 그의 대답에 투표했습니다. 반복 된 표본이 고려 되지 않는 시점은 위의 예와 같이 비밀번호를 입력 할 때나 내 결과의 Google을 검색 할 때가 아니라 비 이산 확률이 얻을 수없는 잦은 패러다임의 시점 입니다. 닉스 게임이지만 샘플 수 = 1 인 시점.


0

모델링

S=(Ω,Σ,P)EΣP(E)ESS

단계 (1)에 약간의 여유가있을 수 있습니다. 모델링의 적합성은 때때로 특정 사건의 확률을 우리가 직관적으로 기대하는 것과 비교하여 테스트 할 수 있습니다. 특히, 특정 한계 또는 조건부 확률을 보면 모델링이 얼마나 적절한 지 알 수 있습니다.

X1,,XnDist(θ)θR

신뢰 구간 추정기

γLRRnP(L(X)θR(X))γX=(X1,,Xn)L(X)R(X)xRnL(x)θR(x)

환경 설정

γ1γ2γ1<γ2첫 티켓을 뽑을 때보 다 우승 티켓이 될 확률이 높습니다. 관측치를 생성 한 랜덤 프로세스의 확률 적 속성에 기반한 다른 관측치 (이 예에서는 두 개의 티켓)에 대한 선호도는 양호합니다. 우리는 어떤 티켓이든 승자가 될 가능성이 높다고 말하지 않습니다. 우리가 그렇게 말하면 구어체 적 의미에서 "확률"을 갖는 것은 무엇이든 의미 할 수 있으므로 여기서 피하는 것이 가장 좋습니다.

0.95

간단한 선행 예제

θP(θ=0)=P(θ=1)=1/2ϑRθ=ϑX1,,XnN(ϑ,1)L,RγϑRP(L(X)ϑR(X)|θ=ϑ)γP(L(X)θR(X))γ

xRn(X1,,Xn)θL(x)R(x)P(L(x)θR(x)|X=x)fμnμσ=1

P(L(x)θR(x)|X=x)={f0(x)f0(x)+f1(x)if L(x)0R(x)<1f1(x)f0(x)+f1(x)if 0<L(x)1R(x)1if L(x)0 and 1R(x)0else
γθL(X)θR(X)γ

θxx{μ0,μ1}={0,1}

P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)

0

"참 매개 변수가이 신뢰 구간에있을 확률"이라고 말할 수 있다면 표본의 크기를 고려하지 않을 것입니다. 표본의 크기에 관계없이 평균이 같으면 신뢰 구간이 동일하게 넓어집니다. 그러나 우리가 "이 100 번 반복한다면, 95 개의 경우에 실제 매개 변수가 구간 내에있을 것이라고 예상 할 것입니다", 우리는 표본 크기의 크기와 추정치의 정도를 고려합니다 . 표본 크기가 클수록 평균 추정값의 분산이 줄어 듭니다. 따라서 그다지 변하지 않으며 절차를 100 번 반복 할 때 95 중 실제 매개 변수가 간격에 있는지 확인하기 위해 큰 간격이 필요하지 않습니다.


신뢰 구간은 빈번한 개념입니다.
Michael Chernick
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.