예측 적 추론에 대한 비 베이 아시안 방법이 있습니까?


22

베이지안 추론에서, 미래 데이터에 대한 예측 분포는 알려지지 않은 파라미터를 통합함으로써 도출된다; 이러한 모수의 사후 분포에 통합하면 사후 예측 분포 (이미 관찰 된 데이터에 조건부 미래 데이터에 대한 분포)가 제공됩니다. 모수 추정치의 불확실성을 고려하는 예측이 아닌 비 예측 방법이 있습니까?

모든 사람은 선형 회귀 후 예측 간격을 계산하는 방법을 알고 있지만 계산의 원리는 무엇이며 다른 상황에서 어떻게 적용 할 수 있습니까 (예 : 데이터에서 속도 매개 변수를 추정 한 후 새로운 지수 변동에 대한 정확한 예측 간격 계산)?


6
나는 이것이 훌륭한 질문이라고 생각하고 적어도 부분적인 답변을 제공하고 싶지만 아마도 잠시 동안 정의를 할 시간이 없을 것입니다 ... 그래서 지금은 현상금을 부과 할 것입니다. .
Glen_b-복지 주 모니카

3
@ DavidC.Norris 필자는 왜 그것을 넘어서는 다른 매개 변수 불확실성 소스가 있어야한다고 주장 해야하는지 알지 못합니다 (예측 추론은 프로세스 자체의 랜덤 변동과 그에 대한 임의의 가변성을 모두 고려해야하기 때문입니다). 그것 자체는 상당히 기본적인 예에서도 사소한 것이 아닙니다. 예를 들어 푸 아송 또는 음의 이항 회귀에서 예측의 합계에 대한 예측 간격을 생성하십시오. 카테고리별로 매개 변수 (예 : 혼합 모델을 사용한 사람들)에 차이가 있다고 가정하기 위해 베이지안 일 필요는 없습니다.
Glen_b-복지 주 모니카

2
@ DavidC.Norris : 베이 저 통계에 대한 모든 소개에서 사후 예측 분포 계산이 다루어 지지만 예측 간격을 계산하는 일반적인 잦은 방법은 널리 알려지지 않았기 때문에 비 베이지 방법에 대해 간단히 물었습니다.
Scortchi-Monica Monica 복원

2
@EngrStudent, 부트 스트랩은 원본 데이터를 리샘플링하여 작동하므로 불확실성의 원인으로 샘플링 변동 만 처리하는 다른 빈번한 방법과 동일한 범주에 속합니다. 불확실성 자체의 개념을 확장하지는 않습니다.
David C. Norris

3
@ DavidC.Norris : 됩니다 - 미래의 관측보다는 매개 변수에 대한 추론의 예측에 영향을 미치는로 - 불확실성의 원천으로 변화를 샘플링 나는 비 베이지안 방법은 불확실성의 계정 다른 종류를 고려하기보다는, 여기에 관심있어있다.
Scortchi-Monica Monica 복원

답변:


20

비 Bayesian 예측 추론 (SLR 사례 제외)은 비교적 최근의 분야입니다. "베이지 아가 아닌"이라는 제목 아래에서 우리는 접근 방식을 "고전적인"빈번한 접근 방식과 "우연성"기반의 접근 방식으로 세분화 할 수 있습니다.

고전적 빈번한 예측

아시다시피, 빈번한 "골드 표준"은 반복 샘플링에서 공칭 범위를 달성하는 것입니다. 예를 들어 95 % 신뢰 영역에 동일한 기본 모집단의 표본 중 95 %에 실제 모수가 포함되도록합니다. 또는 평균 β 와 같은 가설 검정에서 유형 I 및 II 오류를 저지를 것으로 예상됩니다 . 마지막으로,이 질문과 관련하여 95 % 예측 간격에 다음 샘플 포인트 95 %가 포함될 것으로 예상 합니다.αβ

이제 저는 일반적으로 대부분의 통계 과정에서 고전적인 PI를 제시하고 가르치는 방법에 대해 문제를 겪었습니다. 압도적 인 경향은 이것을 베이지안 후부 예측 간격으로 해석하는 것이기 때문 입니다. 가장 근본적으로, 그들은 다른 확률에 대해 이야기하고 있습니다! Bayesian은 반복적 인 양의 샘플링 성능에 대해 주장하지 않습니다 (그렇지 않으면 빈번하게 사용됩니다). 둘째, 베이지안 PI는 실제로 고전 예측 간격보다 고전 공차 구간과 더 유사한 정신을 달성하고 있습니다.

참조 : 공차 구간두 가지 확률 로 지정해야합니다 . 신뢰와 적용 범위. 자신감은 반복 샘플에서 얼마나 자주 정확한지 알려줍니다. 적용 범위는 실제 분포 하에서 구간 의 최소 확률 측정치 를 알려줍니다 (PI와는 반대로, 반복 된 샘플링 에서 예상 확률 측정 을 제공합니다 ). 이것은 기본적으로 베이지안 PI가 시도하고 있지만 반복 샘플링 주장이없는 것입니다.

따라서 Stats 101 단순 선형 회귀의 기본 논리는 정규성 가정 하에서 PI의 반복 샘플링 특성을 도출하는 것입니다. 일반적으로 "고전적"으로 생각되며 인트로 스탯 수업에서 가르치는 잦은 + 가우시안 접근 방식입니다. 이는 결과 계산의 단순성에 기반합니다 (자세한 개요는 Wikipedia 참조 ).

비 가우시안 확률 분포는 간격을 얻기 위해 깔끔하게 뒤집을 수있는 중추적 양 이 부족할 수 있기 때문에 일반적으로 문제가 됩니다. 따라서 간격의 속성이 실제 기본 모수에 의존하기 때문에 이러한 분포에 대한 "정확한"방법은 없습니다.

이러한 무능력을 인정하면서, 가능성 접근법에 의해 다른 종류의 예측 (및 추론 및 추정)이 발생했다.

우도 기반 추론

많은 현대 통계 개념과 마찬가지로 가능성 기반 접근 방식은 Ronald Fisher로 거슬러 올라갑니다. 이 학교의 기본 아이디어는 특별한 경우를 제외하고 통계적 추론이 정규 분포 (모수 추정치가 직교하는 ) 로부터의 추론을 처리 할 때보 다 논리적으로 약한 근거에 있으며 정확한 확률 진술을 할 수 있다는 것입니다. 이러한 추론 관점에서, 정확한 경우를 제외하고는 확률에 대한 진술을 실제로 피해야하며, 그렇지 않으면 가능성에 대해 진술하고 정확한 오류 확률을 알지 못한다는 것을 인정해야합니다 (자주 주의적 의미).

따라서 우리는 가능성을 베이지안 확률과 유사하지만 통합 요구 사항이나 잦은 확률과의 혼동이없는 것으로 볼 수 있습니다. 해석은 전적으로 주관적이지만 단일 모수 추론에는 0.15의 가능성 비율이 권장되는 경우가 많습니다.

그러나 "가능성 간격"을 명시 적으로 제공하는 논문은 종종 보지 못합니다. 왜? 우리는 모두 확률 기반 신뢰 진술에 익숙해 짐에 따라 이것은 사회학의 문제인 것으로 보인다. 대신, 당신이 자주 보는 것은 그러한 것들의 "대략적인"또는 "점근 적"신뢰 구간을 언급하는 저자입니다. 이 구간은 대부분 우도 방법에서 파생되며, 여기서 우리는 표본 평균의 점근 정규성에 의존하는 것과 거의 같은 방식으로 우도 비율의 점근 카이 제곱 분포에 의존합니다.

이 "수정"을 사용하면 베이지안과 거의 동일한 논리적 일관성을 가진 "대략"95 % 신뢰 영역을 구성 할 수 있습니다.

Likelihood Framework의 CI에서 PI로

위의 우도 접근 방식의 성공과 용이성은이를 예측으로 확장하는 방법에 대한 아이디어로 이어졌습니다. 이것에 대한 아주 좋은 설문 조사 기사가 여기 에 제공 됩니다 (나는 그 우수한 범위를 재현하지 않을 것입니다). 1970 년대 후반 ( JSTOR 참조 ) 데이비드 힝 클리 (David Hinkley)에게이 용어를 만들어 냈습니다. 그는 이것을 다년생 " Pearson 's Binomial Prediction Problem "에 적용했습니다 . 기본 논리를 요약하겠습니다.

와이와이와이

예측 가능성을 얻기 위해 "불량"매개 변수를 제거하는 기본 규칙은 다음과 같습니다.

  1. μ,σ
  2. 매개 변수가 임의 인 경우 (예 : 관찰되지 않은 다른 데이터 또는 "임의 효과"), Bayesian 접근 방식과 같이 매개 변수를 통합 합니다.

고정 매개 변수와 무작위 매개 변수의 구별은 우도 추론에 고유하지만 혼합 효과 모델과 연결되어있어 베이지안, 빈번한, 우도 프레임 워크가 충돌하는 것 같습니다.

이것이 "베이지 아가 아닌"예측의 넓은 영역 (그리고 그 문제에 대한 추론)에 관한 귀하의 질문에 대한 답변이 되었기를 바랍니다. 하이퍼 링크가 변경 될 수 있기 때문에 필자는 가능성과 베이지안 대 잦은주의에 대한 상당한 인식 론적 문제를 포함하여 현대적인 가능성 프레임 워크를 심도있게 다루는 "모든 가능성 : 통계 모델링 및 가능성을 사용한 추론"책에 대한 플러그를 작성합니다. 추론과 예측.


참고 문헌

  1. 예측 간격 : 비모수 적 방법 . 위키 백과. 2015 년 9 월 13 일에 액세스 함.
  2. Bjornstad, Jan F. 예측 가능성 : 검토. 통계 학자. 공상 과학 5 (1990), no. 2, 242--254. doi : 10.1214 / ss / 1177012175. http://projecteuclid.org/euclid.ss/1177012175 .
  3. 데이비드 힝 클리 예측 가능성 . 통계의 Annals Vol. 7, No. 4 (1979 년 7 월), pp. 718-728 발행자 : Institute of Mathematical Statistics 안정 URL : http://www.jstor.org/stable/2958920
  4. 유디 파 위탄. 모든 가능성 : 통계적 모델링 및 가능성을 사용한 추론. 옥스포드 대학 출판사; 1 판 (2001 년 8 월 30 일). ISBN-10 : 0198507658, ISBN-13 : 978-0198507659. 특히 챕터 5.5-5.9, 10, 16.

5

나는 "모수 추정치의 불확실성을 고려한 예측 적 추론을위한 비 베이지 법은 무엇인가?"라는 질문에 대한 답을 구체적으로 다룰 것입니다. 나는 불확실성 의 의미를 확장시키는 것에 대한 나의 대답을 조직 할 것이다 .

통계 분석이 예측을 포함하여 다양한 종류의 클레임을 지원할 수 있기를 바랍니다 . 그러나 우리는 우리의 주장에 대해 여전히 불확실하며, 이러한 불확실성은 많은 출처에서 발생합니다. 빈번한 통계는 특징적 으로 샘플링 에서 발생하는 우리의 불확실성 부분만을 다루는 것이 특징 입니다. 역사적으로 빈번한 통계의 발전에 많은 자극을 제공 한 농업 현장 실험에서 샘플링이 불확실성의 주요 원인이었던 것 같습니다. 그러나 현재 가장 중요한 많은 응용 분야에서는 그렇지 않습니다. 우리는 이제 모델의 잘못된 사양과 다양한 형태의 편향과 같은 모든 종류의 다른 불확실성에 대해 걱정하고있다.

Sander Greenland는 이러한 다른 불확실성 원인을 고려하는 것이 얼마나 중요한지를 지적하고 이를 달성하기위한 수단으로 다중 바이어스 분석 을 규정하는 훌륭한 토론 논문 [2]을 가지고 있습니다 . 그는 이론을 완전히 베이지안 용어로 발전 시켰습니다. 모형 모수에 대한 불확실성의 공식적이고 일관된 처리를 수행하기를 원한다면, 모수에 대해 (주관적인) 확률 분포를 자연스럽게 유도한다. 이 시점에서 당신은 베이지안 악마에게 길을 잃었거나 (당신의 종교에 따라) 베이지안 천국에 들어갔습니다.

이것이 "베이지안이 아닌 방법"으로 수행 될 수 있는지에 대한 질문 @Scortchi는 베이지안 해결 방법이 [3]에 설명되어 있습니다. 그러나 베이지안에 대해 귀하의 질문을 충분히 알고있는 사람이라면 누구나 '교활한'방식으로 베이지안 계산을 구현하려는 시도처럼 보일 것입니다. 실제로 저자가 인정한대로 (4 페이지 참조) 책 끝을 향한 고급 방법에 가까울수록 질문에 설명 된 통합과 같은 방법이 더 많이 나타납니다. 그들은 베이지 안에서 떠나는 곳은 궁극적으로 그것들을 추정하기 전에 그들의 매개 변수에 대해 명시적인 우선 순위를 정하지 않는 것이라고 제안합니다.

θ(α)αθ

  1. Chavalarias, David 및 John PA Ioannidis. "과학 매핑 분석은 생물 의학 연구에서 235 개의 바이아 제를 특징으로합니다."Journal of Clinical Epidemiology 63, no. 11 (2010 년 11 월) : 1205–15. doi : 10.1016 / j.jclinepi.2009.12.011.

  2. 그린란드, 샌더 “관측 데이터 분석을위한 다중 바이어스 모델링 (토론).”왕 통계 학회 저널 : 시리즈 A (사회 통계) 168, no. 2 (2005 년 3 월) : 267–306. doi : 10.1111 / j.1467-985X.2004.00349.x.

  3. 래쉬, 티모시 엘, 매튜 피 폭스, 알리자 케이 핑크 역학적 데이터에 정량적 바이어스 분석 적용. 생물학 및 건강 통계. 뉴욕, 뉴욕 : Springer New York, 2009. http://link.springer.com/10.1007/978-0-387-87959-8 .


2
감사! 매우 흥미로운 것 같지만 예측 추론에서 다중 / 정량 바이어스 분석을 사용하는 방법에 대한 간단한 개요를 추가 할 수 있다면 유용 할 것입니다.
Scortchi-Monica Monica 복원

예측과 의 연결을 명확 하게하기 위해 단락을 추가했습니다 . 설명을 요청 해 주셔서 감사합니다. @Scortchi.
David C. Norris
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.