비 Bayesian 예측 추론 (SLR 사례 제외)은 비교적 최근의 분야입니다. "베이지 아가 아닌"이라는 제목 아래에서 우리는 접근 방식을 "고전적인"빈번한 접근 방식과 "우연성"기반의 접근 방식으로 세분화 할 수 있습니다.
고전적 빈번한 예측
아시다시피, 빈번한 "골드 표준"은 반복 샘플링에서 공칭 범위를 달성하는 것입니다. 예를 들어 95 % 신뢰 영역에 동일한 기본 모집단의 표본 중 95 %에 실제 모수가 포함되도록합니다. 또는 평균 및 β 와 같은 가설 검정에서 유형 I 및 II 오류를 저지를 것으로 예상됩니다 . 마지막으로,이 질문과 관련하여 95 % 예측 간격에 다음 샘플 포인트 95 %가 포함될 것으로 예상 합니다.αβ
이제 저는 일반적으로 대부분의 통계 과정에서 고전적인 PI를 제시하고 가르치는 방법에 대해 문제를 겪었습니다. 압도적 인 경향은 이것을 베이지안 후부 예측 간격으로 해석하는 것이기 때문 입니다. 가장 근본적으로, 그들은 다른 확률에 대해 이야기하고 있습니다! Bayesian은 반복적 인 양의 샘플링 성능에 대해 주장하지 않습니다 (그렇지 않으면 빈번하게 사용됩니다). 둘째, 베이지안 PI는 실제로 고전 예측 간격보다 고전 공차 구간과 더 유사한 정신을 달성하고 있습니다.
참조 : 공차 구간 은 두 가지 확률 로 지정해야합니다 . 신뢰와 적용 범위. 자신감은 반복 샘플에서 얼마나 자주 정확한지 알려줍니다. 적용 범위는 실제 분포 하에서 구간 의 최소 확률 측정치 를 알려줍니다 (PI와는 반대로, 반복 된 샘플링 에서 예상 확률 측정 을 제공합니다 ). 이것은 기본적으로 베이지안 PI가 시도하고 있지만 반복 샘플링 주장이없는 것입니다.
따라서 Stats 101 단순 선형 회귀의 기본 논리는 정규성 가정 하에서 PI의 반복 샘플링 특성을 도출하는 것입니다. 일반적으로 "고전적"으로 생각되며 인트로 스탯 수업에서 가르치는 잦은 + 가우시안 접근 방식입니다. 이는 결과 계산의 단순성에 기반합니다 (자세한 개요는 Wikipedia 참조 ).
비 가우시안 확률 분포는 간격을 얻기 위해 깔끔하게 뒤집을 수있는 중추적 양 이 부족할 수 있기 때문에 일반적으로 문제가 됩니다. 따라서 간격의 속성이 실제 기본 모수에 의존하기 때문에 이러한 분포에 대한 "정확한"방법은 없습니다.
이러한 무능력을 인정하면서, 가능성 접근법에 의해 다른 종류의 예측 (및 추론 및 추정)이 발생했다.
우도 기반 추론
많은 현대 통계 개념과 마찬가지로 가능성 기반 접근 방식은 Ronald Fisher로 거슬러 올라갑니다. 이 학교의 기본 아이디어는 특별한 경우를 제외하고 통계적 추론이 정규 분포 (모수 추정치가 직교하는 ) 로부터의 추론을 처리 할 때보 다 논리적으로 약한 근거에 있으며 정확한 확률 진술을 할 수 있다는 것입니다. 이러한 추론 관점에서, 정확한 경우를 제외하고는 확률에 대한 진술을 실제로 피해야하며, 그렇지 않으면 가능성에 대해 진술하고 정확한 오류 확률을 알지 못한다는 것을 인정해야합니다 (자주 주의적 의미).
따라서 우리는 가능성을 베이지안 확률과 유사하지만 통합 요구 사항이나 잦은 확률과의 혼동이없는 것으로 볼 수 있습니다. 해석은 전적으로 주관적이지만 단일 모수 추론에는 0.15의 가능성 비율이 권장되는 경우가 많습니다.
그러나 "가능성 간격"을 명시 적으로 제공하는 논문은 종종 보지 못합니다. 왜? 우리는 모두 확률 기반 신뢰 진술에 익숙해 짐에 따라 이것은 사회학의 문제인 것으로 보인다. 대신, 당신이 자주 보는 것은 그러한 것들의 "대략적인"또는 "점근 적"신뢰 구간을 언급하는 저자입니다. 이 구간은 대부분 우도 방법에서 파생되며, 여기서 우리는 표본 평균의 점근 정규성에 의존하는 것과 거의 같은 방식으로 우도 비율의 점근 카이 제곱 분포에 의존합니다.
이 "수정"을 사용하면 베이지안과 거의 동일한 논리적 일관성을 가진 "대략"95 % 신뢰 영역을 구성 할 수 있습니다.
Likelihood Framework의 CI에서 PI로
위의 우도 접근 방식의 성공과 용이성은이를 예측으로 확장하는 방법에 대한 아이디어로 이어졌습니다. 이것에 대한 아주 좋은 설문 조사 기사가 여기 에 제공 됩니다 (나는 그 우수한 범위를 재현하지 않을 것입니다). 1970 년대 후반 ( JSTOR 참조 ) 데이비드 힝 클리 (David Hinkley)에게이 용어를 만들어 냈습니다. 그는 이것을 다년생 " Pearson 's Binomial Prediction Problem "에 적용했습니다 . 기본 논리를 요약하겠습니다.
와이와이와이
예측 가능성을 얻기 위해 "불량"매개 변수를 제거하는 기본 규칙은 다음과 같습니다.
- μ , σ
- 매개 변수가 임의 인 경우 (예 : 관찰되지 않은 다른 데이터 또는 "임의 효과"), Bayesian 접근 방식과 같이 매개 변수를 통합 합니다.
고정 매개 변수와 무작위 매개 변수의 구별은 우도 추론에 고유하지만 혼합 효과 모델과 연결되어있어 베이지안, 빈번한, 우도 프레임 워크가 충돌하는 것 같습니다.
이것이 "베이지 아가 아닌"예측의 넓은 영역 (그리고 그 문제에 대한 추론)에 관한 귀하의 질문에 대한 답변이 되었기를 바랍니다. 하이퍼 링크가 변경 될 수 있기 때문에 필자는 가능성과 베이지안 대 잦은주의에 대한 상당한 인식 론적 문제를 포함하여 현대적인 가능성 프레임 워크를 심도있게 다루는 "모든 가능성 : 통계 모델링 및 가능성을 사용한 추론"책에 대한 플러그를 작성합니다. 추론과 예측.
참고 문헌
- 예측 간격 : 비모수 적 방법 . 위키 백과. 2015 년 9 월 13 일에 액세스 함.
- Bjornstad, Jan F. 예측 가능성 : 검토. 통계 학자. 공상 과학 5 (1990), no. 2, 242--254. doi : 10.1214 / ss / 1177012175.
http://projecteuclid.org/euclid.ss/1177012175 .
- 데이비드 힝 클리 예측 가능성 . 통계의 Annals Vol. 7, No. 4 (1979 년 7 월), pp. 718-728 발행자 : Institute of Mathematical Statistics 안정 URL : http://www.jstor.org/stable/2958920
- 유디 파 위탄. 모든 가능성 : 통계적 모델링 및 가능성을 사용한 추론. 옥스포드 대학 출판사; 1 판 (2001 년 8 월 30 일). ISBN-10 : 0198507658, ISBN-13 : 978-0198507659. 특히 챕터 5.5-5.9, 10, 16.