사이트에서 신뢰 구간과 예측 구간의 해석에 관한 많은 훌륭한 토론을 읽었지만 한 가지 개념은 여전히 약간 수수께끼입니다.
OLS 프레임 워크를 고려하고 우리는 피팅 모델 획득 한 Y = X β를 . 우리는 x *를 받았으며 그 반응을 예측하도록 요청 받았다. 우리는 계산 X * T의 β를 보너스로, 우리는 또한 우리의 예측 주위에 95 % 예측 간격을 제공하고, 라 선형 모델의 예측 한계에 대한 수식을 획득 . 이 예측 구간 PI를 호출합니다.
이제 다음 중 PI에 대한 올바른 해석은 무엇입니까?
- 들면 특히, Y ( X * ) 는 95 %의 확률로 PI 내에 놓여있다.
- 많은 수의 가 주어지면 PI 계산 절차에서 95 %의 실제 응답을 다룰 것입니다.
선형 회귀 예측 간격 에서 @gung의 문구에서 , 전자가 사실 인 것처럼 보입니다 (오해가 잘 해석 될 수는 있지만). 그것이 올바른 만약 우리가하고 때문입니다 예측 a의 실현 확률 변수의 대 추정 매개 변수를 ?
(질문) 보너스 질문 : 우리가 진정한 가 무엇인지 , 즉 데이터를 생성하는 과정 을 알고 있다고 가정 하면, 우리는 단지 ϵ ?
이것에 대한 나의 마지막 시도 : 우리는 예측 간격을 두 부분으로 "개념적으로 분해"(단어를 매우 느슨하게 사용) 할 수 있습니다. 오차항의 범위. (B) 실제 예측 평균을 아는 조건에 대해 확률 론적 진술을 할 수 있지만, 전체적으로 예측 간격을 예측 값 주변의 빈번한 CI로만 처리 할 수 있습니다. 이것이 다소 맞습니까?