@whuber는 세 가지 좋은 답변을 지적했지만 여전히 가치있는 것을 쓸 수 있습니다. 내가 이해하는 당신의 명백한 질문은 다음과 같습니다.
내 피팅 주어 Y I = m X I + By^i=m^xi+b^ (통지 I '는 모자'첨가) , 내 잔류 정상적으로 분산되었다고 가정 아직 같은 것을 예측할 수있다, 관측 응답 Y N 개의 E w 공지 된 예측 값으로, X N E가 승 , 간격 내에있는 것 ( 예 - σ E , Y +의 σN(0,σ^2e)ynewxnew , 확률 68 %?(y^−σe,y^+σe)
직관적으로 대답은 '예'인 것처럼 보이지만 실제 대답은 아마도 입니다. 이는 매개 변수 (즉, & σ )가 알려져 있고 오류가없는 경우입니다. 이러한 매개 변수를 추정 했으므로 불확실성을 고려해야합니다. m,b,σ
먼저 잔차의 표준 편차에 대해 생각해 봅시다. 이는 데이터에서 추정되므로 추정치에 약간의 오차가있을 수 있습니다. 결과적으로 예측 구간을 구성하는 데 사용해야하는 분포 는 정규 값이 아닌 이어야합니다 . 그러나, t 는 정상으로 빠르게 수렴하기 때문에 실제로는 문제가되지 않습니다. tdf errort
그래서, 우리는 그냥 사용할 수 있습니다 Y 새로운 ± t ( 1 - α / 2 , DF 오류 ) 의 대신 y를 새로운 ± Z ( 1 - α / 2 ) 들 , 그리고 우리의 메리 방법에 대해 가지? 불행하게도. 더 큰 문제는 귀하의 추정에 의한 불확실성에 그 위치에있는 응답의 조건부 평균의 당신의 추정에 대한 불확실성이 있다는 것이다 해요 & B를 . 그러므로,y^new±t(1−α/2, df error)sy^new±z(1−α/2)sm^b^당신의 예측의 표준 편차는보다 더 통합 할 필요가 serror . 왜냐하면 분산 부가 상기 예측의 추정 분산이있을 것이다 :
공지 그 " X "새에 대한 특정 값을 나타내는 첨자 " s 2 "는 상응하는 아래 첨자이다. 즉, 예측 간격은 x를 따라 새 관측치의 위치에 따라 결정됩니다.
s2predictions(new)=s2error+Var(m^xnew+b^)
xs2x중심선. 예측의 표준 편차는 다음 공식으로보다 편리하게 추정 할 수 있습니다.
흥미로운 부수적으로이 방정식에서 예측 구간에 대한 몇 가지 사실을 유추 할 수 있습니다. 우선, 예측 구간은 우리가 (이하에서 불확실성이 있기 때문에 이것이 예측 모델을 구축 할 때 우리가 가진 데이터보다 좁은 것
m&
B에). 둘째,세 번째 항에 대한 분자는
0이기 때문에 모형을 개발하는 데 사용한
x값의 평균으로 예측하면 가장 정확합니다. 그 이유는 정상적인 상황에서
x의 평균에서 추정 기울기에 대한 불확실성이 없기 때문입니다.
spredictions(new)=s2error(1+1N+(xnew−x¯)2∑(xi−x¯)2)−−−−−−−−−−−−−−−−−−−−−−−−√
m^b^x0x회귀선의 실제 수직 위치에 대한 약간의 불확실성. 따라서 예측 모델을 구축하기 위해 배워야 할 교훈은 다음과 같습니다. '의미'를 찾는 것이 아니라 미래 예측의 정확성을 개선하는 데 더 많은 데이터가 도움이됩니다. 그리고 미래에 예측을해야하는 간격 (분자를 최소화하기 위해)에 데이터 수집 노력을 집중시켜야하지만 가능한 한 그 중심으로부터 관측 값을 넓게 분산 시키십시오 (분모를 최대화하기 위해).
이러한 방식으로 올바른 값을 계산 한 후 위에서 언급 한대로 적절한 분포 와 함께 사용할 수 있습니다 . t