다항식 회귀의 신뢰 구간 모양을 파악하기가 어렵습니다.
여기서 인공 . 왼쪽 그림은 UPV (비 스케일 예측 분산)를 나타내고 오른쪽 그래프는 신뢰 구간과 X = 1.5, X = 2 및 X = 3에서 측정 된 (인공) 점을 보여줍니다.
기본 데이터의 세부 사항 :
데이터 세트는 3 개의 데이터 포인트 (1.5; 1), (2; 2.5) 및 (3; 2.5)로 구성됩니다.
각각의 포인트는 10 회 "측정"되었고 각각의 측정 값은 속한다 . poynomial 모델의 MLR은 30 개의 결과 포인트에서 수행되었습니다.
신뢰 구간이 수식으로 계산 하였다 및 Y(X0)-tα/2,D(F)(E(R)(R)O, R)√
≤μY| X0≤Y(X0)+tα/2,D(F)(E(R)(R)O, R)√(둘 다 공식은 Myers, Montgomery, Anderson-Cook, "응답 표면 방법론"4 판, 407 및 34 페이지에서 가져옴)
와 σ가 2 = M S E = S S E / ( N - P ) ~ 0.075 .
특히 신뢰 구간의 절대 값에는 관심이 없지만 x ′ 0 ( X ′ X ) − 1 x 0 에만 의존하는 UPV의 모양에 관심이 있습니다. .
우리가 외삽하기 때문에 설계 공간 외부의 매우 높은 예측 분산은 정상입니다.
그러나 왜 분산이 측정점보다 X = 1.5와 X = 2 사이에서 더 작은가?
왜 X = 2 이상의 값에 대해 분산이 더 넓어 지지만 X = 2.3 이후에 감소하여 X = 3에서 측정 된 포인트보다 다시 작아 지는가?
측정 지점에서 분산이 작고 그 사이에서 큰 것이 논리적이지 않습니까?
편집 : 동일한 절차이지만 데이터 포인트 [(1.5; 1), (2.25; 2.5), (3; 2.5)] 및 [(1.5; 1), (2; 2.5), (2.5; 2.2), (3; 2.5)].