답변:
실제로 선형 회귀는 결과의 조건부 예상 값을 모델링합니다. 즉 , 예측 변수 X의 값이 주어지면 회귀 모수의 실제 값 (예 : 및 ) 을 알고 있으면 방정식 집니다. 대해 주어진 값을 갖는 모든 (가능한) 관측치에 대해 에 대한 예상 값을 계산하십시오 .β 1 E [ Y | X ] = β 0 + β 1 X Y X
그러나 주어진 값에 대한 단일 값 이 (조건부) 평균과 정확히 동일하다고 기대하지는 않습니다 . 모델이 잘못되어있는 것이 아니라 설명하지 않은 일부 효과 (예 : 측정 오류)가 있기 때문입니다. 따라서 주어진 값에 대한 이 값 은 평균 값 주위에서 변동합니다 (즉, 기하학적 : 해당 의 회귀선 점 주위 ).X Y X X
정규성 가정은, 지금의 차이가 있다고 말한다 의과 일치 평균 0 인 정규 분포를 따른다. 만약이 경우 수단, 값을, 다음 샘플 수 제 계산함으로써 값 (즉 다시 다음 샘플링 회귀 직선 위의 점) 것과 정규 분포 및 추가 : E [ Y | X ] X Y β 0 + β 1 X E [ Y | X ] ϵ Y ' = E [ Y | X ] + ϵ
한마디로 :이 정규 분포는 모형에서 설명한 변동성 위에 결과의 변동성을 나타냅니다 .
참고 : 대부분의 데이터 세트에는 특정 대해 여러 개의 값이 없지만 (예측 세트가 범주 형이 아닌 한)이 정규성은 데이터 세트의 관측치뿐만 아니라 전체 모집단에 적용됩니다.X
참고 : 선형 회귀에 대한 추론을 하나의 예측 변수로 수행했지만 위와 같이 "line"을 "hyperplane"으로 바꾸십시오.
그것은 많은 것을 의미하거나 아무것도 의미하지 않을 수 있습니다. 가장 높은 R- 제곱을 얻기 위해 모형을 적합하면 어리 석었을 수 있습니다. 변수가 필요하고 필요하다는 점에서 모델이 적합하고 특이 치를 식별하는 경우 훌륭한 작업을 수행 한 것입니다. http://www.autobox.com/cms/index.php?option=com_content&view=article&id=175 에 대한 자세한 내용은 여기를 참조 하십시오.
잔차의 정규성은 선형 모형을 실행하는 것으로 가정합니다. 따라서 잔차가 정상이면 가정이 유효하고 모형 유추 (신뢰 구간, 모형 예측)도 유효해야 함을 의미합니다. 그렇게 간단합니다!