선형 회귀 분석에서 다음과 같은 가정을합니다.
예측 변수의 각 값 집합에서 반응의 평균
는 예측 변수의 선형 함수입니다.E(Yi)(x1i,x2i,…)
오류 εi 는 독립적입니다.
예측 변수의 각 값 세트 (x_ {1i}, x_ {2i},…) 에서 오류 ε_i 는 정규 분포입니다.εi(x1i,x2i,…)
오류, εi 예측기 값들의 각 세트에서, (x1i,x2i,…) , 같음 (편차를 나타내고있다 σ2 ).
선형 회귀를 풀 수있는 방법 중 하나는 정규 방정식을 사용하는 것입니다.
θ=(XTX)−1XTY
수학적인 관점에서, 위의 방정식은 X ^ TX 만 XTX뒤집을 수 있으면됩니다. 그렇다면 왜 이러한 가정이 필요합니까? 나는 몇몇 동료들에게 물었고 좋은 결과를 얻는 것이고 정상적인 방정식은 그것을 달성하는 알고리즘이라고 언급했다. 그러나이 경우 이러한 가정이 어떻게 도움이됩니까? 그것들을 유지하는 것이 더 나은 모델을 얻는 데 어떻게 도움이됩니까?