데이터 분석 수업에 참석하고 있으며 뿌리 깊은 아이디어가 흔들리고 있습니다. 즉, 오차 (엡실론)와 다른 종류의 분산은 그룹 (표본 또는 전체 모집단)에만 적용됩니다. 이제, 회귀 가정 중 하나는 분산이 "모든 개인에게 동일"하다는 것입니다. 이것은 어떻게 든 나에게 충격이다. 나는 항상 일정한 것으로 가정 된 모든 X 값에 대한 Y의 편차라고 생각했습니다.
나는 회귀를 할 때 모델이 사실이라고 가정하는 교수와 대화를 나 chat습니다. 그리고 나는 그것이 까다로운 부분이라고 생각합니다. 저에게 오류 용어 (epsilon)는 항상 "알지 못하는 요소와 결과 변수에 영향을 줄 수있는 요소, 측정 오류"등을 의미했습니다. 수업이 진행되는 방식에는 "다른 것들"과 같은 것은 없습니다. 우리의 모델은 진실하고 완전하다고 가정합니다. 이는 모든 잔차 변동이 측정 오차의 곱으로 간주되어야한다는 것을 의미합니다 (따라서 개인을 20 번 측정하면 20 명의 개인을 한 번 측정하는 것과 동일한 분산이 생성 될 것으로 예상됩니다).
어딘가에 문제가 있다고 생각합니다. 이것에 대해 전문가 의견을 갖고 싶습니다 ... 개념적으로 말하면 오류 용어가 무엇인지에 대한 해석의 여지가 있습니까?