당신은 당신의 두 번째 공식에 난을 suscripted 추가해야합니다
때문에 요구에 따라 변화 할 수 있도록 .
Y , X 난
yi∼N(y^i,σ2ε)
y^xi
주목 한 바, ? 그것은이다 . 이것은 @DikranMarsupial이 제시하는 공식으로 이어집니다 :
이것이 첫 번째와 정확히 동일하다는 것을 인식 할 가치가 있습니다. 정규 분포를 규정하고 예상 값이 동일하기 때문에 공식화. 즉 :
(분산은 분명히 같습니다.) 즉, 이것은y^i 예 I ~ N ( X 나 β , σ 2 ε ) E [ X 난xiβ^
yi∼N(xiβ^,σ2ε)
E[xiβ^]=E[xiβ^+E[N(0,σ2ε)]]=E[xiβ^+0]=E[xiβ^]
하지 가정의 차이, 단순히 기술상의 차이.
문제는 첫 번째 공식을 사용하여 아이디어를 제시하는 것을 선호하는 이유가 있습니까?
두 가지 이유로 대답이 ' 예' 라고 생각합니다 .
- 원시 데이터를 정규적으로 배포해야하는지 (예 : ) 또는 에 대한 조건부 데이터 가 오류를 으로 배포해야하는지 (예 : / ) 혼동하는 경우가 종종 있습니다. : 잔차가 정규 분포를 따르지만 y는 분포하지 않으면 어떻게됩니까?YXY|Xε
- 사람들은 종종 독립적 인 것으로 여겨지는 것, 원시 데이터 또는 오류를 혼동합니다. 더욱이, 우리는 종종 무언가가 iid (독립적이고 동일하게 배포 됨) 여야한다는 사실을 언급합니다. 관점에서 생각하는 경우 는 독립적 일 수 있지만 귀무 가설이 유지되지 않는 한 (평균이 다를 수 있기 때문에) 동일하게 분포 될 수 없으므로 혼란의 또 다른 잠재적 원인이 될 수 있습니다 . Y | 엑스Y|XY|X
나는 이러한 혼동이 첫 번째보다 두 번째 공식을 사용했을 가능성이 높다고 생각합니다.