답변:
어쩌면 나는 꺼져 있지만 우리는 에 대해 궁금해야한다고 생각 합니다. 이는 OP를 읽는 방법입니다. 가장 간단한 선형 회귀 분석의 경우 모형이 y = X β + ϵ 인 경우 모형 의 유일한 확률 성분은 오차항 입니다. 따라서 y 의 샘플링 분포를 결정합니다 . 만약 ε ~ N ( 0 , σ 2 I ) 다음 Y | X , β ∼ N ( X β , . 그러나 @Aniko가 말한 것은 확실히 f ( y ) (마지막으로 X , β 이상)에 해당합니다. 따라서 문제는 약간 모호합니다.
짧은 대답은 x 의 분포 와 관계의 강도와 모양에 따라 의 분포에 대해 아무것도 결론을 내릴 수 없다는 것 입니다. 더 공식적으로, y 는 "정규의 혼합"분포를 가지게되는데 실제로는 거의 모든 것이 될 수 있습니다.
다음은이를 설명하기위한 두 가지 극단적 인 예입니다.
실제로, 모든 분포는 법선의 혼합으로 임의로 근사 할 수 있으므로 대한 분포를 얻을 수 있습니다 .
실제 데이터에 가상의 모델을 적용하여 오류 항을 발명합니다. 오차항의 분포는 반응의 분포에 영향을 미치지 않습니다.
우리는 종종 오차가 정규 분포를 따른다고 가정하고 추정 된 잔차가 정규 분포를 갖도록 모형을 구성하려고 시도합니다. 일부 분포에서는 어려울 수 있습니다 . 이 경우 응답 분포가 오류 항에 영향을 준다고 말할 수 있다고 가정합니다.
만약 같은 응답 쓰는 경우 여기서 m 은 "모델"(에 대한 예측이다 Y ) 및 E는 은 "에러"이다,이 재 배열을 나타낼 수있다 Y가 - m = 전자 . 따라서 오차에 대한 분포를 할당하는 것은 모형이 불완전한 방법을 나타내는 것과 같습니다. 다시 말하면 관측 된 반응이 실제로 예측 한 값이 아니라 모델이 예측 한 값이 아닌 이유를 어느 정도 알 수 없다는 것입니다. 모형이 완벽하다는 것을 알고 있다면 오차의 질량이 모두 0 인 확률 분포를 할당합니다. 할당 N을 (
어떤 점에서 오류 분포는 반응보다 모형에 더 밀접하게 연결되어 있습니다. 이것은, 상기 식의 비 식별 가능성으로부터 알 수있는 두 경우를위한 및 E를 알 다음에 임의의 벡터를 가산 m 으로부터이를 감산 전자 의 동일한 값에 이르게 Y , Y = m + E = ( m + b ) + ( e − b ) = m ' + e '. 오차 분포와 모델 방정식의 할당은 기본적으로 어떤 임의의 벡터가 다른 것보다 더 그럴듯하다고 말합니다.